keras-rl

케라스(Keras) 기반의 강화학습 라이브러리인 keras-rl이 깃허브에 올라왔습니다. 케라스 기반으로 하고 있으므로 당연히 씨아노(Theano)와 텐서플로우(TensorFlow)를 백엔드로 선택하여 사용할 수 있습니다. keras-rl은 OpenAI Gym을 이용하여 강화학습 모델을 테스트할 수 있도록 되어 있습니다. 현재 구현되어 있는 강화학습 알고리즘은 아래와 같습니다.

  • Deep Q Learning (DQN) [1], [2]
  • Double DQN [3]
  • Deep Deterministic Policy Gradient (DDPG) [4]
  • Continuous DQN (CDQN or NAF) [6]

현재 작업 중으로 곧 추가될 알고리즘도 있습니다.

  • Asynchronous Advantage Actor-Critic (A3C) [5]

댓글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중