편집
1,724,599
번
(→바깥 고리: Deep Reinforcement Learning: Pong from Pixels 링크 추가) |
잔글 (봇: 외부 링크 정리) |
||
{{기계 학습}}
'''강화 학습'''(Reinforcement learning)은 [[기계 학습]]이 다루는 문제 의 하나로, 어떤 환경 안에서 정의된 에이전트가 현재의 상태를 인식하여, 선택 가능한 행동들 중 보상을 최대화하는 행동 혹은 행동 순서를 선택하는 방법이다.
== 개요 ==
==
* [http://rlai.cs.ualberta.ca/RLAI/rlai.html 강화학습과 인공지능]
* [http://karpathy.github.io/2016/05/31/rl/ Deep Reinforcement Learning: Pong from Pixels]
|