해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. https://www.youtube.com/watch?v=V1eYniJ0RnkPlaying atari with deep reinforcement learning 이라는 논문이 있다. 강화학습 + 딥러닝으로 아타리의 고전게임을 학습 시킨 것이다.아타리 게임 중에서도 Breakout 이라는 벽돌깨기 게임을 컴퓨터가 플레이 하는 것인데, 위 영상을 보면 단순하게 벽돌을 깨는 것이 아니라 벽돌을 더 빨리 깨는 전략을 쓰기도한다.위 그림은 학습을 간략하게 보여준다. 강화학습의 학습 대상은 agent이다. 사람의 뇌에 해당하는 에이전트는 처음에는 랜덤한 행동을 한다. 랜덤하게 행동하다 ..
해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. 강화학습의 시작은 크게 두 가지로 볼 수 있다. Trial and error , Optimal control Trial and error 는 강화학습의 중요한 특징이다. 이는 동물의 행동에 관한 심리학 연구에서 출발했다.심리학에서 "강화"라는 개념은 상당히 보편적으로 알려져 있는 개념으로 동물이나 인간이 행동 결과에 따라 행동을 변화시키고 발전시킨다는 이론이다.스키너라는 심리학자의 "스키너 상자 실험" 이라는 것이 있다. 굶긴 쥐를 상자에 넣는다. 쥐는 돌아다니다가 우연히 상자 안에 있는 지렛대를 누르게 된다. 지렛대를 누르자 먹이가 나온다. 지렛대를 누르는 행동과 먹이와의 ..
해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. 강화학습이란 무엇인가. 강화 학습(Reinforcement learning)은 기계학습이 다루는 문제 중에서 다음과 같이 기술 되는 것을 다룬다. 어떤 환경을 탐색하는 에이전트가 현재의 상태를 인식하여 어떤 행동을 취한다. 그러면 그 에이전트는 환경으로부터 포상을 얻게 된다. 포상은 양수와 음수 둘 다 가능하다. 강화 학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다. 강화학습은 머신 러닝의 범주 안에 있는 학습 방법 중 하나이다. 예시로 아이가 처음 걸을 때 걷는 방법을 어떻게 행동 할 줄 모르지만, 환경과 상호작..