해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. https://www.youtube.com/watch?v=V1eYniJ0RnkPlaying atari with deep reinforcement learning 이라는 논문이 있다. 강화학습 + 딥러닝으로 아타리의 고전게임을 학습 시킨 것이다.아타리 게임 중에서도 Breakout 이라는 벽돌깨기 게임을 컴퓨터가 플레이 하는 것인데, 위 영상을 보면 단순하게 벽돌을 깨는 것이 아니라 벽돌을 더 빨리 깨는 전략을 쓰기도한다.위 그림은 학습을 간략하게 보여준다. 강화학습의 학습 대상은 agent이다. 사람의 뇌에 해당하는 에이전트는 처음에는 랜덤한 행동을 한다. 랜덤하게 행동하다 ..
해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. 강화학습의 시작은 크게 두 가지로 볼 수 있다. Trial and error , Optimal control Trial and error 는 강화학습의 중요한 특징이다. 이는 동물의 행동에 관한 심리학 연구에서 출발했다.심리학에서 "강화"라는 개념은 상당히 보편적으로 알려져 있는 개념으로 동물이나 인간이 행동 결과에 따라 행동을 변화시키고 발전시킨다는 이론이다.스키너라는 심리학자의 "스키너 상자 실험" 이라는 것이 있다. 굶긴 쥐를 상자에 넣는다. 쥐는 돌아다니다가 우연히 상자 안에 있는 지렛대를 누르게 된다. 지렛대를 누르자 먹이가 나온다. 지렛대를 누르는 행동과 먹이와의 ..
해당 포스팅은 이웅원 연구원님의 깃북 Fundamental of Reinforcement Learning을 기초로 작성되었습니다. 강화학습이란 무엇인가. 강화 학습(Reinforcement learning)은 기계학습이 다루는 문제 중에서 다음과 같이 기술 되는 것을 다룬다. 어떤 환경을 탐색하는 에이전트가 현재의 상태를 인식하여 어떤 행동을 취한다. 그러면 그 에이전트는 환경으로부터 포상을 얻게 된다. 포상은 양수와 음수 둘 다 가능하다. 강화 학습의 알고리즘은 그 에이전트가 앞으로 누적될 포상을 최대화하는 일련의 행동으로 정의되는 정책을 찾는 방법이다. 강화학습은 머신 러닝의 범주 안에 있는 학습 방법 중 하나이다. 예시로 아이가 처음 걸을 때 걷는 방법을 어떻게 행동 할 줄 모르지만, 환경과 상호작..
(해당 내용은 로보티즈 표윤석 연구원님의 ROS 강의 자료를 기초로 작성되었습니다.) 지금까지 개념을 알아봤다. 어떻게 동작하는지 알아보자. 우리는 ROS 기본 패키지인 Gmapping을 사용할 것 이다. OpenSLAM에서 공개한 SLAM의 종류로 ROS에서 패키지를 제공한다. 특징으로 파티클 필터를 사용하며 그리드 맵을 제공한다. Gmapping을 사용하기 위해서는 하드웨어적으로 필요한 것이 있다. X, Y, Theta 속도 이동 명령 주행기록계 (Odometry) 계측 센서: 2차 평면 계측 가능 센서 직사각형 및 원형의 로봇 그렇다면 Gmapping은 ROS에서 어떻게 처리가 되는 것일까. 다이어그램으로 알아보자Gmapping이 동작하기 위해서 총 두가지의 토픽이 필요하다. 1번은 로봇의 센서데이..
(해당 내용은 로보티즈 표윤석 연구원님의 ROS 강의 자료를 기초로 작성되었습니다.) 로봇이 길을 찾기위해서는 어떤 과정이 필요할까? 먼저 사람이 처음 가보는 미지의 장소를 탐색하는 과정을 생각해보자. 우리는 밝은 곳이라면 눈(어두운 곳이라면 손으로 더듬는다) 이라는 센서로 지형, 물체 등을 판단해 앞으로 진행 할 수 없는지를 판단한다. 그리고 진행하면서 봐왔던 지형과 물체를 기억하고 단편적인 지도를 머리 속에 그릴 수 있다. 마지막으로 원하는 목표 지점이 생긴다면 이 지도를 통해서 길을 찾아갈 것이다. 로봇도 같은 과정을 거친다. 머신러닝이 적용된 로봇이 아니라면 기본적으로 우리 눈과 같은 물체를 인식하고 물체와의 거리를 판단하는 센서는 없을 것이다. 하지만 로봇에는 적어도 거리를 판단할 수 있는 훌륭..