dynamic programming
-
Dynamic Programming의 ConceptTech/Algorithms 2011. 6. 26. 15:56
Dynamic Programming은 자주 사용되는 기법으로 그 Concept을 아주 간략하게 설명하면, Optimal solution을 찾는 Problem에서 이를 Sub-problem으로 잘게 나누어 각각의 Optimal Solution을 구한 후, 이를 합쳐 최종적으로 Optimal Solution을 구하는 방법이다. 예를 들어보면, 간단하다. Find the shortest route : u -> v 이 문제를 Sub-problem인 u -> w (p1) 와 w -> v (p2) 로 나눈다. 그리고 u->w와 w->v 각각의 optimal solution을 찾은 후, 이를 합치면 최종적인 optimal solution이 된다. + 그런데, 만약에 문제가 살짝 바뀌어서 이렇게 되면 어떻게 될까? F..
-
Reinforcement Learning에서 사용되는 Learning MethodsTech/Algorithms 2011. 6. 25. 18:12
Reinforcement Learning에서 State Value 등을 계산하고자 할 때 사용되는 Learning Methods 등에는 크게 3가지 방법이 사용되고 있다. 3 algorithms are used in reinforcement learning to predict a measure of the total amount of reward expected over the future. Dynmaic Programming Monte-Carlo Temporal Difference Learning Reinforcement Learning 관련 강의 자료를 보다가, 이 3가지의 Learning method에 대해 가장 직관적으로 나타내는 그림이 있어 첨부해보았다. Reinforcement Learning..