반응형
Notice
Recent Posts
Recent Comments
Link
목록Upper Confidence Bound1 (1)
안 쓰던 블로그
다중 슬롯머신 문제 (Multi-Amred Bandits, MAB) with UCB1(Upper Confidence Bound1)
이전 글: 다중 슬롯머신 문제 with Epsilon-Greedy https://foxtrotin.tistory.com/501 다중 슬롯머신 문제 (Multi-Amred Bandits, MAB) with Epsilon-Greedy 다중 슬롯머신 문제 (Multi-Amred Bandits, MAB) 여러 개의 팔을 가진 슬롯머신이 있다. 슬롯머신의 팔마다 코인이 나오는 확률은 정해져 있지만, 확률값은 미리 알 수 없다. 제한된 횟수 안에서 가장 많 foxtrotin.tistory.com 다중 슬롯머신 문제란, 어떤 슬롯머신의 팔을 당겨야 가장 많은 돈을 벌 것인지에 대해 찾는 문제이다. 문제 해결을 위해서는 탐색과 이용의 균형을 적절하게 맞추는 것이 중요하다. 이전 글에서는 입실론 그리디 방법을 사용해 보..
머신러닝/머신러닝
2021. 6. 24. 18:50