2014-08-24から1日間の記事一覧

やってみよう分析!Rで強化学習(Q-learning, ε-greedy行動選択)

やってみよう分析!おまけ 2 - 1: Excel VBAで強化学習(Q-learning, ε-greedy / softmax 行動選択) のR実装版。強化学習自体の解説は上の記事読んどいたらいい。めんどいのでとりあえずε-greedyのみやった。計算結果は > Qlearning() [,1] [,2] [1,] 5 20.0…