そろそろまともな評価関数を作成しようと考えてリバーシの評価関数の最適化を読んで最急降下法の実装をしたけど,どこか実装がバグってるのか解が発散して困っていた.
最急降下法の練習にともうちょっと簡単な問題を設定してそれを解いてみようと考えて解いてみた.
問題
区間]を等分するM個の点 を取り,関数を最小化するベクトルを求める.
つまり,sinと多項式の和との差の二乗を最小にする係数を求めることになる.
最急降下法
pdfの式変形に従うと,とすると になって,更新の式はになる.
実際に実装して,取る点の数と多項式の次数を調整してどの程度近似出来るかデータを取ってみた.
縦軸が誤差の値,横軸が次数,各グラフは点を何個取ったか.表示されていないのは結果がNaNになった部分.
次数が8辺りで誤差が改善されなくなっているのと,点の数(学習に使うデータの数)が増えるとNaNに発散しているのがわかる.
オセロの評価関数のために書いた最急降下法の解が発散したのは学習データを用意しすぎたのが原因なのかな.
実装したコード
github.com
追記
学習率をデータの個数で割って正規化してやらないとダメで,その処理が抜けてました.