第24回LSIデザインコンテスト・イン沖縄  設計仕様書 - 4-3

4-3.学習結果

以下に実際に学習させた後のQ値表を示す.

Table 2 : 学習後のQ値表

Learning result table

表2を参考に,エージェントが行動を選択した場合にたどる道を以下の図3に示す.

Result maze5-5

Fig 3 : エージェントがたどる道

Fig.3を見ると,悪魔のいるマスを通らずにお金が貰える道順を学習していることがわかる.


以下にQ-learningについてまとめたpdfを添付しておく.

pdf file:Q-learning.pdf
<<Back                 Next>>