設計仕様書

第24回LSIデザインコンテスト・イン沖縄設計仕様書 - 4-3

以下に実際に学習させた後のQ値表を示す．

Table 2 : 学習後のQ値表

表２を参考に，エージェントが行動を選択した場合にたどる道を以下の図３に示す．

Fig 3 : エージェントがたどる道

Fig.3を見ると，悪魔のいるマスを通らずにお金が貰える道順を学習していることがわかる．

以下にQ-learningについてまとめたpdfを添付しておく．

pdf file：Q-learning.pdf

<<Back Next>>