| Japanese | English |
第24回LSIデザインコンテスト・イン沖縄 設計仕様書 - 4-3
4-3.学習結果
以下に実際に学習させた後のQ値表を示す.
Table 2 : 学習後のQ値表
表2を参考に,エージェントが行動を選択した場合にたどる道を以下の図3に示す.
Fig 3 : エージェントがたどる道
Fig.3を見ると,悪魔のいるマスを通らずにお金が貰える道順を学習していることがわかる.
以下にQ-learningについてまとめたpdfを添付しておく.
pdf file:Q-learning.pdf
Copyright (C) 2020-2021 LSI Design Contest. All Rights Reserved.