如今人工智能蓬勃发展,我预感未来AI游戏将会有广阔空间,于是想验证开发完全从零开始的AI玩家系统,只需要对程序设置奖励规则,并带着它玩一下,就能够自行操作游戏。虽然作为人类玩家可能道德法律上仍有争议,可作为NPC和怪物也是不错的选择。
使用Python+Numpy+cupy或者c++与cuda开发。
深度学习数据流向:
归一化器 —> 卷积池化层 —>展平层 —>全连接层
强化学习部分:
向神经网络输入游戏地图,输出操作,加上随机因子,选择最大系数的操作。如果碰到球,就将动作历史中尾部加入经验池进行学习,折扣系数0.8,奖励扣到0.1以下停止学习。