AlphaGo战胜人类围棋冠军已经好几年过去了,这个话题已经不热了,国内介绍这个项目 原理的技术文章也非常多。遗憾的是国内并没有出现几个类似的成功案例,这个问题值得玩味。是不是在实践的路上有很多隐形的关键问题没有公开出来,就算把AlphaGo的源码公开,我们拿过来也做不出一个成功的应用呢?
学以致用,为了做出一个能用的强化学习模型 必须动手实践。自动识别桌面上的棋盘窗口,自动识别棋子布局,然后调用神经网路模型计算最佳走法,自动连线下棋。
https://www.xqcd.top/
1 使用yolo模型识别棋盘棋子
2 使用深度学习算法训练一个中国象棋的AI智能体,对局面打分。
3 识别到的棋盘状态输入给智能体对局面打分,然后用MCTS蒙特卡洛树搜索出最佳走法
4 自动操作电脑鼠标按AI给出的走法自动下棋
5 ONNX模型转换成英伟达显卡加速的TRT模型