前言
这个想法其实已经在脑海里酝酿很久了,但是今天决定开个博客记录一下整个思考的过程,不然额也不知道会拖到什么时候才去做这个。
想做这个 tiny project 主要原因是我觉得我强化学习学的依托史,只是在表面肤浅地学习一些概念和算法,然后假模假样地看看代码,就当是学过了,实际完全没有实践过。
本来想做强化学习麻将的,但是调研了一下,发现可供参考的资料太少了,于是还是从兼具趣味性与教学性的《超级马里奥》入手,开始探索一下如何真正将强化学习应用在实践中。
本项目期望目标如下:
- 采用 DQN/PPO 算法,搭建马里奥强化学习框架(环境采用 gym 提供的 super-mario-bros)
- 搭建或部署训练过程的可视化工具(这样直观 也具有趣味性)
- 最终目标是让我们训出来的AI马里奥可以通关游戏!
先占个坑,感兴趣欢迎在评论区催更。