谷歌发布开源强化学习框架

PingWest品玩8月28日讯,据VentureBeat报道,强化学习是一种人工智能(AI)技术,它利用奖赏(或惩罚)来驱动代理朝着特定的目标前进。DeepMind就是利用这种学习方式AlphaGo。但是强化学习框架存在一些问题,比如需要花很多时间来掌握一个目标,而且总是不灵活,也不稳定。

针对真个问题,Google提出一个替代方案:基于其机器学习库TensorFlow的开源强化学习框架。该强化学习框架基于灵活性、稳定性和重现性三个基本原则开发,目前已发布在GitHub上。

除了该开源框架外,Google还推出了一个网站,允许开发人员能快速将针对多个代理的培训运行进行可视化。它还提供经过训练的模型、原始统计日志和TensorFlow事件文件,用于与TensorBoard一起绘图,TensorBoard是Google开发的用于TensorFlow程序的可视化工具套件。

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注

此站点使用Akismet来减少垃圾评论。了解我们如何处理您的评论数据