site stats
去年 Jim Fan 对于 Q* 的预测,现在结合刚发布的 o1 来看基本上都是准确的!Jim 将 Q* 和 AlphaGo 做了类比,猜测 Q* 可能类似于 AlphaGo,是通过与自己之前的版本进行对弈,自我对弈不断进步,甚至于架构都是类似的。AlphaGo 的架构核心有四个组件:1. 策略神经网络(Policy
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多