site stats
这个确实很厉害,借助LLM(GPT-4)生成奖励函数代码,模拟器执行奖励函数代码,然后将输出结果再交给LLM评估,并提出修改后的奖励代码,一步步迭代,直到机器人学会所需要的技能。让AI替代人类调参员?代码是开源的,可以参考Prompt目录:
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多