site stats
昨天尝试微调了一下4o-mini,总结如下:- 训练成本还是有点高了,$3/M - 简单试了一下,共消耗了19M token,减去2M 免费额度,计费17M token,$50;不太敢敞开了调超参数...- Max step 判定有bug,看规划需要118个step,但是一直训练到186 步才结束,导致overfit了;-
发布时间:
1
数据加载中
Markdown支持
评论加载中...
您可能感兴趣的: 更多