[网红] 亲测太强,开源模型Baichuan-13B详细评测!

[复制链接]
slipknot 发表于 2023-8-10 20:13:58|来自:云南 | 显示全部楼层
广告
lenapark 发表于 2023-8-10 20:14:55|来自:云南 | 显示全部楼层
这个任务有点菜鸡互啄了,没啥区分度
谭志刚 发表于 2023-8-10 20:15:35|来自:云南 | 显示全部楼层
但是不同模型能听懂人话的程度还是挺不一样的。其实应该标个groundtruth,不要和股票ret挂钩,就和人的直觉去比
扇公子 发表于 2023-8-10 20:16:28|来自:云南 | 显示全部楼层
开源模型的好处就是可以自己微调,你微调都不微调就直接用?而且我之前测试70亿参数的模型的时候,回复结果都很好啊,虽然问的是比较大众的问题。而且经过微调的模型,即使问的是小众问题,效果也还是可以的,虽然比联网的 bing chat 效果要差。
坏人 发表于 2023-8-10 20:16:34|来自:云南 | 显示全部楼层
不能,70亿参数的都不能跑
isyi.com 发表于 2023-8-10 20:17:24|来自:云南 | 显示全部楼层
您说的对。我刚用不久很多还不会。先学习一个
bigboboo 发表于 2023-8-10 20:18:14|来自:云南 | 显示全部楼层
三分类我估计准确率能做很高。但是预测股价这个。。。他能做,能给你一个像模像样的回复,但是回复肯定不准。如果要做准了,需要高质量的数据,你这情况要得到高质量的数据关键在于打标。也就是类似思维链一样的标。要得到这个简直难如登天。
i163 发表于 2023-8-10 20:19:14|来自:云南 | 显示全部楼层
预测股价这东西从来不需要很准。有个0.05的相关系数就够用了,0.08就封神了。比较也是和gpt同等比较~
wsb000763 发表于 2023-8-10 20:19:42|来自:云南 | 显示全部楼层
实测差距太大了 开源的只有llama2 70b hf版好用[捂脸] 但中文不行
小新技术 发表于 2023-8-10 20:20:03|来自:云南 | 显示全部楼层
散射不准确,应该是偶极子辐射和角频率四次方成正比,然而网络上答案确实被污染了,自然科学还得拿教材炼。

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则