亲测太强，开源模型Baichuan-13B详细评测！

slipknot · 发表于 2023-8-10 20:13:58|来自：云南

lenapark · 发表于 2023-8-10 20:14:55|来自：云南

这个任务有点菜鸡互啄了，没啥区分度

谭志刚 · 发表于 2023-8-10 20:15:35|来自：云南

但是不同模型能听懂人话的程度还是挺不一样的。其实应该标个groundtruth，不要和股票ret挂钩，就和人的直觉去比

扇公子 · 发表于 2023-8-10 20:16:28|来自：云南

开源模型的好处就是可以自己微调，你微调都不微调就直接用？而且我之前测试70亿参数的模型的时候，回复结果都很好啊，虽然问的是比较大众的问题。而且经过微调的模型，即使问的是小众问题，效果也还是可以的，虽然比联网的 bing chat 效果要差。

坏人 · 发表于 2023-8-10 20:16:34|来自：云南

不能，70亿参数的都不能跑

isyi.com · 发表于 2023-8-10 20:17:24|来自：云南

您说的对。我刚用不久很多还不会。先学习一个

bigboboo · 发表于 2023-8-10 20:18:14|来自：云南

三分类我估计准确率能做很高。但是预测股价这个。。。他能做，能给你一个像模像样的回复，但是回复肯定不准。如果要做准了，需要高质量的数据，你这情况要得到高质量的数据关键在于打标。也就是类似思维链一样的标。要得到这个简直难如登天。

i163 · 发表于 2023-8-10 20:19:14|来自：云南

预测股价这东西从来不需要很准。有个0.05的相关系数就够用了，0.08就封神了。比较也是和gpt同等比较～

wsb000763 · 发表于 2023-8-10 20:19:42|来自：云南

实测差距太大了开源的只有llama2 70b hf版好用[捂脸] 但中文不行

小新技术 · 发表于 2023-8-10 20:20:03|来自：云南

散射不准确，应该是偶极子辐射和角频率四次方成正比，然而网络上答案确实被污染了，自然科学还得拿教材炼。

[网红] 亲测太强，开源模型Baichuan-13B详细评测！