谢邀。
国内国外大模型的本质区别:
- 国内先搞一波小参数的大模型,PR一定要cover机器之心、新智元、量子位,然后宣城自己的130b模型超越了gpt4,并在自己的榜上发布测评结果,成功超越gpt4。最后一堆商业公司来买130b的模型,这就算是创业成功了,毕竟一套价格不菲,几千万。
- 国外套路可能稍微简单一点,就是想复刻stablediffusion的火热,奈何LLM动辄几十GB的模型还是比较难玩的动,加上没有美女ai图这样的流量密码不太好推广,最终就只剩下openai和inflection以及claude等闭源商业公司这样的寡头。顺带没事喷一喷国内的研究者总是发布达到chatgpt4 106%能力的工作,人家一更换测评数据集就泯然众人矣了。
以上就是当下的一个大模型国际全貌 |