科大讯飞自研星火认知大模型发布，能力如何？有哪些技术亮点？

海默子 · 发表于 2023-11-2 05:21:48|来自：中国

讯飞星火认知大模型现场实测七大核心能力，发布四大行业应用成果 - 知乎

之海 · 发表于 2023-11-2 05:22:27|来自：中国

谢邀，知乎的小伙伴们大家好，作为科大讯飞公关负责人、一名讯飞人，主要参与了讯飞星火大模型从研发到发布的重要历程，感谢大家对于讯飞和星火认知大模型的关注。今年上半年，在ChatGPT为代表产品掀起的浪潮下，国内的AI大模型赛道形成了百花齐放、百家争鸣的局面，4月20日，我们讯飞也正式对外宣布了“星火认知大模型”发布会的消息，目前大家可以在官网（https://xinghuo.xfyun.cn）申请优先体验权益。今天我以一个内部参与者的角色，与大家聊聊这款产品。
讯飞星火认知大模型，是基于深度学习的、以中文为核心的自然语言处理模型，具备在跨领域多任务上类人的理解和生成能力，可实现基于自然对话方式的用户需求理解与任务执行，用一句话来概括就是“只需一个指令便可以懂你所言、答你所问、创你所需、解你所难、学你所教。”
在讯飞有一句话叫“技术顶天，应用立地”，先从技术积累上来看，2011年科大讯飞便承建了语音及语言信息处理国家工程实验室，提出让机器像人一样能听会说，这一次认知大模型本质上是一次对话式的通用智慧的涌现，语音和语言的核心能力是一个基础条件。在国家平台和讯飞超脑计划的支撑下，过去几年讯飞在认知智能领域取得了一系列全球领先的成果。”2017年，科大讯飞承建认知智能国家重点实验室，也就是从这一年起，科大讯飞不仅让机器在全球首次通过了国家职业医师资格考试、超过了96.3%参加考试的医生，并且在SQuAD机器阅读理解中全球首次超过人类平均水平，刚刚过去的2022年在OpenBookQA 科学知识推理中，单模型也超过人类平均水平。可以说多年来科大讯飞已在认知智能领域有了丰富的储备和积累。在算力方面， 2009年我们便开始布局算力基础设施建设，目前已建成4城7中心深度学习计算平台；技术上，讯飞承建了认知智能全国重点实验室，这是2022年国家重点实验室重组后的首批20个国家标杆实验室中唯一一家；人才上，讯飞目前已经拥有超过200人的大模型核心研究团队，其中有数位是《麻省理工科技评论》“35岁以下科技创新35人”榜单中顶尖的科学家。
其次，在应用上，星火认知大模型的整体布局为“1+N”体系。其中，“1”是通用认知智能大模型算法研发及高效训练底座平台，也就是大家获得内测权益后进入的官网界面“SparkDesk”；“N”则是大模型应用于教育、医疗、人机交互、办公等多个行业领域的专用场景。此外我们还会以API形式为企业提供服务，让各类企业可以根据自己的需求个性化开发，实现产品创新。在5月6日的讯飞星火大模型发布会上，科大讯飞董事长刘庆峰也表示，从ChatGPT关注的48个主要任务方向和讯飞开放平台上400多万开发者团队的需求分析，通用人工智能应当具备七大维度能力，包括文本生成、语言理解，知识问答、逻辑推理、数学能力、代码能力、多模态能力等。
那么针对讯飞星火认知大模型支持的以上七大维度的能力，下面为大家展示一些我的体验示例：
一、文本生成：王家卫会怎么描写《我在超市买香皂》？星火的回答“王家味儿”还是很浓的。

二、代码生成：用Python编写九九乘法表

三、公式生成：解释三角函数

四、英文写作及润色：请用英文润色并扩充标题《Value every minute》

五、Others：百科知识、逻辑推理、内容概述等

我还尝试了用“AI克星”——【弱智吧】的一些问题向它发起“灵魂拷问”。

最后，关于驱动大模型对话的重要手段——指令，如何创造一个高质量的指令驱动大模型生成满意的回答；如何结合各行业、各场景的实际需要创造高质量的指令模板；如何推动广大用户对于指令的分享和交流，并打造星火认知大模型的指令集生态，这也是我们将持续、重点探索的一环。
最最后，再次感谢各位小伙伴的关注与阅读，5月6日的讯飞星火大模型发布会也非常成功，有兴趣的同学可以去看看相关报道。

laji · 发表于 2023-11-2 05:22:55|来自：中国

总体来讲，挺好的。模型能力过关，落地产品丰富，涵盖了方方面，发布会差不多讲了有两三个小时吧？甚至配套的硬件已经开售了。
国内目前发布的大模型里，除了清华的 ChatGLM 开源可以自己部署，科大讯飞这个应该是最容易申请的了。十几天之前就可以申请试用了（官方也没邀请我，所以我是自来水，hhh）：
讯飞星火认知大模型科大讯飞星火认知大…今天的发布会上，也给了一个体验地址，一个月内可以体验部分功能：
科大讯飞AI学习机体验中心

这两天比较忙，我就不帮大家做评测了，大家注册自己玩玩就知道效果了。
<hr/>看完今天的发布会，我的一个明显感受是，讯飞、商汤的发布会效果明显好于百度、阿里。
想来，技术、产品、宣发，这些真是不完全等价的。大模型是技术底座，上面可以生长出很多与需求结合的业务产品，最终要在发布会上以良好的效果呈现出来。
百度是第一个吃螃蟹的，目前来看，似乎也真的是给大家探路铺路了。
当然了，发布会的编排、设计本身也是一种能力和付出，是需要非常多的落地产品作支撑，才能让人觉得充实饱满。
也因此，进而我的另一个感受就是，像科大讯飞、商汤这样专注于 AI 的企业，没有包袱，也没有退路，因此他们在全面拥抱大模型的选择上，更加全力以赴，也因而呈现出了和百度、阿里不一样的效果。一个不太恰当的类比，恰恰如同 OpenAI 和谷歌。大公司历史包袱更重，部门掣肘更多。
不过大家发力的方向不一样，百度阿里更侧重于 toB 和云，百花齐放，挺好的。
<hr/>

今天的发布会铺垫了很久，然后推出了 AI 学习机。群里也有不少人在说，弄到最后成带货的了。
我倒觉得挺好的，这恰恰说明，结合需求的应用有落地思路，甚至能直接卖硬件了，再加上会员服务，赢两次！企业还是要挣钱的，研发，销售，挣钱，再投入研发，形成良性的正向循环。
这样一想，科大讯飞其实是有一些积淀的优势的，比如语音、OCR、学习机，这些都是他们过去已有的技术，现在来了大模型，装上了更强的头脑，可能瞬间就会把效果提升到另一个维度。
<hr/>不过话说回来，大模型毕竟有其固有缺陷，如果现在把大模型能力真正落地应用到教育中，还是希望能更重视安全，国外的担忧虽然有一些过分渲染，但合理的部分还是要重点考虑。
比如发布会上的作文评讲功能：

说实话，这个功能，我自己用 GPT API 做过一次，虽然 UI 效果不是这样，但核心意图是一样的。我做出来之后，在想一件事，如果这样的产品真的推开了，学生们以后岂不是反过来在迎合AI的口味了？
当然这可能有些抬杠，毕竟一些老师来改卷，也存在同样抹杀创意，变成八股文的问题。AI 其实是普惠的，其实是以更低的成本服务更多人的，总体来讲肯定还是进步非常多的。不过这并不妨碍我们继续去思考—— AI 在教育应用中，如何提供个性化、有创造力的内容。
<hr/>总之，AI 的浪潮已经不可逆转，就像 Hinton 说的那样，他不做，也有人会做。类似的产品，讯飞不做，别人也会做。一方面感慨于技术进步之快，另一方面，在人与 AI 的相处之道上，我们还有很多很多问题需要思考和解决。

xingke · 发表于 2023-11-2 05:23:22|来自：中国

早早就拿到了邀请码，成功吃到第一手螃蟹，那么现在开始测试。

“星火认知大模型”是纯文本模型，输入和输出内容全是文本，与ChatGPT和ChatGLM模型一致，与GPT4和文心一言不同。可以接受语音输入，其实是ASR功能将语音转到对话框中，本质发送的还是文本内容。生成的文本内容可以输出语音，其实是通过TTS来实现，这也是讯飞的特点吧。
发布会上测试的内容还是挺全面的。之前内测过智谱的“ChatGLM-130B”和阿里的“通义千问”，以相同的问题来测试一下讯飞的“星火”吧。
先来一道写代码的题目，问：“我现在有张excel表，表头如下：世界排名、学校名称、地区、综合得分，写一个代码将学校名称后面加“*”并打印出结果。”

生成代码正确，成功将“学校名称”一列内容加“*”，效果很理想。
接下来测试一下“国粹”，
问：“以“拣尽寒枝不肯栖”为题写一首以“念奴娇”为词牌名的宋词”

再问：“以“报效国家”为藏头字，“闺怨思乡”为主题写一首七言绝句”

模型并没有理解藏头诗的含义，在国粹上还有待提高。欢迎大家贴出测试国粹方面的结果。
再问：“历史上有没有一听就让人落泪的话？”

与其他大模型一样，仍然存在一些事实性错误。

问问金庸小说的内容，生成内容一开始挺好的，后面还是有事实性错误，虽然用于承认错误，但并没有改对。

角色扮演的效果也还很好的，可以按照角色，解决实际问题，问：“你是一个海康威视门禁系统故障的工程师，请帮我处理摄像机网路不通的问题”

再问问我公司是做什么的吧，看来我司确实没啥名气。。。

让它扮演文心一言模型的时候，还是很抗拒的，并没有成功对它洗脑。

后续测试将持续更新~~

xinlaide · 发表于 2023-11-2 05:23:47|来自：中国

自从ChatGPT横空出世以来，其余大大小小的LLM模型便层出不穷。
从去年年末的ChatGPT，后续升级版的GPT-4，以及谷歌、百度、阿里和知乎的图海AI等，大语言模型的繁荣时代到来了。[1]

今年注定是LLM大放异彩的一年，更宽泛的说，最近几年注定是生成式AI（AIGC）大放光芒的一段岁月。

今天，又一个新的模型开放使用，感谢 @知乎科技，提前拿到了科大讯飞星火认知模型的内测资格。
其实关于大模型的测试内容，之前以及做过很多了，数学计算，代码生成，文字润色和资料查询等。
而这些内容，发布会上也都展示过了，所以并不想做过多的篇幅来分析，这里略作展示。
生成故事方面，依旧欠缺分辨真实与否的能力，这个似乎大部分模型都一样，还没有做的非常好的。

生成代码能力

代码分析能力：

分析的也不错，但比起GPT-4起来，分析粒度还是粗一些，但基本持平或者优于其它LLM。
此外，上述生成文本过程中，第一个感受到的优势就是生成速度非常之快，不同于ChatGPT一个个吐字的缓慢过程，星火主要是在嗖嗖的生成（逃
很符合星火这个名字的特点（shide
其次，还有两个特点
第一、星火发布会上将自己的优势侧重在教育领域，如作文的评阅与修改，包括字词，语法方面。英语文章的语法和单词使用也可以做到润色修改。科大讯飞主要将自己的OCR+LLM技术结合在一起来实现。

第二、科大讯飞的另外一个优势在于它的语音识别和翻译能力，科大讯飞拥有最好的语音识别翻译技术，Speech-to-Text + LLM，来进行英语对话，练习语法对话能力，确实蛮好的。

如果你觉得ChatGPT一个个蹦字实在有点折磨，不妨来试试星火模型。
就目前的短暂使用而言，体验感蛮好的，唯一遗憾的可能就是不支持多模态输出，没法儿提供图像出来玩。

zknet · 发表于 2023-11-2 05:24:24|来自：中国

科大讯飞自研星火认知大模型发布是本人体验过的，最好的中文语言大模型了，应该代表着目前国内的顶级水平！！！
简单对话过程中，可以感觉到其语言理解能力很强，反应速度超级快，实时反馈效果超级好。
是一款超出预期的大模型，一定程度上可以作为 ChatGPT 的平替了。
发布会上全部都是直接真机演示，而且我还跟着试了一下，感觉实在太强了。
这是科大讯飞设计的评测模型，包含七个维度可对通用智能大模型进行评测。

上手体验

第一反应肯定是快，比起chatgpt等一个字一个字吐，星火的文本生成速度要快很多倍。
由于反应速度非常快，于是我撩了几下，就下意识地问他为什么这么快？答案是因为其实时地分析意图并生成回复，大概就是我输入的过程中，其已经在想回答了。
这使得其能够更自然地实现直接的实时语音交互，这对于很多场景的落地体验提升，非常重要，比如AI语音助手，学习机，智能座舱等等。

我让他帮我写一个程序？（发布会上承认编程能力还不如chatgpt，但再过几个月会赶上）

让他帮我写一首诗

问他一个相对专业的问题？

让他写一个故事？

让他写一点儿带尺/度的内容。

目前的不足，发布会上也都说了，在英文和编程方面，还不如chatgpt，但再过几个月，就能够赶上。
简单测试了一下英文水平，感觉确实还有待提升，但别的都没啥问题了。

科大讯飞的星火大模型，不像之前发布的很多大模型，大家评价都比较牵强，会觉得迈出了第一步，有比好更重要。
科大讯飞的星火大模型的语言功能，成熟度感觉已经很高了，也非常好用，虽然我没有直接横评和其他的对比，但体验本身是超预期的。
AI学习机

科大讯飞的优势，在于本身其在AI产业落地方面做了很多应用型的产品，比如有很多基于AI的产品，AI语音学习机，AI学习笔等。
这些落地场景的ToC的产品，在接入科大讯飞星火大模型后，可以更好地改变孩子的学习，和人们的生活。
其实很容易预判到，这波AI浪潮将对未来的教育和学习造成冲击，就像之前的阿尔法狗对围棋造成的冲击一样。
过去孩子要学习好，得依靠名师，名校；而未来，那些自我学习能力强的孩子，可以借助AI来学习，越过名师，造就最强的自己！
就像围棋打谱一样，对着AI学就行。

智能座舱

在ChatGPT刚出来的时候，就期待其可以赋能语音助手，给小爱/siri等助手赋能。
从科大讯飞的演示效果来看，现在已经做的很好了。
而且科大讯飞还推出了融合星火大模型的智能座舱交互系统，这将极大提升智能座舱系统的体验。用于导航，对话，智能提醒，孩子娱乐等！！

虚拟人智能交互机

还有科大讯飞推出的虚拟人智能交互机，未来的很多前台和服务人员，或许都不需要了。
这在医院/政务办公/导游等很多地方，都有很广泛的应用场景。

数字员工（辅助搬砖）

还可以直接用于招聘等商业场景，讯飞把之前很多企业只想过，但没做出来的，基本都做出来了，而且从演示效果来看，体验也非常不错。

这智能化的脚本执行功能，也能帮大家解决很多日常办公中的问题，有助于大幅提升效率。

帮助生成表格。

自动数据分析。

自动生成PPT。

未来将赋能更多行业

这已经不是画饼了，有落地经验的科大讯飞，在发布会上展现出来的落地应用能力，要远超之前的很多大模型。（尽管这与其后发制人有关，但确实做的非常好）

以上，后悔上半年杀入大A的时候，没有跟风冲AIGC概念股了，错亿！！！

科大讯飞自研星火认知大模型发布，能力如何？有哪些技术亮点？

快速回帖

关于楼主

最新悬赏

交流分类

常用

技术

区块链

十二星座

十二生肖

专属推荐

问答专家