中国有几家搞语音识别的公司？

lihanyue · 发表于 2023-10-17 18:58:56|来自：中国

中国有几家搞语音识别的公司，除了科大讯飞

pincai · 发表于 2023-10-17 18:59:48|来自：中国

借用同行的一条回答，很好的能回答此问题，想要了解中国有几家搞语音识别的公司等问题的答案基本上没法准确的回答你，因为做该行业的公司较多，另外高手在民间，好用的语音识别产品也怕“巷子深”。即便有人回答你了也别信，因为每个人都要推广自己的品牌和产品，所以要有自己主观的思考，这里推荐DuDuTalk（嘟嘟拓客）语音识别，以及解决方案：
今天小编教你如何识别好的语音技术企业，他一定满足以下几个痛点：
1. 可以快速识别客户；
从全场景线上线下沟通聊天中自动抽取客户特征和业务需求，告别人工填报，减少主管判误。智能分析，帮助销售精准理解客户真实意图；
2. 掌握市场动态变化；
基于深度学习的语义理解、预测算法等能力，对关键词热点、竞品信息进行分析，及时发现业务热点，精品热度趋势等市场讯息；
3. 开启精准沟通；
基于精准市场洞察，指定及调整销售策略。让您用最合适的话术沟通，在最合适的时间沟通，用最正确的正式沟通。成功解决客户异议，快速成单。
随着社会的快速发展和国际合作交流的日益增多，传统的、仅支持单一中文或英文文本的语音识别技术越来越难以满足市场和客户的需要，而类似嘟嘟拓客产品的为销售赋能的SaaS产品已成为市场发展的必然选择。嘟嘟拓客语音技术推出的新一代语音合成模块具有更为强大的功能，语音识别技术效果更加清晰、自然与准确，还能正确的识别和处理特殊符号、多音字。

chenyumai · 发表于 2023-10-17 19:00:46|来自：中国

语音识别技术，也被称为自动语音识别Automatic Speech Recognition，(ASR)，其目标是将人类的语音中的词汇内容转换为计算机可读的输入，例如按键、二进制编码或者字符序列。与说话人识别及说话人确认不同，后者尝试识别或确认发出语音的说话人而非其中所包含的词汇内容。
语音识别技术的应用包括语音拨号、语音导航、室内设备控制、语音文档检索、简单的听写数据录入等。语音识别技术与其他自然语言处理技术如机器翻译及语音合成技术相结合，可以构建出更加复杂的应用，例如语音到语音的翻译。

语音识别系统根据对输入语音的限制加以分类
1.从说话者与识别系统的相关性考虑
可以将识别系统分为3类:(1)特定人语音识别系统:仅考虑对于专人的话音进行识别;(2)非特定人语音系统:识别的语音与人无关，通常要用大量不同人的语音数据库对识别系统进行学习;(3)多人的识别系统:通常能识别一组人的语音，或者成为特定组语音识别系统，该系统仅要求对要识别的那组人的语音进行训练。
2.从说话的方式考虑
也可以将识别系统分为3类:(1)孤立词语音识别系统:孤立词识别系统要求输入每个词后要停顿;(2)连接词语音识别系统:连接词输入系统要求对每个词都清楚发音，一些连音现象开始出现;(3)连续语音识别系统:连续语音输入是自然流利的连续语音输入，大量连音和变音会出现。
3.从识别系统的词汇量大小考虑
也可以将识别系统分为3类:(1)小词汇量语音识别系统。通常包括几十个词的语音识别系统。(2)中等词汇量的语音识别系统。通常包括几百个词到上千个词的识别系统。(3)大词汇量语音识别系统。通常包括几千到几万个词的语音识别系统。随着计算机与数字信号处理器运算能力以及识别系统精度的提高，识别系统根据词汇量大小进行分类也不断进行变化。目前是中等词汇量的识别系统到将来可能就是小词汇量的语音识别系统。这些不同的限制也确定了语音识别系统的困难度。

云蝠智能ASR语音识别功能
一句话识别
对一句话短音频文件进行识别，离线版本支持超过1分钟时长的识别。
实时语音识别
对实时音频流进行识别，达到说完即出文字的效果，适用于实时性要求较高的场景，如语音输入，电话机器人等。
录音文件识别
支持长时长录音识别，离线版本不限制时长，取决于终端设备的内存大小，适用于长语音，实时性要求不高的场景，如智能质检等。
语言支持
暂只支持中文普通话

音频格式
支持wav、pcm等音频格式

音频编码
支持8k、16k的单声道音频流
支持16bit的数据采样精度
音频数据长度
音频流中每个数据包的音频分片为20-200ms
（建议为20的倍数）

云蝠智能ASR语音识别的接入方式

多种集成方式
SDK：终端设备集成
API：服务端调用集成
多种输入方式
WAV、MP3....等
多种采样率
8K、16K
部署方式
公有云调度、本地化部署
云蝠智能ASR语音识别产品优势
支持普通话/中英混合等多语种及方言，海量数据不断更新，语音识别准确率持续提升。

高准确的识别率：基于先进的深度学习算法，安静环境下近场语音识别，中文普通话字准确率超过96%。
灵活的接入方式：支持不同设备端安卓、iOS系统的SDK接入，同时也支持HTTP协议的API接入。
毫秒级低延时识别速度：识别结果响应时间低于300毫秒。快速的系统响应，提升用户交互体验。
专业的业务领域：针对8K\16K的呼叫、客服场景，进行大量的业务场景优化。针对呼叫的VAD及降噪进行定位优化。
智能文本纠错能力：基于行业文本数据，针对用户输入上下文进行智能纠错，根据用户输入停顿，智能化插入标点符号。

声纹识别：基于声纹能力，实现对发音人进行有效区别。
END-

您可能还想看：

关于云蝠智能 | 让联络更智能高效 云蝠智能致力于成为国内领先的客户联络及质检自动化SAAS。通过自然语义理解的技术优势，为企业提供包括销售线索、智能触达（AI语音呼叫、邮件、短信分发）、电话中继线路及SCRM客户管理、音频及文本质检、语音智能工牌等一系列产品服务。获得前微软副总裁陆奇博士天使轮投资、AMINO丰元资本PreA轮等2轮上千万投资。公司拥有全国呼叫中心资质,软件著作权26项及商标3项。为万科、贝壳找房等诸多大型客户提供整体解决方案。云蝠智能获得了广泛的市场认可，客户涵盖房产家装、电商、教育、企业服务、SAAS互联网等诸多行业。应用场景包含精准营销、客户回访、邀约通知、满意度调查等诸多场景,通过saas及oem+paas两种方案提供服务。企业官网：www.telrobot.top音波智检：check.telrobot.top官方热线：025-66043469

cruet · 发表于 2023-10-17 19:01:08|来自：中国

在谈人工智能的时候，一定不能不谈语音识别，语音识别是人机交互的入口，是指机器/程序接收、解释声音，或理解和执行口头命令的能力。目前国内外都有公司在语音领域有所投入，其中包括循环智能（Recurrent AI）, 循环智能（Recurrent AI）是一家 AI 企业服务公司,借助原创的自然语言处理和深度学习技术，帮助拥有中大型销售或客服中心，以及在线上线下依靠大量销售代表、代理人、客户经理与客户进行沟通的企业，充分挖掘持续产生的“对话数据”的价值，将“对话数据”与沟通结果进行关联分析，从对话数据中不断挖掘优秀员工的闪光点，通过实时辅助和执行力分析系统，增强员工的沟通能力和业绩表现，为企业带来营收增长。
ASR自动语音识别
基于原创的、先进的 Transformer-XL 端到端模型，经过数十万小时行业标注数据训练，在金融、教育等领域的电话录音ASR准确率实测结果优于行业巨头。
线索意向评分
基于对话数据的AI模型：将成单对话作为正例、未成单对话作为负例进行训练，通过算法模型，筛选已沟通线索中的高意向线索，提升销售人员效率和转化率。

坐席实时辅助
为销售、客服人员提供实时辅助工具，包括实时语音转写、流程导航、客户画像提取、话术推荐、知识点提示、合规质检等功能，提升销售人员产能。
话术执行监督
通过给对话内容打上语义标签，管理者可以很快了解到，哪些员工因为信息传递不到位、未使用标准话术而导致转化流失，进而有针对性地培训以提升其能力。
智能质检
不同于基于“关键词+正则”的传统方案，循环智能提供高准确率和召回率的“非正则”方案，结合独家的“违规率排序”功能，可助力质检员多找出2~10倍违规对话。
总结：
循环智能的语音识别准确率高于国内公认语音巨头 X 厂和互联网巨头 T 厂，其中语音识别错误率，X 厂比我们高 3.96%，T 厂比我们高 19.68%；说话人分离的错误率，X 厂比我们高 27.87%，T 厂比我高 46.54%。

zeroera · 发表于 2023-10-17 19:01:46|来自：中国

每天必吹的&#34;车音上市&#34;又跳票了，不知道HR还在用这招骗面试者吗？哈哈哈，大快人心！车音就是行业笑话！

编辑于 19:44著作权归作者所有

Ike · 发表于 2023-10-17 19:02:35|来自：中国

车音网

[IT技术] 中国有几家搞语音识别的公司？

快速回帖

关于楼主

最新悬赏

交流分类

常用

技术

区块链

十二星座

十二生肖

专属推荐

问答专家