如今小爱同学，科大讯飞，百度语音，京东语音识别等等都这么发达，为什么还要研究低端的语音识别呢？

爱笑的眼睛 · 发表于 2023-10-8 17:43:04|来自：中国

课题答辩中，导师问到现在语音识别这么发达，为什么你还要研究这么低端的语音识别？求广大朋友们给一个强有力的回答

卿茶 · 发表于 2023-10-8 17:43:51|来自：中国

近年来，随着科学技术的不断壮大，现在的语音识别技术已经非常成熟了，不管是生活还是工作，经常也能用得到，比如楼主说的小爱同学，科大讯飞，百度语音，京东语音识别等等，各有各的优势，一般针对不同的产品需求，以及开发初衷，有的是注重语音智能，有的是注重语音识别转换，就好比很多朋友都在用的“黑狐提词”手机提词器，它就能够帮助你快速将语音转文字，视频转文字，文档文字提取，或者是智能原创，提词拍摄等等，不仅能够节省时间，而且还能提升工作效率。像这样的语音识别软件有好多，得看个人需求吧，无论怎样，这也算是时代进步的象征吧，未来还会更好！

仪琳 · 发表于 2023-10-8 17:44:05|来自：中国

先搞清楚“是不是”。
各种商业互吹，在数据集刷成绩不代表就是发达，人脸数据集megaface都到99了，商业上落地还是各种问题，随便多点噪声，换个麦克风，多人聊天室，加点BGM，唱个歌，保证字错率刷刷刷网上飙。
主要还是domain的问题，大厂的api训练集未必有你客户domain的数据，表现肯定不如意；如果有自己团队更新效率会高很多。每年顶会都出这么多方法，大厂api更新肯定没有自己团队更新的快。
另一点就是api收费也不便宜，养一个团队还可以不断搞点新产品，分摊下来就很划算了。
（还有就是语音识别怎么是低端呢，想做得好比cv难多了。。顶多能说是底层，但是也不底层啊

苯鸟 · 发表于 2023-10-8 17:44:21|来自：中国

首先来看，语音识别并非已经那么成熟了，而是刚刚开始，上面所提到的只不过是当前的一些落地，若市面看不到相应的产品反而这个技术更会让人担心，非常具体我建议看一下这篇文章，但就语音识别，只从计算机方面来说，还有很多很多要研究的地方，当然由于深度学习和数据关联较大，所以企业研发走的相对快一些。
陈孝良：语音识别技术简史其次，语音识别实际上是跨学科的研究，比如声智解决的远场问题，就是与声学的融合，可以看看下面的文章，跨学科融合将是人工智能的主要研究思路。
陈孝良：让机器听懂世界，触及人类梦想还有多远？再次，声学、语音和语义最终都要解决语言的问题，而语言承载了人类的思想和情感，这是人工智能皇冠上的明珠，非常值得更多年轻人前赴后继来研究解决真实场景的诸多问题。
陈孝良：为什么“人机自然交互技术”越来越重要？如何吸引年轻人学习AI？最后补充一点，语音识别不止是训练模型，要做一个全栈语音识别研发人员还是很辛苦的，希望你能坚持方向，并且能带动更多年轻人热爱并为此做出你们这个时代年轻人的贡献。
陈孝良：如何成为一名全栈语音识别工程师？

上帝也疯狂 · 发表于 2023-10-8 17:44:46|来自：中国

从研究角度，语音识别目前只解决了近场语音识别，而高噪声环境，远场环境下的语音识别表现一般。除此之外，语音识别还有许多还未解决的问题，比如鸡尾酒会问题。
另外，从企业角度，并不是每个企业都会使用别人的语音识别api，很多大公司会做自己的语音识别系统，并需要这方面的人，而国内语音识别专业的学生相对较少，故企业对该专业学生的需求量还是有一定的。
语音识别的学习需要从传统的GMM-HMM过渡到DNN-HMM，这里面学习成本还是比较大的，如果你的导师团队不是做语音出身的，没有足够的服务器，也是做不了语音识别的。

eee1573 · 发表于 2023-10-8 17:45:27|来自：中国

老师说的是对的。研究工作总有个背景意义，你自己要想几条意义说服自己，然后说法大家

[IT技术] 如今小爱同学，科大讯飞，百度语音，京东语音识别等等都这么发达，为什么还要研究低端的语音识别呢？

快速回帖

关于楼主

最新悬赏

交流分类

常用

技术

区块链

十二星座

十二生肖

专属推荐

问答专家