[IT技术] 如今小爱同学,科大讯飞,百度语音,京东语音识别等等都这么发达,为什么还要研究低端的语音识别呢?

[复制链接]
爱笑的眼睛 发表于 2023-10-8 17:43:04|来自:中国 | 显示全部楼层 |阅读模式
课题答辩中,导师问到现在语音识别这么发达,为什么你还要研究这么低端的语音识别?求广大朋友们给一个强有力的回答
全部回复5 显示全部楼层
卿茶 发表于 2023-10-8 17:43:51|来自:中国 | 显示全部楼层
近年来,随着科学技术的不断壮大,现在的语音识别技术已经非常成熟了,不管是生活还是工作,经常也能用得到,比如楼主说的小爱同学,科大讯飞,百度语音,京东语音识别等等,各有各的优势,一般针对不同的产品需求,以及开发初衷,有的是注重语音智能,有的是注重语音识别转换,就好比很多朋友都在用的“黑狐提词”手机提词器,它就能够帮助你快速将语音转文字,视频转文字,文档文字提取,或者是智能原创,提词拍摄等等,不仅能够节省时间,而且还能提升工作效率。像这样的语音识别软件有好多,得看个人需求吧,无论怎样,这也算是时代进步的象征吧,未来还会更好!

仪琳 发表于 2023-10-8 17:44:05|来自:中国 | 显示全部楼层
先搞清楚“是不是”。
各种商业互吹,在数据集刷成绩不代表就是发达,人脸数据集megaface都到99了,商业上落地还是各种问题,随便多点噪声,换个麦克风,多人聊天室,加点BGM,唱个歌,保证字错率刷刷刷网上飙。
主要还是domain的问题,大厂的api训练集未必有你客户domain的数据,表现肯定不如意;如果有自己团队更新效率会高很多。每年顶会都出这么多方法,大厂api更新肯定没有自己团队更新的快。
另一点就是api收费也不便宜,养一个团队还可以不断搞点新产品,分摊下来就很划算了。
(还有就是语音识别怎么是低端呢,想做得好比cv难多了。。顶多能说是底层,但是也不底层啊
苯鸟 发表于 2023-10-8 17:44:21|来自:中国 | 显示全部楼层
首先来看,语音识别并非已经那么成熟了,而是刚刚开始,上面所提到的只不过是当前的一些落地,若市面看不到相应的产品反而这个技术更会让人担心,非常具体我建议看一下这篇文章,但就语音识别,只从计算机方面来说,还有很多很多要研究的地方,当然由于深度学习和数据关联较大,所以企业研发走的相对快一些。
陈孝良:语音识别技术简史其次,语音识别实际上是跨学科的研究,比如声智解决的远场问题,就是与声学的融合,可以看看下面的文章,跨学科融合将是人工智能的主要研究思路。
陈孝良:让机器听懂世界,触及人类梦想还有多远?再次,声学、语音和语义最终都要解决语言的问题,而语言承载了人类的思想和情感,这是人工智能皇冠上的明珠,非常值得更多年轻人前赴后继来研究解决真实场景的诸多问题。
陈孝良:为什么“人机自然交互技术”越来越重要?如何吸引年轻人学习AI?最后补充一点,语音识别不止是训练模型,要做一个全栈语音识别研发人员还是很辛苦的,希望你能坚持方向,并且能带动更多年轻人热爱并为此做出你们这个时代年轻人的贡献。
陈孝良:如何成为一名全栈语音识别工程师?
上帝也疯狂 发表于 2023-10-8 17:44:46|来自:中国 | 显示全部楼层
从研究角度,语音识别目前只解决了近场语音识别,而高噪声环境,远场环境下的语音识别表现一般。除此之外,语音识别还有许多还未解决的问题,比如鸡尾酒会问题。
另外,从企业角度,并不是每个企业都会使用别人的语音识别api,很多大公司会做自己的语音识别系统,并需要这方面的人,而国内语音识别专业的学生相对较少,故企业对该专业学生的需求量还是有一定的。
语音识别的学习需要从传统的GMM-HMM过渡到DNN-HMM,这里面学习成本还是比较大的,如果你的导师团队不是做语音出身的,没有足够的服务器,也是做不了语音识别的。
eee1573 发表于 2023-10-8 17:45:27|来自:中国 | 显示全部楼层
老师说的是对的。研究工作总有个背景意义,你自己要想几条意义说服自己,然后说法大家

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则