ycacg 发表于 2023-10-8 17:41:13

本人大一,打算自学语音识别,不知道应该怎么入门。?

如题。本人就读于一所双非的大学,电子信息工程专业的,虽然说该专业属于一本招生,但是学校总体还是一间二本学校,挺水的。学校很难找到好的资源给我们学习,所以我就想自学一下语音识别,但是不知道从何入手。我知道真正想学到专业的东西必须要靠自己,所以想来听听大神的一些入门建议来让我有一个大概的学习流程。不知道学习语音识别应该要具备哪些知识,大神们当初学习的流程又是什么呢?

woomoo 发表于 2023-10-8 17:41:55

推荐3个课程
1、《kaldi语音识别理论与实践》https://xjw.xet.tech/s/1LAcPX
语音识别0基础入门课,详细介绍kaldi工具,可以结合陈果果老师的书《kaldi语音识别实战》一起食用。
2、《AISHELL-1语音识别实战》https://xjw.xet.tech/s/2b6rW7
厦门大学语音实验室洪青阳老师团队主讲,语音识别基础课程。
3、《wenet语音识别实战》https://xjw.xet.tech/s/HkxVt
端到端语音识别课程,wenet团队成员主讲。主要是实战,讲解理论的部分较少,需要有一定语音识别基础才行。

alleles 发表于 2023-10-8 17:42:17

去学习icefall的代码吧

全年不休 发表于 2023-10-8 17:42:52

语音识别其实是一门非常综合的方向,如果你现在只是大一,我认为知识储备可能还不够,但是如果有这个想法,我觉得非常好,也是做一个比较基础的回答,帮助你在以后的学习中重点留意语音识别所需要的学科和知识点。
语音识别,如果我们只是直觉的去想似乎应该很简单,不就是把语音转换成文字吗,但是计算机要想完成这么一件看似容易的事情,那就复杂多了,这里面有大量的顶尖科学家精心设计的各种算法,有各种假设和先验知识,背后至少涉及到两门数学知识和多种机器学习算法。针对语音识别的各个流程,我在这里线罗列一下所需要的知识点和涉及到的学科,在以后的学习中,可以重点关注。下面列举的这几个方面,可以说每一个方面都可以作为一个单独的学科,不仅是语音,各种机器学习相关的研究方向,也无外乎于此了。

[*]既然是做语音识别,那么就首先要对语音有一个了解,了解语音和信号的基本知识,当然这方面就有很多专门讲语音的书籍,中英文的都有很多,中文的比如各种名为《语音信号处理》的,英文的就是拉宾那的经典教材。这些书籍的背后其实都是《数字信号处理》,然后再结合语音信号独特的特点。学习完成语音信号处理,就对语音和常用的数字信号处理的技术有了深入了解,对后面所要用到的各种语音特征的提取就有了理论的支撑;
[*]概率论一定不可少。不论是现在最流行的深度学习的方法,还是之前混合高斯模型(GMM)和隐马尔科夫模型(HMM),概率论的知识占有非常高的比重,也是大多数机器学习算法的基础,所以这部分一定要学好;
[*]深度学习。这又是一大块,反向传播算法不用说了吧,其实就是高数里面的链式求导法则。从最简单的前向网络,到卷积和递归网络,再到注意力机制和Transformer,几乎就是这十几年深度学习的发展脉络了,这些都已经应用在各种语音识别模型了,所以也都需要搞懂;
[*]机器学习工具,主要就是pytorch和tensorflow了,pytorch更容易使用一些,现在做学术论文的使用的也更多,更容易使用别人开源的代码来复现别人的工作,这就是工具,不能不会;
[*]开源的语音识别算法工具包,这是一个美好的时代,只要你会用github,那么几乎99%的工作都能胜任了,语音识别也不例外,可能你只需要会一些linux基础知识和python,你就能跑一个语音识别任务。比如Wenet,ESPnet,都可以参考。
上面说了一些做语音识别需要的基础知识,还有一些公开课,比如深蓝学院和西工大谢磊老师的课程,但是这个也是假设有上述的这些基础知识的。如果现在大一基础知识还跟不上,而又想有一个科学的了解,还是推荐读一下HTK book的前面一两章节的内容,虽然GMM-HMM这一套落后了,但是HTK book的这两章内容还是给出了一个科学的框架的。

918外链网 发表于 2023-10-8 17:43:08

西北工业大学音频语音与语言处理研究组(ASLP@NPU)负责人,谢磊老师老师强烈推荐!

0318dj 发表于 2023-10-8 17:43:18

【Kaldi语音识别】从零搭建语音识别引擎(一)_哔哩哔哩_bilibili
【Kaldi语音识别】从零搭建语音识别引擎(二)_哔哩哔哩_bilibili
【LainSpeech】从零搭建语音识别引擎-端到端模型Wenet篇-学习视频教程-腾讯课堂
我在这里出了一个关于语音识别的入门教程~希望可以帮助到正在入门语音识别的同学~
页: [1]
查看完整版本: 本人大一,打算自学语音识别,不知道应该怎么入门。?