zjok 发表于 2023-10-13 11:10:01

毕设选题是语音识别,最近有看了资料,也看了一些开源项目,但是还是有点迷茫,有人能给出一些建议吗?

大概结合人工智能算法提高识别系统对含噪语音的识别准确率

我是色狼 发表于 2023-10-13 11:10:25

新一代 Kaldi 其中一个子项目: sherpa-ncnn
https://github.com/k2-fsa/sherpa-ncnn
专注流式识别,即边说话,边识别。
不需要访问网络,不需要数据传输,完全本地识别。

支持 Linux, macOS, Windows, Android, iOS, Raspberry Pi 4, 爱芯派 (m3axpi) 等。
我们有活跃的交流群。

所有代码、文档以及模型,都是开源的。
新一代Kaldi:新一代 Kaldi - 移动端语音识别
bilibili 视频演示 (iOS)

[*]<a href="http://link.zhihu.com/?target=https%3A//www.bilibili.com/video/BV11841137TG/" class=" wrap external" target="_blank" rel="nofollow noreferrer">新一代 Kaldi 实时语音识别之 iOS iPhone (1/2)
[*]新一代 Kaldi 实时语音识别之 iOS iPad (2/2)
[*]新一代 Kaldi 在 iPhone 上实时语音识别之 北京地铁 (1/2)
[*]新一代 Kaldi 在 iPhone 上实时语音识别之 北京地铁 (2/2)
bilibili 视频演示 (Android)


[*]新一代 Kaldi 之 endpointing - android 实时中英文语音识别
[*]在 安卓上 使用新一代 Kaldi 进行实时语音识别之 1/5
[*]在 安卓上 使用新一代 Kaldi 进行实时语音识别之 2/5
[*]在 安卓上 使用新一代 Kaldi 进行实时语音识别之 3/5
[*]在 安卓上 使用新一代 Kaldi 进行实时语音识别之 4/5
[*]在 安卓上 使用新一代 Kaldi 进行实时语音识别之 5/5
bilibili 视频演示 (树莓派 4 Model B)


[*]新一代 Kaldi: 嵌入式实时语音识别之树莓派
[*]新一代Kaldi - 树莓派4 英文实时语音识别(小模型,单线程)
[*]新一代Kaldi - 树莓派4 中英文实时语音识别
bilibili 视频演示 (爱芯派, m3axpi)


[*]新一代 Kaldi: 嵌入式实时语音识别之MAIX-III AXera-Pi
[*]新一代Kaldi: 爱芯派(m3axpi) 实时语音识别(英语,小模型, 两个线程)
bilibili 视频演示 (macOS)


[*]使用 sherpa-ncnn 的 Python API 进行实时的中英文语音识别 -- 包含 endpointing
[*]新一代 Kaldi 实时语音识别 之 sherpa-ncnn Python API 演示
[*]使用新一代 Kaldi 进行中英文混合实时语音识别
[*]流式语音识别之 sherpa-ncnn (英文)
bilibili 视频演示 (Windows)


[*]流式语音识别之 sherpa-ncnn (中文) - by Liliana

ahgwork 发表于 2023-10-13 11:10:45

你好,我俩毕设选题感觉类似,可以加个好友交流交流吗

冷白 发表于 2023-10-13 11:11:22

推荐wenet,简单易安装,里面有详细的demo示例。

xiongdamao 发表于 2023-10-13 11:11:32

如果只是跑通demo,github上下一个开源E2E项目,下载开源数据,跑通不难,建议espnet

neverletgo 发表于 2023-10-13 11:11:38

语音识别数据 https://github.com/double22a/speech_dataset
语音识别开源 廿二:传统与端到端语音识别开源工具
语音识别资料 https://github.com/double22a/asr_paper_code
页: [1]
查看完整版本: 毕设选题是语音识别,最近有看了资料,也看了一些开源项目,但是还是有点迷茫,有人能给出一些建议吗?