[IT技术] 毕设选题是语音识别,最近有看了资料,也看了一些开源项目,但是还是有点迷茫,有人能给出一些建议吗?

[复制链接]
zjok 发表于 2023-10-13 11:10:01|来自:北京 | 显示全部楼层 |阅读模式
大概结合人工智能算法提高识别系统对含噪语音的识别准确率
全部回复5 显示全部楼层
我是色狼 发表于 2023-10-13 11:10:25|来自:北京 | 显示全部楼层
新一代 Kaldi 其中一个子项目: sherpa-ncnn
https://github.com/k2-fsa/sherpa-ncnn
专注流式识别,即边说话,边识别。
不需要访问网络不需要数据传输,完全本地识别

支持 Linux, macOS, Windows, Android, iOS, Raspberry Pi 4, 爱芯派 (m3axpi) 等。
我们有活跃的交流群。

所有代码、文档以及模型,都是开源的。
新一代Kaldi:新一代 Kaldi - 移动端语音识别
bilibili 视频演示 (iOS)

  • <a href="http://link.zhihu.com/?target=https%3A//www.bilibili.com/video/BV11841137TG/" class=" wrap external" target="_blank" rel="nofollow noreferrer">新一代 Kaldi 实时语音识别之 iOS iPhone (1/2)
  • 新一代 Kaldi 实时语音识别之 iOS iPad (2/2)
  • 新一代 Kaldi 在 iPhone 上实时语音识别之 北京地铁 (1/2)
  • 新一代 Kaldi 在 iPhone 上实时语音识别之 北京地铁 (2/2)
bilibili 视频演示 (Android)


  • 新一代 Kaldi 之 endpointing - android 实时中英文语音识别
  • 在 安卓上 使用新一代 Kaldi 进行实时语音识别之 1/5
  • 在 安卓上 使用新一代 Kaldi 进行实时语音识别之 2/5
  • 在 安卓上 使用新一代 Kaldi 进行实时语音识别之 3/5
  • 在 安卓上 使用新一代 Kaldi 进行实时语音识别之 4/5
  • 在 安卓上 使用新一代 Kaldi 进行实时语音识别之 5/5
bilibili 视频演示 (树莓派 4 Model B)


  • 新一代 Kaldi: 嵌入式实时语音识别之树莓派
  • 新一代Kaldi - 树莓派4 英文实时语音识别(小模型,单线程)
  • 新一代Kaldi - 树莓派4 中英文实时语音识别
bilibili 视频演示 (爱芯派, m3axpi)


  • 新一代 Kaldi: 嵌入式实时语音识别之MAIX-III AXera-Pi
  • 新一代Kaldi: 爱芯派(m3axpi) 实时语音识别(英语,小模型, 两个线程)
bilibili 视频演示 (macOS)


  • 使用 sherpa-ncnn 的 Python API 进行实时的中英文语音识别 -- 包含 endpointing
  • 新一代 Kaldi 实时语音识别 之 sherpa-ncnn Python API 演示
  • 使用新一代 Kaldi 进行中英文混合实时语音识别
  • 流式语音识别之 sherpa-ncnn (英文)
bilibili 视频演示 (Windows)


  • 流式语音识别之 sherpa-ncnn (中文) - by Liliana
ahgwork 发表于 2023-10-13 11:10:45|来自:北京 | 显示全部楼层
你好,我俩毕设选题感觉类似,可以加个好友交流交流吗
冷白 发表于 2023-10-13 11:11:22|来自:北京 | 显示全部楼层
推荐wenet,简单易安装,里面有详细的demo示例。
xiongdamao 发表于 2023-10-13 11:11:32|来自:北京 | 显示全部楼层
如果只是跑通demo,github上下一个开源E2E项目,下载开源数据,跑通不难,建议espnet
neverletgo 发表于 2023-10-13 11:11:38|来自:北京 | 显示全部楼层
语音识别数据 https://github.com/double22a/speech_dataset
语音识别开源 廿二:传统与端到端语音识别开源工具
语音识别资料 https://github.com/double22a/asr_paper_code

快速回帖

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则