ASR概念和术语学习指南(4):CTC之后的两条道路——AED 与 RNN-T 在上一篇中,我们见证了 CTC 如何用一个空白符和一条序列级损失函数,拆掉了 HMM 的三道墙。它是端到端的第一次冲击:音频进去,文字出来,不需要任何对齐标注。 2026-02-27 · aopstudio · ASR 人工智能 CTC RNN-T · 0 评论 · 0 浏览
ASR概念和术语学习指南(3):端到端的第一次冲击——CTC 在上一篇中,我们拆解了传统ASR 的精密工厂:GMM/DNN 负责打分,HMM 负责对齐,Lexicon 负责翻译,n-gram 负责质检,最后由 WFST 统一 2026-01-07 · aopstudio · ASR CTC 学习指南 · 0 评论 · 0 浏览
ASR概念和术语学习指南(2):传统 ASR 系统的工作流程 如果你曾好奇"在现代端到端ASR系统普及之前,语音识别是怎么工作的?",那么答案就藏在一个高度工程化的系统里。它不像今天的端到端模型那样"一键出文字",而更像一座 2025-12-31 · aopstudio · ASR 语音识别 学习指南 · 0 评论 · 0 浏览
ASR概念和术语学习指南(1):任务定义与输入输出 如果你用过语音助手、字幕生成工具,或者会议转录软件,那你其实已经和 自动语音识别(ASR, Automatic Speech Recognition)打过不少交道 2025-12-29 · aopstudio · ASR 学习指南 · 0 评论 · 0 浏览