《新一代人工智能与语音识别》[87M]百度网盘|亲测有效|pdf下载

书籍详情

新一代人工智能与语音识别
作者:马延周著
热度:9086
上架时间:2025-01-04 08:18:29
价格:0.0

书籍下载

点击下载

书籍预览

查看链接

免责声明

本站支持尊重有效期内的版权/著作权,所有的资源均来自于互联网网友分享或网盘资源，一旦发现资源涉及侵权，将立即删除。希望所有用户一同监督并反馈问题，如有侵权请联系站长或发送邮件到ebook666@outlook.com,本站将立马改正

内容介绍

作者:马延周著

定价:44.5

出版社:清华大学出版社

出版日期:2018年04月01日

页数:145

装帧:平装

ISBN:9787302523840

阐述了语音识别的基本类型，对近60年来国内外俄语连续语音识别研究现状进行评析；建立声学模型和语言模型是俄语连续语音识别研究需要解决的关键问题。

●第0章绪论1 0.1研究依据1 0.2研究对象与研究目标2 0.3研究方法3 0.4研究意义3 0.5本书的创新点4 0.6语料来源4 0.7本书的结构5 第1章语音识别技术研究综述7 1.1语音识别的定义与分类7 1.1.1语音识别的定义7 1.1.2语音识别的分类8 1.2语音识别技术的研究进展9 1.2.1语音识别技术的发展概况9 1.2.2国外俄语语音识别技术的研究进展10 1.2.3中国俄语语音识别技术的研究进展13 1.3语音识别系统的基本原理14 1.3.1特征提取15 1.3.2声学模型16 1.3.3语言模型17 1.3.4解码18 1.4语音识别技术研究所关注的关键问题19 本章小结21〖4〗新一代人工智能与语音识别〖2〗目录〖4〗第2章语音数据的加工处理22 2.1问题描述22 2.2众包的定义及内涵23 2.2.1众包的基本概念23 2.2.2众包的基本流程24 2.2.3众包的关键问题24 2.3解决方案25 2.3.1质量控制25 2.3.2语音标注平台的架构27 2.3.3标注平台的设计与实现28 2.4语音标注31 2.4.1语音有效性判断31 2.4.2语音转写规范32 2.4.3语音标注规范32 2.5实验设计与结果分析33 2.5.1实验设计33 2.5.2结果分析34 2.5.3结论36 本章小结36 第3章俄语声学模型的建立37 3.1连续语音识别37 3.1.1连续语音识别的整体模型38 3.1.2声学模型训练的HMMGMM方法40 3.1.3声学模型训练中的HMMDNN方法48 3.2俄语语音学概述52 3.2.1俄语的使用及分布情况52 3.2.2俄语语音的基本特点55 3.2.3俄语音素的发音特征56 3.2.4俄语元音音素的随位变化58 3.2.5俄语辅音音素的随位变化60 3.3俄语声学单元的选择61 3.3.1俄语SAMPA音素集61 3.3.2俄语音系表64 3.4实验设计与结果分析64 3.4.1实验设计65 3.4.2结果分析66 本章小结67 第4章俄语语言模型的建立68 4.1文本语料的准备与清洗68 4.1.1数据来源的筛选69 4.1.2数据爬取71 4.1.3数据的去重与清洗71 4.1.4格式化处理74 4.2语言模型简述75 4.2.1语言模型的平滑技术77 4.2.2语言模型的剪枝算法81 4.3语言模型的训练流程84 4.3.1语言模型的训练实现84 4.3.2词典的选择85 4.3.3LM的剪枝与优化87 4.4实验结果分析89 4.4.1词典规模测试89 4.4.2语料规模测试89 4.4.3语言模型剪枝测试90 本章小结91 第5章基于Kaldi的俄语语音识别原型系统92 5.1系统设计的目标与原则92 5.1.1系统设计的目标92 5.1.2系统设计的原则92 5.2系统的开发环境与整体架构93 5.2.1系统的开发环境93 5.2.2系统的整体架构93 5.3Kaldi环境的搭建94 5.3.1Kaldi及实验环境94 5.3.2Kaldi训练服务器的搭建96 5.3.3AM训练数据及参数设置98 5.3.4LM训练数据及参数设置107 5.4Kaldi训练优化111 5.4.1Kaldi声学建模111 5.4.2GPU加速113 5.5语音识别原型系统的设计114 5.5.1系统GUI的设计114 5.5.2在线识别功能114 5.5.3离线识别功能117 5.6实验设计与结果分析119 5.6.1实验设计119 5.6.2实验结果119 5.6.3结果分析120 本章小结121 第6章总结与展望122 6.1本书的主要成果122 6.2未来的研究计划123 附录A英汉术语对照表124 附录B其他相关资料126 B.1俄语发音词典(76277个词形)示例126 B.2俄语解码词表(189971个词形)示例127 B.3俄语字符Unicode编码对照表128 B.4俄语语音格式化程序(转换为16KB、16b)128 B.5俄语文本转Unicode编码程序129 B.6从https: //twitter.com网站上下载的部分网页文件 (json格式)示例131 B.7从http: //www.interfax.ru网站上下载的部分网页文件(json格式)示例131 B.8俄语拉丁字母转写表132 参考文献134

本书系统介绍基于新闻语料的俄语连续语音识别方法。全书共分以下几个部分：基于Kaldi设计实现俄语连续语音识别原型系统，使之具备在线识别和离线识别功能，以验证声学模型和语言模型优化算法的有效性，进而为面向特定领域的俄语语音识别实用系统研发提供理论方法、实验数据和关键技术支撑。为了实现上述目标，需要进行如下环环紧扣的操作步骤：俄语语音语料的采集加工处理、俄语文本语料的采集清洗过滤、俄语发音词典的自动预测生成、声学模型建模基本单元（音素集）的确定、声学模型和语言模型的优化等。

马延周著

"马延周，男，战略支援信息工程大学洛阳校区，副教授，博士研究生 1996-2000，解放军信息工程大学学员，计算机应用专业 2000-2005，解放军外国语学院基础部讲师 2005-2008，解放军信息工程大学硕士研究生，计算机技术应用 2008-2012，解放军外国语学院基础部讲师 2012-2016，解放军外国语学院博士研究生，语言信息处理（语音识别） 2013-2015，中国科学技术大学、科大讯飞研究院访学，主要研究连续语音识别 2016-，解放军信息工程大学洛阳校区（原解放军外国语学院）副教授从教18年来，主要承担计算机类、语言信息类本硕博课程的主讲与辅导任务，主持或等

    第3章
     俄语声学模型的建立
     接正文声学模型的建立是语音识别研究的核心问题,而基本识别单元(即音素)的确定和选择又是语音建模的基础。从语音学角度来讲,连续语音(即语流)中的音素是一种线性单位,这种线性单位是从连续语流中切分出来的,是最基本的组成单位,由音素可以组成形素和词形，进而组成语句。俄语声学模型的建立首先需要设计俄语的音素集,音素集的确定不仅要考虑俄语语音学知识,如音素的发音特征、元辅音的随位变化、语流之间的影响、上下文之间的关系等特征,还要考虑计算机对其进行处理的便捷性,以便于计算机对俄语语流进行处理。此外,发音词典音素的正确性对于识别系统也是相当重要的,错误的发音标注会极大地影响系统的识别率。本章从俄语语音学等

相关推荐