在(上)篇里把自然语言处理NLP的几本知识体系,从理论到实践,从入门到深入进行了大致的介绍,对于学习路径和步骤进行了初步的划分,还没有来得及总结经典学习书单,这篇开始就针对各个模考介绍相应的经典学习书单供大家参考学习。
还是先列上学习路径:
数字信号处理/语音信号处理=》语音识别与合成=》自然语言处理=》自然语言处理实用框架(Python和深度学习)=》预训练模型=》文本挖掘=》NLP项目实战。
一、语音信号处理
语音信号处理基础是数字信号处理,包括基本的模拟信号离散化,数字化处理,频域变换,时域频域分析,离散时间序列的处理等知识内容,是计算机专业,电子专业,自动化专业等EE/CS领域的基础的基础。
还是现来看经典国外教材系列:
1. 数字信号处理――原理、算法与应用(第四版) [Digital Signal Processing,Fourth Edition]
以及
2. 数字信号处理――基于计算机的方法(第四版)
基础必须要学习,或者至少要了解,这样才能知其然且知其所以然。
针对语音信号处理,清华大学出版社教材
3. 语音信号处理(第3版)/人工智能科学与技术丛书
更进一步,利用深度学习来研究
复杂环境下语音信号处理的深度学习方法 清华大学出版社 张晓雷 著
二、语音识别
前文做过介绍,语音识别主要任务是对于语音信号输入进行处理,特征提取,建模训练,以及达到识别分类的效果。
方便起见,目前热门的套装可以一并考虑:
语音识别 原理与应用+Kaldi语音识别实战+图解语音识别+语音信号处理第3版
这里面包括4本语音识别书籍:
《语音识别:原理与应用》能够了解较为全面的语音识别的知识,可以体系化的进行学习。
《图解语音识别》顾名思义,可以通过图解,直观的对其中的技术原理和概念进行了解,更加通俗易懂,用来学习辅助。
《Kaidi语音识别实战》是利用目前主流的开源工具来实战应用语音识别的很好的学习书和工具书
《语音信号处理》前面介绍过,是算法的基础。
三、语音合成
语音合成是识别的反向任务,用来将语义文本等合成符合人类说话习惯的语音数据,以音频形式播放出来。
1. 汉语语音合成:原理和技术
专门针对汉语的合成的介绍
以及声纹技术的知识:可以通过声纹技术进行识别和合成,人声分离等应用。
2. 声纹技术 从核心算法到工程实践
自然语言处理(NLP)的预备知识先介绍到这儿,下一篇就重点进入NLP的知识体系。
未完待续。。。
留言与评论(共有 0 条评论) “” |