摘 要:随着人工智能技术研究的进步和深度神经网络的兴起,基于神经网络的声学模型的应用性能显著提高。为进一步促进基于深度学习的语音识别技术的应用,基于深度学习技术和 CNN、GRU、Bi-RNN 模型,文章探究了深度学习技术在智能语音识别任务中的应用前景。以清华大学语音与语言技术中心(CSLT)出版的开放式中文语音数据库 THCHS30 为实验数据集,该实验对所搭建模型进行训练与测试,并将不同模型在训练不同轮次之后的词错率进行横纵向对比。
关键词:语音识别;声学模型;神经网络
DOI:10.19850/j.cnki.2096-4706.2021.12.020
中图分类号:TP181 文献标识码:A 文章编号:2096-4706(2021)12-0075-05
Research on Intelligent Voice Assistant Based on Deep Learning
TANG Yongjun
(Hetao College, Bayannur 015000, China)
Abstract: With the progress of artificial intelligence technology and the rise of deep neural network, the application performance of acoustic model based on neural network is significantly improved. In order to further promote the application of voice recognition technology based on deep learning, this paper explores the application prospect of deep learning technology in intelligent voice recognition tasks based on deep learning technology and CNN, GRU, Bi-RNN models. Taking the open chinese voice database THCHS30 published by the Center for Speech and Language Technology (CSLT) of Tsinghua University as the experimental data set, the built model is trained and tested in this experiment, and the word error rates of different models after different rounds of training are compared horizontally and vertically.
Keywords: voice recognition; acoustic model; neural network
参考文献:
[1] 刘明珠,郑云非,樊金斐,等 . 基于深度学习法的视频文本 区域定位与识别 [J]. 哈尔滨理工大学学报,2016,21(6):61-66.
[2] 何湘智 . 语音识别的研究与发展 [J]. 计算机与现代化, 2002(3):3-6
[3] 张会云,黄鹤鸣 . 基于异构并行神经网络的语音情感识别 [J/OL]. 计算机工程:1-7[2021-05-14].https://doi.org/10.19678/ j.issn.1000-3428.0061076.
[4] 陈方,高升 . 语音识别技术及发展 [J]. 电信科学,1996 (10):54-57.
[5] 袁翔.基于HMM和DNN的语音识别算法研究与实现 [D]. 赣州:江西理工大学,2017.
[6] 戚龙,赵丹 . 基于 BP 神经网络的非特定人语音识别算法 [J]. 科学技术与工程,2017,17(31):277-282.
[7] 刘加 . 汉语大词汇量连续语音识别系统研究进展 [J]. 电子 学报,2000(1):85-91.
[8] 杜利民,侯自强 . 汉语语音识别研究面临的一些科学问题 [J]. 电子学报,1995(10):110-116+61.
[9] 宋丽亚 . 基于小波变换的说话人语音特征参数研究 [D]. 西安:西安电子科技大学,2004.
[10] 李辉,倪时策,肖佳,等 . 面向互联网在线视频评论的 情感分类技术 [J]. 信息网络安全,2019(5):61-68.
作者简介:唐永军(1974.09—),男,汉族,内蒙古临河人, 副教授,软件工程硕士,主要研究方向:软件工程、计算机技术及 应用。