当前位置>主页 > 期刊在线 > 计算机技术 >

计算机技术21年21期

基于分形维与自相关函数绝对值均值的端点检测算法
陈航¹,伍子嘉¹,彭勇¹,宋威²
(1. 江南大学 物联网工程学院,江苏 无锡 214122;2. 江南大学 人工智能与计算机学院,江苏 无锡 214122)

摘  要:在语音信号处理中,端点检测是语音处理的一个重要部分。现提出一种基于分形维数和语音帧自相关函数绝对值均值的双门限端点检测方法。根据语音信号和噪声信号分形维的不同,以及噪声信号与语音信号自相关函数的特点进行语音端点检测,并通过 MATLAB 仿真进行验证。实验结果表明,该方法在 5 dB 噪声环境下能较好地判断语音信号的起止点。


关键词:端点检测;分形维数;自相关函数绝对值均值



DOI:10.19850/j.cnki.2096-4706.2021.21.028


基金项目:国家自然科学基金(62076110)


中图分类号:TN92                                         文献标志码:A                                       文章编号:2096-4706(2021)21-0108-04


Endpoint Detection Algorithm Based on Fractal Dimension and Absolute Mean Value of Autocorrelation Function

CHEN Hang1, WU Zijia 1, PENG Yong1, SONG Wei 2

(1.School of Internet of Things Engineering, Jiangnan University, Wuxi 214122, China; 2.School of Artificial Intelligence and Computer Science, Jiangnan University, Wuxi 214122, China)

Abstract: In speech signal processing, endpoint detection is an important part of speech processing. In this paper, a dual-threshold endpoint detection method based on the fractal dimension and the absolute mean value of the speech frame autocorrelation function is proposed. According to the different fractal dimensions of speech signal and noise signal and the characteristics of autocorrelation function of noise signal and speech signal, the speech endpoint is detected and verified by MATLAB simulation. Experimental results show that this method can better judge the start and end points of speech signals in 5 dB noise environment.

Keywords: endpoint detection; fractal dimension; absolute mean value of autocorrelation function


参考文献:

[1] 陈锡锻 . 一种双门限语音端点检测算法 [J]. 浙江工贸职业技术学院学报,2021,21(2):43-46.

[2] 沈蓉 . 智能门禁系统声纹识别中端点检测算法研究 [D].西安:西安科技大学,2015.

[3] 吴边,王忠,刘兴涛 . 强背景噪声下语音端点检测的算法研究 [J]. 计算机工程与应用,2011,47(33):137-139.

[4] 薛胜尧 . 基于改进型双门限语音端点检测算法的研究 [J].电子设计工程,2015,23(4):78-81.

[5] 邓艳容,景新幸,杨海燕,等 . 语音端点检测研究 [J]. 计算机系统应用,2012,21(6):240-243.

[6] 朱春利,李昕 . 基于 LMS 减噪与改进的双门限语音端点检测方法 [J]. 系统仿真学报,2017,29(9):1950-1960+1967.

[7] 夏令祥 . 低信噪比环境下语音端点检测方法的研究 [D].徐州:中国矿业大学,2019.

[8] HAGHANI S K,AHADI S M. Robust voice activity detection using feature combination [C]//2013 21st Iranian Conference on Electrical Engineering (ICEE).Mashhad:IEEE,2013:1-5.

[9] 刘炜杰,安桐,张涛 . 基于 Katz 维数的改进谱减算法 [J].信息与控制,2021,50(6):677-684.

[10] 崔东东,张恒璟,程鹏飞 . 一种自相关函数绝对值均值变点的去噪方法 [J]. 测绘科学,2019,44(12):42-49.


作者简介:陈航(1998—),男,汉族,湖北孝感人,硕士研究生在读,主要研究方向:数字信号处理;伍子嘉(1997—),男,汉族,江苏扬州人,硕士研究生在读,主要研究方向:机器视觉与深度学习;彭勇(1967—),男,汉族,江苏无锡人,副教授,硕士,主要研究方向:嵌入式软件与设计;宋伟(1981—),湖北恩施人,教授,博士,主要研究方向:机器学习、自然语言处理。