作者:李皓若 林语嫣 丁华宇 孙 慧 来源:《中国新通信》 2020年第17期
李皓若 山东交通学院国际商学院
林语嫣 中国人民大学 与反恐怖学院
丁华宇 孙慧 山东交通学院国际商学院
【摘要】 针对声音在不同介质的传播速度不同,问题进行了对麦克风阵列进行研究,利用TDOA(到达时间差)技术的思维对人所在位置进行定位。做了运用时延估计的思维,构建了麦克风矩阵的多目标线性规划模型,首先对麦克风树的俯仰角和方位角进行约束,基于遗传算法的MP算法对声音进行去噪处理,从而加强声音信号中有用部分,其次从而使定位更加精确的思路,设计了基于小波分析改良的Mallat算法,给出对麦克风的数量、俯仰角及方位角设置的决策建议,以达到提高定位精度,降低成本及面积预测的目的。最后对模型进行了检测评价,并提出合理决策建议。选取三个麦克风作为麦克风阵列,利用麦克风树之间的位置和的声音到达时延差进行求解,设置麦克风俯仰角、方位角、距地高度构建三维空间直角坐标系;利用基于遗传算法的MP算法对声音进行去噪处理,将声音信号分解和重构,最终将声音信号表示为时频的线性组合,建立多目标线性规划模确定声源,达到定位目的。最后求解出改良后信号毛刺最少的一组解,对麦克风树的改型来良提出决策意见。
【关键词】 TDOA 时延估计 多目标线性规划模型 MP算法 Mallat算法 小波分析
麦克风阵列定位在当前语音识别、定位方面方兴未艾,如何设计一个符合成本要求且定位更加精准的麦克风树是目前研究的热点。“麦克风树”指的是一个把若干(≥1)支同样型号麦克风固定安装在一个刚性的枝形架子上(架子下面带万向轮,在平地上可以被水平推动或转,但不会歪斜)这样的设备称为一个麦克风树。不同的麦克风由于位置不同,录制到的声音往往也有细微的不同,所以通过对多支麦克风接收到的声音进行对比分析,可以得到更多的有关声源的信息。该技术通过不断改变麦克风个数、角度、离地距离来不断优化麦克风阵列组合,最后达到使用最少数量的麦克风更加精准定位的目的。
已知大厅的平面形状和大厅轮廓的准确尺寸。但在实际施工中,由于操作和设备所限,在麦克风树放置在地面上的时候,无法精确测量放置点的坐标以及水平的旋转角度。通过对麦克风数量、角度和离地高度的分析,设计合理的声音信号分析算法,以确定此人的位置。
结合TDOA技术,在大厅轮廓尺寸未知情形下,其余条件同问题一相同的条件下,构建合理的麦克风树模型,利用声源、麦克风树与墙壁之间的相对位置关系,设计出优化的定位算法,测出大厅的精准尺寸。
一、模型分析
假设墙面完全光滑,声音在墙面被反射回来时,准线一直垂直于大理石墙面。
假设在实验时不受外部噪声的影响。
室内温度为15℃且墙面为纯大理石,则声音在此条件下在空气中传播速度为340m/s,在大理石中传播速度为3810m/s。
假设麦克风的重量,体积忽略不计,在空间直角坐标系中以坐标形式体现。数据的预处理,为了提高系统的稳定性,说明所建立的麦克风阵列多线性规划模型是有效的,在进行算法设计和求解前对数据是很有必要的。 由采集设备采集到的声音信号中,可能夹杂着很多电子噪声和背景噪声,污染了有用信号,为了抑制噪声影响便于后续信号的分析,需要进行预处理。为了避免无声段的处理,我们常常需要先将有用信息从时间序列中提取出来,这就是端点检测。
振幅标准化由于语音数据采集的条件不致, 可能出现每句语音的声音数据强度彼此差异。在我们的三麦克风树实时采集系统中,声源到远端和近端的麦克风空间距离差距大或者各通道信号增益不一致时,信号幅值相差很大。而后续的分析处理、特征提取步骤中,都会使用到语音幅值信息,比如设定设定跟幅值相关的阙值,或者选取于幅值大小相关的合适参数。语音幅值的差异容易直接导致算法处理大量语音数据时的鲁棒性下降,效果变差.因此,有必要对输入语音数据进行幅度标准化。[1]
滤波去噪语音信号为带限信号,能量集中在100Hz到70kHz之间,而采集信号中包含的背景噪声和信道噪声则可能弥漫在整个频谱空间,这样在低频和高频段主要为噪声,我们可以采取带通滤波器将其滤除。
加窗处理因为语音是一种典型的非平稳信号,可对其进行加窗处理,即用一个有限长度的窗序列截取一段语音信号进行分析。[2]
二、问题的分析
讨论”麦克风树”定位的问题实际上就是利用在麦克风数量固定的条件下,利用不断变换各麦克风之间的位置(我们将其看为调整角度)、和距地高度,来找到一个麦克风阵列接收到回声的时间差进行计算与求解。在第一次人走动时我们求出一组方程,第二次改变人的位置可以再得到一组数据,利用两次数据进行求解,即可设计出精准的定位算法。在不知道大厅尺寸时,需要不断的旋转麦克风的角度和改变麦克风树距地高度与人与麦克风树之间距离来求出最远距离,利用时频预测推算出大厅尺寸。最简单的思维是在大厅的四角做四次实验,利用声源、麦克风树与墙壁之间的相对位置关系构建坐标系。设计了基于小波分析改良的Mallat算法,给出对麦克风的数量、俯仰角及方位角设置的决策建议,设置出最优的麦克风阵列组合,并测算出大厅尺寸。
首先选取三个麦克风作为麦克风阵列,利用麦克风树之间的位置和的声音到达时延差进行求解,设置麦克风俯仰角、方位角、距地高度构建三维空间直角坐标系;利用基于遗传算法的MP算法对声音进行去噪处理,将声音信号分解和重构,最终将声音信号表示为时频的线性组合,建立多目标线性规划模型来确定声源,达到定位目的。最后求解出改良后信号毛刺最少的一组解,对麦克风树的改良提出决策意见。
三、模型的建立与求解
3.1模型的准备
首先对不平稳的人的声音进行信号压缩,利用MATLAB模拟得到图像如下。
接下来对信号进行去噪处理,以抑制信号中无用部分,增强有用部分总而更加准确计算出时间差,使用MATLAB处理得到图象。
通过图象可以看出强制应用去噪更光滑,但可能丢失一些有用部分,模型使用默认阈值去噪,以达到同时在时频范围内对声音进行分析,实现对非平稳的人声音的去噪。
最后对信号进行分离,加声音这个非平稳的加噪信号分离以排除其他因素的影响,达到声音定位更加精确的目睹。
3.2模型的建立与求解
假定在空间直角坐标系中之中,有m个麦克风,间距为d,麦克风树高为h,麦克风单价为z,成本函数为W(m)=mz。
对其进行多目标性规则分析,人距麦克风距离为x,俯仰角为,方向角为β。
假定大厅轮廓为3m X 4m X5m
3.3模型的仿真
下面在一个三维空间直角坐标系中,模拟3m×4m×5m 的大厅轮廓,。将声源位置定为(0,0,0)。输入语音信号以72kHz的采样率进行采样,设测试的语音长度为3s。麦克风阵列的结构为“三麦克风阵”初始值设为0矩阵。确定俯仰角和方位角,每个阵元采集1000个点,用两次时间差确定位置。
下图为matlab仿真处理结果。
经比较模型较为准确的预测人的位置,模型合理。三元阵在线性规划中成立,带入公式即可求出角度与高度,设计了较为准确的麦克风阵列模型。
参考文献
[1]杨祥清.声源定位算法及实现.中国科学技术大学,硕士学位论文.2007.
[2]周峰.室内麦克风阵列声源定位算法研究和实现.复旦大学,硕士学位论文.2009.
[3]麦克风阵列仿真及实现. 佚名.中文论坛,https://www.ilovematlab.cn/thread-5926-1-1.html?s_tid=LandingPageTabqa,matlab.
[4]温正,孙华克.傅里叶转换到小波分析.MATLABA智能算法,清华大学出版社p321.2017年版
因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- 69lv.com 版权所有 湘ICP备2023021910号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务