B播
f
//«•»顧
y.-i>:- ' .>i.p'H f.:T ikc
文献引用格式:陈小平.AES专论-双耳技术(二):双耳信号合成中HRTF的实现建模[
J].电声技术,2018 , 42(5) :36 - 41.
CHEN X P. HRTF Implementation modelling in binaural synthesis[ J]. Audio engineering, 2018 , 42(5) :36 -41.
文献标志码
中图分类号
:TP912.27 :B DOI:10. 16311/j. audioe. 2018.05.009
AES专论-双耳技术(二):
双耳信号合成中HRTF的实现建模
陈小平(编译)
(中国传媒大学音乐与录音艺术学院,北京100000)
摘要:在简述头相关传输函数HRTF及其原始数据获取方法后,介绍了双耳信号合成中HRTF的预处理和HRTF的 “最小相位滤波器+纯延时”模型,最后筒述了双耳信号合成的两种实现方式。关键词:HRTF;HRTF预处理;最小相位滤波器;纯延时
HRTF Implementation Modelling in Binaural Synthesis
CHEN Xiaoping
(School of Music & Recording Arts, Communication University of China, Beijing 100000, China)
Abstract : After shortly describing the Head - Related Transfer Functions and the methods of obtaining HRTF by measurement or numerical calculation, the pre - processing of HRTF and the minimum phase filter + pure delay M model of HRTF in binaural synthesis are introduced. The two strategies of implementing binaural synthesis are mentioned lastly.Key words:HRTF; HRTF pre - processing; minimum phase filter; pure delay
l
弓丨言
头相关传输函数(Head - Related Transfer Func
3所示为几种不同的HRTF测量装置[1]。其中,图1 所示的方法较适合水平面和中垂面HRTF的测量, 图2的方法可以方便地测量所有方向的HRTF,图3 所示为采用仿真头测量。
进行HR1T测量时,传声器的放置有两个基本 方法[1]:
(1) (2)
外耳道堵塞式(测量传声器安装在一个外 外耳道开放式(微型探管传声器置入外耳
耳道硬模具里并置于外耳道人口处,如图1所示);
tions, HRTF 或 HRTFs ) 是双耳技术的基本出 发点,
它定义为从声源到听音者双耳的声传输路径的传 输函数。HRTF包含了这一声波传播过程所遇到的 一切声学现象,包括自由场传播、听音者头部的衍 射效应、肩部和躯干的反射以及耳廓的反射与衍 射。每个方向对应一对特定的传输函数。听觉系 统能够从HRTF中提取方向信息,然后经过听觉分 析后得出声音方位感。当用两只插入听音者外耳 道的微型传声器进行某个声景录音时,空间信息自 然就以其个人特有的一套HRTF置人所录制的声音 中。在双耳信号合成时,空间信息是通过人为将声 音信号与HRTF滤波器(也称为双耳滤波器)卷积 后置入的。
道且尽量靠近耳鼓)。
第一种方法的优点是,传声器放置的位置相对 固定,因此可多次放置重复测量,信噪比较高,但是 没有对外耳道的传输函数进行测量。由于这部分 传输函数与声源的方向无关,因此,这种方法测得 的HRTF不会丧失任何声源空间定位信息。第二种 方法被公认为标准的HRTF测量方法,但也存在一些 缺点:由于每次测量的位置会发生微小变化,使得测 量的可重复性变差;探管传声器低频特性存在下限; 外耳道的»^频率特性测量产生显著干扰[1] 〇
2
HRTF原始数据的获取
获得HRTF的最佳途径是声学测量。图1 ~图
网
m
裨釣垮奶■曲叫让:丨
irip:._V.WioEjcn
廨繽顧
^
;
I^f.w ift'rf -V^
a破试坐在H形稱架中心沿##!)(移动)
b被试头部蜓否转动BJ由磁性头榷典踪埋轚%
图1
荷兰
c »|ft传声咎〔扑耳:滋坊塞式
TNO的HRTF测量装置[1]
图2法国
IRCAM的HRTF测量装置[1]:
被试的座椅安装在可转动的底座上以改变水平方位角(扬声器的垂直方位角可调)
图3
ISVR的HRTF测量装置(英国南安普敦大学)[1]
J3^
• PII # -IS:^ i : lutp://^ udittEm
声学
B
播
f
//«•»顧
y.-i>:- ' .>i.p'H f.:T ikc
HRTF测量是一项繁杂的工作,有以下几个
HRTF幅度频谱除以参考方向的幅度频谱。自由场
均衡通常以正前方(水平方位角P =〇°、垂直方位 角或仰角0 =0°)为参考方向。扩散场均衡则采用 将
原因:
(1) 理想情况下需要在消声室进行测试;(2)
误差小于1°至2°,为此需要高质量有效控制的机械 设备;
(3) 所有方向的HRTF幅频特性平均后作为参考函数, 必须能够很好地控制扬声器位置,使方向
HRTF幅度频谱与之相除。
其次,可以对HRTF频率特性进行平滑处理,消
被试相对于扬声器的方向必须有恰当的装 除幅频特性曲线上微小的波动。研究表明[2],高达
置跟踪监视;
(4)
为了测得球体所有方向的成千甚至上万个
HRTF,被试需要持续站立1至2小时,并保持头部
静止状态,这无疑是一项艰巨的工作。
到目前为止,只有少数机构具有这样的测量条 件。也有一些机构提供免费的HRTF数据库,例如, 法国 IRCAM (网址:http://recherche. ircam. fr/e-
quipes/salles/listen,51 个被试、187 个方向)、日本
东北大学(网址:http://www. ais_ riec. tohoku. ac. jp/
lab/db - hrtf/index. htm、3 个被试、4 个方向)。
另一种获得HRTF的方法是数学建模计算。计 算方法分为有限兀法(Finite Element Method,FEM) 和边界兀法(Boundary Element Method,BEM),它们 都是基于对听音者头部形状进行网格化建模。建 模计算存在高频上限问题,因为精确建模需要在一 个波长内至少设立6个结点,如果要对频率高达 20kHz进行建模,网格的密度将非常高,尤其是耳廓 部分,将极大地增加计算量并耗费计算时间。此 外,创建髙频网格模型需要操作复杂的专用设备, 例如,高精度3D激光扫描仪或MRI(核磁共振成 像),而这些并不是研究机构的常规设备。
3
双耳信号合成中HRTF的实现建模
3.1
HRTF
预处理
在实现HRTF滤波器前,需要对其进行预处理。 预处理的目的是使HRTF在保留空间感信息的同 时,使其频谱特性曲线的波动尽可能小。由于空间 感信息部分地基于频谱的变化,任何对HRTF的改 变都可能影响到定位线索,从而影响声音的空间感 质量和虚拟声源的真实感。另一方面,HRTF的频 谱特性又使声源的音色变差。因此,HRTF预处理 应在空间感和良好音色之间取得平衡。
首先,可以对HRTF进行均衡处理。均衡处理 分为自由场均衡和扩散场均衡[1]。所谓自由场均 衡,就是选取某一方向为参考方向,将所有方向的
閱如1碎制券鈣曲
二分之一倍频程带宽的频谱平滑处理,不会明显影
响和劣化声音定位性能,似乎SC(Spectral Cues,频 谱线索或频谱定位信息)对频率的分辨率并无很高 要求,频率分辨率甚至可以低于听觉滤波器。
均衡和平滑处理后,HRTF函数的幅频特性起 伏更小、变化更慢,如图4所示。这不仅使频谱失 真最小化,而且也便于双耳滤波器的实现。
(采用听觉滤波器对应的频率分辨率进行平滑 处理,被试R.N.,左耳,水平面,= -45°,数据源
于 Orange Labs)
3.2用“最小相位滤波器+纯延时”表示HRTF
3.2.1模型介绍
在双耳信号合成中,用于实现HRTF的最常用
模型是“最小相位滤波器+纯延时”[1]。最小相位 滤波器代表HRTF的幅度频谱特性;纯延时代表
HRTF所含的时间信息,即相位频谱特性。
设趴/)为需要实现的HRTF函数,则最小相位 滤
波
器
(P定义为[1]
\\Hminphase(p\\ = \\HCf)\\
(1)
= »[TH( - l〇g( |H(f) |))] ^
其中,TH代表希尔伯特变换(注:因果系统传 输函数的实部与虚部之间满足希尔伯特变换,同 理,最小相位函数的ln|tf(yw) |与p(w)之间也满
<_鑪 _ 投稿网址;■ hltp:/7AiicHoEjcn
廨繽顧
^
;
I^f.w ift'rf -V^
足一定的关系,构成一个变换对,称为波特关系式, 上式源于此关系式,详见有关参考书)。可见,最小 相位滤波器仅由HRTF的幅度频谱决定,仅与ILD
(Interaural Level Difference,双耳声级差)和 SC 有
关。纯延时则代表HRTF的相位特性,可以通过评 估 HRTF 或 HRIR ( Head - Related Impulse Respon
ses,HRTF 的时域表示) 的延时得到。在实现滤波
器时,通常只实现代表双耳延时差的一个纯延时, 被加到对侧的HRTF。此外,这个延时并不包含
HRTT的所有延时信息,因为最小相位滤波器本身
还存在延时。
整个建模过程如图5所示,要点说明如下:(1) 最小相位滤波器的幅频特性与原始HRTF
完全相同;
(2) 最小相位滤波器的相频特性仅由HRTF频特性决定,与原始HRTF相位无关;(3) 剩余相频特性为原始HRTF相频特性与最 小相位滤波器相频特性之差;
(4)
由剩余相频特性导出纯延时,即线性相位
特性,替代之并由此引人相位特性误差。
剩余相频特性用纯延时表示是否合理?事实 上[3],听觉并不能分析和感知全部的相位频谱信 息,至少不能感知其细微的变化;当频率髙于1. 5
kHz时,双耳相位差(IPD)并不能被听觉有效转换
为 ITD(Interaural Time Difference,双耳时间差)。听 音实验表明[4],听觉并不能区别原始HRTF相频特 性与纯延时的差异,相频特性中细微的变化在听感 上是无关紧要的,允许简单地用纯延时替代。3.2.2纯延时的计算
在双耳滤波器的“最小相位滤波器+纯延时” 建模中,主要有四种计算纯延时的方法[1],分别是 根据相频特性的斜率计算、根据HRIR的第一个峰 计算、根据双耳互相关函数最大值计算以及根据群 延时计算。在任何一种方法中,延时都是从剩余相 频特性进行计算。除了双耳互相关函数法,其他方 法中左耳和右耳的延时需要分别计算,然后求差值 得到纯延时。
(1)根据相频特性斜率计算
此方法是通过线性回归法计算剩余相频特性 的斜率。回归法只应用于有限频率范围,例如,1~ 5 kHz或0.5 ~2 kHz。因为ITD主要在低频段作为 定位依据,在高频段,由于听觉系统不能够从相位 信息分析出ITD,定位的主要依据是ILD而不是
ITD,因此,可以把重点放在低频段时间信息的提
•费妓•
收科网土上:I
m.l ioPUT
C «余相桷恃1*1
d汁iiilM戌I■〖扣位特竹
s MJ饯扦相鉍特性代余ffl輞特竹fci产t
的相纪特扑读衫
图5 “最小相位滤波器+纯延时”模型[1] (被试R.N.,左耳,水平面,供=-45。,
数据源于Orange Labs)
取上。
幅 声学
B
播
f
//«•»顧
y.-i>:- ' .>i.p'H f.:T ikc
Copyright © 2019- 69lv.com 版权所有 湘ICP备2023021910号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务