在存在混响和多声源的复杂声学环境中,人的听觉系统可以知觉到目标声音。这一由Cherry提出的"鸡尾酒会问题"已成为认知科学、信息科学、声学、心理学、生理学、语音学等共同关注的问题。本项目基于此问题,开展跨学科的研究,探索多声源和混响条件下的双耳听觉机理。研究内容包括1、基于头相关传递函数相关的听觉机理研究,建立多声源条件下的双耳听觉定位模型;2、基于优先效应听觉机理研究,建立混响条件下的双耳听觉模型;3、基于心理声学实验对建立的双耳听觉模型进行评测。本项目的开展,有望揭示双耳在混响和多声源噪声条件下的听觉工作机制,建立新的抗混响、抗噪声策略,为手机、助听器和人工耳蜗等音频设备开辟新的设计思路,促进相关技术和产品的推广和应用,因此,本项目如果能取得进展,无论在基础科学理论还是社会经济发展上都具有重要的意义和必要性。
binaural auditory model;cock-tail party;HRTF(head related transfer function);precedence effect;reverberation
本项目在国家自然科学基金的资助下开展复杂声音场景下的双耳听觉模型的研究工作,经过四年的努力,主要研究进展如下(1)针对多声源条件下的听觉定位模型问题,开展了基于低频双耳时间差双耳听觉模型、结构化头相关传递函数测量方法、基于低频信息的仰角感知、双耳相关和双耳延迟之间联系的研究工作;(2)针对混响条件下的双耳听觉模型问题,开展了混响条件对老年人和年轻人听感知能力的影响、混响条件下空间多声源采集方法及混响房间条件下虚拟听觉场景重建的研究工作;(3)针对复杂声学环境下,听觉模型在空间音频编码和定位方面的应用问题,开展了基于整形提升小波变换的音频无损编解码、基于正交解相关技术的参数立体声编解码方法、基于基追踪的音频无损压缩编解码方法及基于声道间传递函数的参数立体声编解码方法研究。本课题的研究成果在一定程度上揭示了双耳在混响和多声源噪声条件下的听觉工作机理,并在空间参数音频编解码及三维虚拟声音等领域获得应用。本课题的研究成果不仅取得了一定的学术价值,而且体现了一定的应用价值,可以预见今后会具有广泛的应用前景。