审听训练与音质主观评价——笔记

news/2024/9/23 19:23:28

Chap01. 声音与人耳听觉

生理听觉

人耳的结构分为外耳、中耳和内耳,如下图:

img

  1. 外耳的耳廓首先会对到来的声音进行一定程度的反射,这些细微的变化能够辅助人即使在利用单耳时识别声音的方向(耳廓效应)
  2. 由于鼓膜的阻挡,耳道是一个封闭的管子,这种结构具有管共振效应,最佳共振频率约为3.4kHz,这部分的声音由于共振被加强,导致人耳对此敏感
  3. 鼓膜被声波驱动,从而驱动与其连接的听小骨,听小骨由三块骨头链状衔接组成,分别是锤骨、砧骨和镫骨
  4. 锤骨附着在鼓膜上,镫骨则附着在耳蜗的卵圆窗上,耳膜驱动锤骨,锤骨驱动砧骨,然后是镫骨,最终到达卵圆窗。
  5. 耳蜗由蜗管卷曲起来形成蜗牛状,是一个换能器,负责将接收到的震动转化为生物电信号传递给
    1. 耳蜗中充满液体,震动使得液体产生波纹
    2. 波纹推动毛细胞术运动,从而产生电信号
    3. 耳蜗底部的毛细胞能够检测高音调的声音,而顶部则用于检测低音调的声音

推荐视频:精妙到不可思议!2分钟科普:人是如何听到声音的?

耳蜗不同区域对音调的感知:

img

心理听觉

  1. 音高虽与频率相关,但强度也会引起音高感知变化
  2. 响度虽与强度相关,但与频率也相关
  3. 音色虽与频谱相关,但瞬态特性也会产生影响

思考题

本人的想法,不一定准确

  1. 人耳可听频率范围是多少,频率与音高有什么样的关系

    20Hz到20kHz,基频越高我们听到的音高越高

  2. 声压与声压级的关系如何?声压增加一倍,声压级提高几分贝?

    声压是声音震动对空气的扰动程度,是在本来的大气压下叠加上去的压强。声压级是声压与参考声压级的比值取常用对数再乘以20,用于以更小的数字表示声压大小。后面一个问题不会算。

  3. 乐音与噪音从物理属性上的区别是什么

    乐音的振动有明显的基波,可以识别音高,噪音的震动杂乱无章,无明显基波,无法识别音高

  4. 粉红噪声的名称由来是什么?与白噪声有何区别?

  5. 根据人耳的构造,说明为什么人耳对3kHz到4kHz的声音最敏感

    外耳道和鼓膜形成了一段封闭的管,人耳普遍的形状导致该管的最佳共振频率是3.4kHz左右,所以3k到4k的声音得到了加强

Chap02. 音高感知与频谱均衡

Chap05. 空间感知与声场建立

方位坐标图

声源方位可以由下图坐标系\((\phi, \theta, r)\)表示,\(\phi\)是声源对于听音者的垂直方位角,\(\theta\)是水平方位角。

img

\(\phi\)确定水平面,\(\theta\)确定中垂面,当\(\phi = 0, \theta=0\)时,声源位于听音者正前方。

方向定位

\(\phi\)固定,即在水平面上,\(\theta\)移动时

  1. 人对正前方的方向分辨率最高(1到3度)
  2. 随着向侧方移动,方向辨别阈(人耳察觉方位变化的最小角度,越小越好)逐渐增加,正左侧和正右侧最大,约为正前方的3到10倍
  3. 随着移动到后方,辨别阈逐渐减小,约为正前方的2倍

说明声音在水平面的不同方位人耳的感知灵敏度是不同的,正前方最灵敏,左右侧最不灵敏,后侧稍微灵敏一些也比不过正前方

自由场(理想声学环境,声波自由传播,不受任何反射、吸收或散射的影响)下,对单一声音方向定位因素包括:

  1. 双耳效应:由双耳信号差异产生的定位效应,时间差、声压级差,主要用于水平方向定位

    1. 双耳时间差(ITD):当声音位于中垂面时,ITD=0,当位于正侧方时,ITD最大,约为0.6到0.7ms。研究结果表明频率\(f>=1.5kHz\)时ITD不再起主要作用
    2. 双耳声级差(ILD):频率\(1.5kHz<f<4kHz\)时,ITD和ILD同时起作用,\(f>4kHz\),ILD为有效定位因素
  2. 耳廓效应:当声源处于垂直方向不同位置时,由于声音到达位置不同,经耳廓不同程度的反射后,反射声和直达声之间的强度比、在不同频率上的时间差以及相位差会在鼓膜处形成一种与声源方向位置有关的频谱特性。导致我们识别出声音的垂直位置

    img

    下图为声源位于中垂面,仰角分别为-10、0以及10度时在人头模型上测得的耳廓响应曲线,响应变化主要集中在高频

    img

  3. 人头转动

距离定位

  1. 响度(自由场):距离增加一倍声压级下降6dB

  2. 直达声和混响声的声能比:混响半径\(r_r\)是指直达声和混响声声能相等的位置,当声源距离\(r<r_r\)时,直达声为主,响度起主要作用,当\(r>r_r\)时,混响声为主,总声压级几乎恒定,响度不再起作用,直达声与混响声的声能比\(D/R\)为估测距离的有效因素

    img

  3. 空气对声波的吸收所引起的高频衰减:声源非常远时起作用,普通房间尺寸忽略

感知声源宽度(ASW)

  1. 早期反射声是影响ASW的重要因素,取决于早期反射声的宽度和延时时间
  2. 人们偏爱更宽阔的ASW
  3. IACC_e越小,ASW越宽
  4. 侧向声能比LF越高,ASW越宽

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/46737.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

鸿蒙生态伙伴SDK市场正式发布,驱动千行百业鸿蒙原生应用开发

6月21-23日,华为开发者大会(HDC 2024)在东莞举办。在22日举办的【鸿蒙生态伙伴SDK】论坛中,正式发布了【鸿蒙生态伙伴SDK市场】(以下简称:伙伴SDK市场),伙伴SDK市场是为开发者提供各类优质、安全SDK的聚合平台,帮助开发者便捷搜索、选取和使用能力丰富的SDK,轻松、高…

加速鸿蒙生态共建,蚂蚁mPaaS助力鸿蒙原生应用开发创新

6月21日-23日,2024华为开发者大会(HDC 2024)如期举行。在22日的【鸿蒙生态伙伴SDK】分论坛中,正式发布了【鸿蒙生态伙伴SDK市场】,其中蚂蚁数科旗下移动开发平台mPaaS(以下简称:蚂蚁mPaaS)在论坛中提出,已正式推出鸿蒙原生Beta版能力集,覆盖手机、IoT等终端,企业、机…

数学一|概统|五、大数定理与中心极限定理

考试要求了解切比雪夫不等式; 了解切比雪夫大数定律、伯努利大数定律和辛钦大数定律(独立同分布随机变量序列的大数定律); 了解棣莫弗-拉普拉斯定理(二项分布以正态分布为极限)和列维-林德伯格定理(独立同分布随机变量序列的中心极限定理)1.1 马尔可夫和切比雪夫不等式…

dotnet 融合 Avalonia 和 UNO 框架

现在在 .NET 系列里面,势头比较猛的 UI 框架中,就包括了 Avalonia 和 UNO 框架。本文将告诉大家如何尝试在一个解决方案里面融合 Avalonia 和 UNO 两个框架,即在一个进程里面跑起来两个框架现在在 .NET 系列里面,势头比较猛的 UI 框架中,就包括了 Avalonia 和 UNO 框架。本…

RSpromoter:基于视觉模型的遥感实例分割提示学习

RSpromoter:基于视觉模型的遥感实例分割提示学习 摘要-利用来自SA-1B的大量训练数据,分段任意模型(SAM)展示了显著的泛化和零样本能力。然而,作为一种与类别无关的实例分割方法,SAM在很大程度上依赖于先前的手动指导,包括点、框和粗粒度掩码。此外,它在遥感图像分割任务…

ABC359 G - Sum of Tree Distance

题目链接 题目大意 给出一棵树,树上每个节点都有一种颜色,求所有颜色相同的节点两两之间距离的总和。 题解 想来写题解主要是看了一下官方解法都写的需要“重心分解”,应该是对应中文语境下的树的点分治。实际上点分治写起来很费事,可以用启发式合并替代。 具体来说,dfs时…

Spring Boot

第一个SpringBoot应用 项目结构根package:com.zyj.learnSpringBoot要求main()方法所在启动类放在根package下Application @SpringBootApplication public class Application {public static void main(String[] args) throws Exception {SpringApplication.run(Application.cl…

算法流程图

算法流程图 一. 有一个处理单价为2元饮料的自动售货机软件,该软件负责控制两个LED显示灯(红,绿)和控制饮料的送出。待机状态,显示红灯。若投入2元硬币,LED绿灯闪烁,之后按下“可乐”、“雪碧”或“红茶”按键,显示绿灯,相应的饮料就送出来。画出该过程的流程图 分析:…