如今音频质量非常重要。 人类的耳朵具有很强的识别能力,但也可以看出对话的可听性和清晰度是一项挑战。

博士Carlos Pantsios Markhauser *

近年来在电视新技术已经进入了被称为超高清电视(UHDTV),其具有屏幕(4万像素),其电视HDTV,8.3p每图像1080倍以上像素的世界市场(2Mpix)。 UHDTV电视技术还具有其他突出特点,例如:

- 广告 -

1)动态范围明显更高,
2)图像的更好的时间再现(通过更高的时间频率),
3)显着更大的色彩再现(由于扩展的色彩空间),
4)再现图像中的更多细节(分辨率)。

尽管视频中提到了很大的优势,但几乎没有人意识到伴随UHDTV视频的音响系统也发生了重大变化。

UHDTV有一种全新的声音体验
首先,重要的是要强调人类感知音频和视频的差异,即音频和视频产生的体验之间的差异。 例如,在实践中,可以同时在同一电视屏幕上完美地观察两个或更多个图像。 电视图像本质上是有限的并且通常是二维的。

由于传输或视频处理的错误而导致信息丢失的间隔的存在并不完全使用户对失真图像的理解复杂化。 然而,这些损失对他的观众来说无疑是令人讨厌的。 与上述相比,理解同时出现在用户身上的几个音频真的很复杂。

立体声音频是一种无限的体验(如果用户坐在正确的位置)并且音频中信息丢失的间隔的存在会迅速降低用户理解所发生情况的能力。

此外,如果音频失真,可能会导致人的身体疼痛。

改善音频体验的因素
所提到的感知差异表明必须考虑大量因素以显着改善音频体验。 以下是应该考虑的三个方面:

1区域: 众所周知,观众广泛地重视交互能力,但是相当于第二屏幕的音频不起作用。 那么,除了传统的音量控制之外,如何创建更完整的交互?

2区域: “沉浸式”今天的音频,但它会知道这方面的经验是否可以改善呢?很有趣,有没有可能是在3D真正的音频体验能够成功地发挥作用,即使在3D stereographs图像不能?

同样重要的是问问自己,是否有可能提供这种更加身临其境的体验,而不会使生产工作和完成程序的分发过程过度增加,而且复杂性和成本会增加很多? 最后,是否可以通过单声道,立体声或耳机收听节目的用户可以访问的方式进行上述操作?

3区域: 如今音频质量非常重要。 人类的耳朵具有很强的识别能力,但也可以看出对话的可听性和清晰度是一项挑战。 这里的一个重要问题是如何调整和定制音频体验,使其适用于不同的偏好,一系列技术和各种聆听环境。

目前正在努力寻找不同的技术,使我们能够令人满意地完成以下三个重要领域:
1)互动,
2)沉浸和
3)适应(也称为个性化)。

到目前为止,该技术已经显示出最佳效果,与当前基于通道的技术向后兼容,是基于对象(音频对象)的音频。

在传统的世界中,使用基于频道的格式来表示节目的音频内容。 这里,存储在文件中的多个信号以流分布,并且每个信号对应于程序。 称为广播波形格式(BWF)的技术目前不定义每个流在文件中表示的内容,也不是Microsoft所基于的Wave Format技术。

根据可用频道的数量假设扬声器的布置,并且扬声器的位置也基于频道号。 例如,具有两个音频通道的程序意味着立体声格式; 信号对应左右扬声器,必须放置在60分离度。 使用此系统时,如果有两个以上的通道,问题会很快发生。

对于5.1格式的内容,有不同的方法允许订购频道,并且没有可靠的方法只从文件中知道使用了哪种约定。 F64是兼容的多声道BWF格式,它使用声道掩码使用描述性标签将声道映射到扬声器阵列,例如。 扬声器正面左。 这允许确定扬声器的位置,但是通道的顺序标识符和存储在XML文件中的元数据是用于描述通道的那些。 一组名为EBUCore的元数据可以更准确地定义给定文件中的内容。

多年来,研究人员一直致力于独立于扬声器配置的音频格式。 其中之一是基于对象的格式,它描述了场景中随时间变化的元数据的组件,提供了最大的灵活性。 对于广播公司来说,这种解决方案非常有吸引力,因为这些程序只能生成一次,并以不同的格式分发,这些格式是自动生成的。 这种新的BWF允许表示场景和音频对象,这使得广播公司可以传输和交换以这些格式生成的节目。

这种音频技术近来发展迅速,产生了新的标准。 基于音频的音频描述音频的一般表示,以单个值(或对象)结构化,每个值具有其元数据,其描述其关系,行为和关联。 元数据告诉AV系统中的“汇编器”如何以最佳方式组装所需演示中的音频对象,并且可以使用扬声器。

从概念上讲,这种技术方法非常强大和灵活,但要实现实际的实施,有必要先了解您希望首先关注哪些问题来解决相应的问题。

提出概念和解决方案
基于音频对象的技术最重要的概念之一是“渲染器”。 这在所谓的欧洲高级媒体论坛(FAME)中有所定义,该论坛是一个处理超高清(UHD),虚拟现实(VR)和其他新技术的研究和开发的组织。

最有可能的是,在现实生活中,有必要在不同的基于对象的演示文稿之间进行转码。 上述情况是由于高级戏剧制作需要使用大量物体(可能是数百个或更多)。 实际工作流程通常使用较少对象的子集进行操作,带宽限制将迫使使用较少的对象来为家庭提供适当和经济的输出。

此外,还需要评估的各种实现不同的音频效果的质量。 到目前为止,还没有用于评估与所实现的实现相对应的不同渲染的质量的技术。 被称为所谓的多种刺激的隐藏参考和锚点(MUSHRA)技术并不在这里工作,因为现在你有兴趣在评价“inmersiveness”的生产材料,而不是可能会出现在它的错误。

先前的定义还清楚地表明,为了使渲染器执行渲染,音频和元数据都是必需的。

这种近似灵活性的真正本质在于,可以开发渲染器以选择简单的发布版本,并以最佳方式为一组平台,设备和情况实现它。 如果是这种情况,那么就会遇到新的挑战,因此,创意工作组将对音频节目在家中的发声方式有一个非常遥远的想法。

这就提出了需要渲染的基准和监测安排是否允许有代表性的评估,这被应用到相应的生产问题。 皇冠基于扬声器专业配置对象的音频播放,它也被添加,通过设计师的渲染器,当它在不对称布置,提出了如何产生巨大的声音更困难的挑战中常用的家

目前,您可以看到4k(UHDTV)中新一代电视的消费市场的实施,这些电视继续配备传统的广播音频技术。 然而,最新的音频解决方案与UHDTV技术无关,并且可能适用于标准TV接收器以及标准光盘。

结果,基于音频对象的技术正在出现,在许多地方出现。 例如,杜比拥有其ATMOS解决方案(包括家庭影院)核心的对象,并将其基于对象的技术作为AC4标准的一部分。 DTS推出了多维音频格式(MDA)。 Farelight在其3DAW音频工具中实现了ATMOS和MDA工具。

BBC最近发现的发展身临其境,个性化和上2014的IBC和MPEG-H的显示基于交互的音频对象的几个例子被构造成“对象准备”用于递送不仅3D广播音频同时也为游戏和视频会议。

在不久的将来,音频部分会有很大的变化,为此,我们必须做好充分的准备。

*卡洛斯Pantsios Markhauser是电信工程师和硕士学位,从西蒙·玻利瓦尔大学通信,电信网络和卫星网络的乔治·华盛顿大学主修 - 在科罗拉多大学波尔得分数字通信大学工程与应用科学,专业的学校。 他的作品在大学电信西蒙·玻利瓦尔和安德烈斯·贝略天主教大学研究生院教授。 除了在阿根廷的电视项目的专业顾问。

Richard Santa,RAVT
作者: Richard Santa,RAVT
编者
安蒂奥基亚大学(2010)的记者,拥有技术和经济学方面的经验。 杂志TVyVideo + Radio和AVI Latin America的编辑。 TecnoTelevisión&Radio的学术协调员。

赞助商














其他新闻

文章缩略图如今音频质量非常重要。 人类的耳朵具有很强的识别能力,但你也可以看到......
文章缩略图管理公司可持续发展所必需的组织知识,是......中出现的主要挑战之一。
文章缩略图我们所知道的电视实际上对于没有它们的直播活动和平台来说应该改为......
文章缩略图随着行业在各个方面的转变和寻找定义,必须拥有......
文章缩略图所有这些元素,都对所有现场视频制作计划的成功至关重要......
文章缩略图如前一部分所述,从九十年代后期到现在,随着......的出现和随后的整合......
文章缩略图从历史上看,墨西哥在区域广播行业中处于技术和视听制作的最前沿,在......
文章缩略图能够在不到一分钟的时间内修复野外纤维的事实使他赢得了许多朋友,特别是在视听紧急情况下....
文章缩略图连接到网络的设备可以充当资源池,以有效地共享这些资源,例如,允许......
文章缩略图第一部分旨在了解Netflix商业模式和其他内容分发平台的工作原理......