我国 AVS VR 音频团体标准发布,字节跳动、腾讯、小米、华为等起草

发布时间:2023-12-19  

12 月 19 日消息,据“新一代人工智能联盟”公众号消息,2023 年 12 月 7 日,中关村视听产业技术创新联盟批准发布《信息技术 虚拟现实内容表达 音频》(标准号 T / AI 125-2023)团体标准。起草单位包括:

清华大学、北京理工大学、中国电子技术标准化研究院、北京字跳网络技术有限公司、赛因芯微(北京)电子科技有限公司、北京全景声信息科技有限公司、清华大学天津电子信息研究院、北京大学、咪咕文化科技有限公司、腾讯科技(深圳)有限公司、北京爱奇艺科技有限公司、小米通讯技术有限公司、全景声(北京)智能科技有限公司、华为技术有限公司、中国传媒大学。

图片

▲ 图源“新一代人工智能联盟”公众号

据介绍,AVS VR 音频团体标准《信息技术 虚拟现实内容表达 音频》的正式制定起始于 2016 年 6 月举行的工作组第 57 次会议,AVS 音频组输出“AVS 虚拟现实音频技术方案征集书 V1.0”,启动虚拟现实中沉浸式音频编解码及渲染技术的征集工作。

2020 年 4 月 7 日,经新一代人工智能产业技术创新战略联盟和中关村视听产业技术创新联盟标准工作组联合审议决定立项 AVS VR 音频团体标准。

AVS VR 音频团体标准历经工作组正式和临时加会议 41 次,共收到 VR 音频相关提案 115 项,被采纳的技术提案 39 项,于 2022 年 11 月 25 日形成 AVS VR 音频团标 FCD。

2023 年 1 月 6 日 AVS VR 音频完成团标征求意见稿的组内公示后,形成了送审稿,并在 2023 年 10 月 26 日通过了全国信标委多媒体分委会的审查,终于 2023 年 12 月 7 日形成团体标准正式发布。

AVS VR 音频标准描述了虚拟现实音频表达所需要的元数据、渲染器及面向传输的数据流方式,支持 3DOF 和 6DOF 等虚拟现实场景下所需要的技术功能,涉及基于声道、对象、场景三类信号的采集制作和渲染回放等相关技术描述。AVS VR 音频标准中采纳的所有技术均依据 VR 音频测试方案进行了第三方测试验证,包括规范性验证,功能性验证和渲染效果主观测试,并在实际系统中进行了系统验证。

标准中的相应技术在各大赛事、活动中也早有应用。2022 年 9 月中央广播电视总台“云听”客户端使用 AVS VR 音频标准中的耳机渲染技术完成 CCTV 中秋晚会现场直播;2022 年 11 月世界杯央视转播演示系统使用了 AVS VR 音频标准中的扬声器渲染技术进行监听,从制作端生成元数据下发,并按制作者意图生成实时、动态元数据下发,实现了制作、监听与下发数据的完整流程。同时,AVS VR 音频双耳渲染技术还在 VR 头显设备中基于 Unity3D 软件平台进行了 3DOF 和 6DOF 下的主观听音测试验证。

AVS VR 音频标准在遵循 ITU-R BS.2076-2 规范的前提下,面向适应我国全景音频播出、沉浸式音频通信、虚拟现实音频交互等领域,提供虚拟现实音频内容的元素定义、编码规范和渲染重建建议,服务于虚拟现实(VR / AR / MR / XR)设备和相关系统中的音频应用。

结合国内虚拟现实音频产业发展的实际情况,按照 AVS 工作组的标准制订流程和 AVS 音频组工作规范,在 AVS 音频组的组织下,依照技术需求,审议技术提案、制定测试方案、进行测试和评比,采纳满足技术需求且性能更优的技术提案,构建标准技术的基础架构,通过标准文本编辑、参考软件验证形成标准草案。该标准填补了国内虚拟现实音频技术标准的空白,并争取为相关国际标准的制定发挥关键作用。

该标准将首先作为 AVS 团体标准发布,并申请成为国家标准和 IEEE 国际标准发布。

新一代人工智能产业技术创新战略联盟(AITISA)由两百余家来自人工智能行业内的企业、高校和科研院所、资本机构、服务机构、创新创业企业组成。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

相关文章

    有的音乐播放功能外,还具备强大的MPEG-4视频播放能力,另外,恰好“4”在“3”后,从这点出发,把MP4等同MPEG-4是合理的   mpegmp4区别   二者的区别是,MPEG4是一系列编码的名字,而......
    西门子1200与300的九大区别;一、硬件的区别 在硬件扩展方面,S7-300的主机架多支持八个扩展模块,而S7-1200支持扩展多八个信号模块和多三个通信模块。以S7-300 CPU313CS7......
    吸类医疗器械,早已是兵家必争之地。 该类器械涵盖的产品,包括呼吸机、制氧机、雾化器等。三种产品的区别在于,雾化器是一种给药装置;制氧机是造氧装置,涵盖了氧气瓶/袋/机,要求......
    成的视频文件比 VCD (MPEG1)好是一点也不奇怪的,但这样的话,就失去了 ASF 本来的发展初衷,还不如干脆用 N AVI 或者 DIVX 。但微软的“子第”就是有它特有的优势,最明......
    20、30、40或者60,为CPU性能参数等级。 1、SRST****的区别 表 1 ST可变为SR,加中间继电器即可,但是SR不能变为ST,因为继电器达不到晶体管的开关速度。 2、20、30、40......
    、IrDA、Zoom Video、AC97或I2S、SSP、PWMI2 C.SM501的2D引擎包括一个前端色彩空间转换器,支持4∶11∶8的比例。LCD视频流水线支持一个YUV色彩空间转换。通过......
    脉冲信号 13、RS232、RS422RS485的区别......
    MCS-51单片机指令系统(4);某些指令说明 -“读引脚”“读锁存器”指令的区别 关于并行I/O口的“读引脚”“读锁存器”指令的区别 例如,当P1口的P1.0引脚外接一个发光二极管LED的阳......
    ch32f103stm32的区别;STM32 系列是意法半导体公司旗下的 ARM Cortex-M3 Cortex-M4 微控制器,系列产品将 MCU 和专用模块集成到单一芯片中,广泛......
    、WinCE、Android这样的“高级”的system,叫做嵌入式   2、Heap(堆)Stack(栈)的区别 Heap(堆)上的空间是手动分配和释放的,Stack(栈)上的......

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>