一文详解AR增强现实系统实现原理

发布时间:2024-07-04  

用户对现实世界感知的新技术。一般认为,AR技术的出现源于虚拟现实技术(Virtual Reality,简称VR)的发展,但二者存在明显的差别。传统VR技术给予用户一种在虚拟世界中完全沉浸的效果,是另外创造一个世界;而AR技术则把计算机带入到用户的真实世界中,通过听、看、摸、闻虚拟信息,来增强对现实世界的感知,实现了从“人去适应机器”到技术“以人为本”的转变。


AR技术原理

AR从其技术手段和表现形式上,可以明确分为大约两类,一是Vision based AR,即基于计算机视觉的AR,二是LBS basedAR,即基于地理位置信息的AR。

Vision based AR

基于计算机视觉的AR是利用计算机视觉方法建立现实世界与屏幕之间的映射关系,使我们想要绘制的图形或是3D模型可以如同依附在现实物体上一般展现在屏幕上,如何做到这一点呢?本质上来讲就是要找到现实场景中的一个依附平面,然后再将这个3维场景下的平面映射到我们2维屏幕上,然后再在这个平面上绘制你想要展现的图形,从技术实现手段上可以分为2类:

1、 Marker-Based AR

这种实现方法需要一个事先制作好的Marker(例如:绘制着一定规格形状的模板卡片或者二维码),然后把Marker放到现实中的一个位置上,相当于确定了一个现实场景中的平面,然后通过摄像头对Marker进行识别和姿态评估(Pose Estimation),并确定其位置,然后将该Marker中心为原点的坐标系称为Marker Coordinates即模板坐标系,我们要做的事情实际上是要得到一个变换从而使模板坐标系和屏幕坐标系建立映射关系,这样我们根据这个变换在屏幕上画出的图形就可以达到该图形依附在Marker上的效果,理解其原理需要一点3D射影几何的知识,从模板坐标系变换到真实的屏幕坐标系需要先旋转平移到摄像机坐标系(Camera Coordinates)然后再从摄像机坐标系映射到屏幕坐标系。

fb151f80-5cc1-11ee-939d-92fbcf53809c.jpg

在实际的编码中,所有这些变换都是一个矩阵,在线性代数中矩阵代表一个变换,对坐标进行矩阵左乘便是一个线性变换(对于平移这种非线性变换,可以采用齐次坐标来进行矩阵运算)。公式如下:

fb27b960-5cc1-11ee-939d-92fbcf53809c.jpg

矩阵C的学名叫摄像机内参矩阵,矩阵Tm叫摄像机外参矩阵,其中内参矩阵是需要事先进行摄像机标定得到的,而外参矩阵是未知的,需要我们根据屏幕坐标(xc ,yc)和事先定义好的Marker 坐标系以及内参矩阵来估计Tm,然后绘制图形的时候根据Tm来绘制(初始估计的Tm不够精确,还需要使用非线性最小二乘进行迭代寻优),比如使用OpenGL绘制的时候就要在GL_MODELVIEW的模式下加载Tm矩阵来进行图形显示。

2、 Marker-Less AR

基本原理与Marker based AR相同,不过它可以用任何具有足够特征点的物体(例如:书的封面)作为平面基准,而不需要事先制作特殊的模板,摆脱了模板对AR应用的束缚。它的原理是通过一系列算法(如:SURF,ORB,FERN等)对模板物体提取特征点,并记录或者学习这些特征点。当摄像头扫描周围场景,会提取周围场景的特征点并与记录的模板物体的特征点进行比对,如果扫描到的特征点和模板特征点匹配数量超过阈值,则认为扫描到该模板,然后根据对应的特征点坐标估计Tm矩阵,之后再根据Tm进行图形绘制(方法与Marker-Based AR类似)。

LBS-Based AR

其基本原理是通过GPS获取用户的地理位置,然后从某些数据源(比如wiki,google)等处获取该位置附近物体(如周围的餐馆,银行,学校等)的POI信息,再通过移动设备的电子指南针和加速度传感器获取用户手持设备的方向和倾斜角度,通过这些信息建立目标物体在现实场景中的平面基准(相当于marker),之后坐标变换显示等的原理与Marker-Based AR类似。

这种AR技术利用设备的GPS功能及传感器来实现,摆脱了应用对Marker的依赖,用户体验方面要比Marker-Based AR更好,而且由于不用实时识别Marker姿态和计算特征点,性能方面也好于Marker-Based AR和Marker-Less AR,因此对比Marker-Based AR和Marker-Less AR,LBS-Based AR可以更好的应用到移动设备上。

AR增强现实系统组成

Monitor-based系统

在基于计算机显示器的AR实现方案中,摄像机摄取的真实世界图像输入到计算机中,与计算机图形系统产生的虚拟景象合成,并输出到屏幕显示器,用户从屏幕上看到最终的增强场景图片。它虽然不能带给用户多少沉浸感,但却是一套最简单使用的AR实现方案。由于这套方案的硬件要求很低,因此被实验室中的AR系统研究者们大量采用。

fb626c9a-5cc1-11ee-939d-92fbcf53809c.jpg

Video see-through系统

头盔式显示器(Head-mounted displays-HMD)被广泛应用于虚拟现实系统中,用以增强用户的视觉沉浸感。增强现实技术的研究者们也采用了类似的显示技术,这就是在AR中广泛应用的穿透式HMD。根据具体实现原理又划分为两大类,分别是基于视频合成技术的穿透式HMD(video see-through HMD)和基于光学原理的穿透式HMD(optical see-through HMD)。

图表 Video see-through增强现实系统实现方案

fb734ae2-5cc1-11ee-939d-92fbcf53809c.jpg

Optical see-through系统

在上述的两套系统实现方案中,输入计算机中的有两个通道的信息,一个是计算机产生的虚拟信息通道,一个是来自于摄像机的真实场景通道。而在optical see-through HMD实现方案中去处了后者,真实场景的图像经过一定的减光处理后,直接进入人眼,虚拟通道的信息经投影反射后再进入人眼,两者以光学的方法进行合成。

fb840ce2-5cc1-11ee-939d-92fbcf53809c.jpg

三种系统结构的性能比较

三种AR显示技术实现策略在性能上各有利弊。在基于monitor-based和video see-through显示技术的AR实现中,都通过摄像机来获取真实场景的图像,在计算机中完成虚实图像的结合并输出。整个过程不可避免的存在一定的系统延迟,这是动态AR应用中虚实注册错误的一个主要产生原因。但这时由于用户的视觉完全在计算机的控制之下,这种系统延迟可以通过计算机内部虚实两个通道的协调配合来进行补偿。而基于optical see-through显示技术的AR实现中,真实场景的视频图像传送是实时的,不受计算机控制,因此不可能用控制视频显示速率的办法来补偿系统延迟。

fb98556c-5cc1-11ee-939d-92fbcf53809c.jpg

另外,在基于monitor-based和video See-through显示技术的AR实现中,可以利用计算机分析输入的视频图像,从真实场景的图像信息中抽取跟踪信息(基准点或图像特征),从而辅助动态AR中虚实景象的注册过程。而基于optical see-through显示技术的AR实现中,可以用来辅助虚实注册的信息只有头盔上位置传感器

AR增强现实的技术支撑

识别与跟踪技术

在实现增强现实的过程中,需要对真实的场景和信息进行分析,生成虚拟事物信息。这两步看似简单,其实在实际进行过程中,需要将摄像机获得的真实场景的视频流,转化成数字图像,然后通过图像处理技术,辨识出预先设置的标志物。

识别出标志物之后,一标志物作为参考,结合定位技术,由增强现实程序确定需要添加的三维虚拟物体在增强现实环境中的位置和方向,并确定数字模板的方向。将标志物中的标识符号与预先设定的数字模板镜像匹配,确定需要添加的三维虚拟物体的基本信息。生成虚拟物体,并用程序根据标识物体位置,将虚拟物体放置在正确的位置上。这其中涉及到的识别跟踪和定位问题,是增强现实的最大的难题之一。

要实现虚拟和现实事物的完美结合,必须确定虚拟物体在现实环境中准确的位置,准确的方向,否则增强现实的效果就会大打折扣。而在现实环境中,由于现实环境的不完美性,或者称为复杂性,增强现实系统在这种环境下的效果远不如在实验室的理想环境中。由于现实环境中的遮挡,未聚焦,光照不均匀,物体运动速度过快等问题,对增强现实的跟踪定位系统提出了挑战。

如果不考虑与增强现实进行交互的设备,其主要实现跟踪定位的方法有如下两种:

图像检测法

使用模式识别技术(包括模板匹配,边缘检测等方法),识别获得的数字图像中预先设置的标志物,或是基准点,轮廓,然后根据其偏移距离和偏转角度计算转化矩阵确定虚拟物体的位置和方向。

这种方法进行跟踪定位不需要其他的设备,而且精确度较高,因此是增强现实技术中最常见的定位方法。在模板匹配时,系统会预先存储好多种模板,来和图像中检测到的标志物匹配来计算定位。简单的模板匹配可以提高图像检测的效率,因也为增强现实的实时性提供了保障。通过计算图像中标志物的偏移和偏转,也能够做到三维虚拟物体的全方位观察。模板匹配一般用于对应特定图片三维成像,设备通过扫描特定的图片,将这些图片中的特殊标志位与预先存储的模板匹配,即可呈现三维虚拟模型。比如汽车店的车模卡片,玩具公司的人物卡片,都可以用模板匹配来进行增强现实。边缘检测可以检测出人体的一些部位,同时也可以跟踪这些部位的运动,将其与虚拟物体物体无缝融合。比如,真实的手提起虚拟的物体,摄像机可以通过跟踪用户手的轮廓,运动方式来调整虚拟物体的方位。因此,许多商场的虚拟商品实用,多会使用边缘检测。

虽然图形检测法简单高效,但也有其不足的地方。图像检测发多用于相对理想的环境以及近距离的环境,这样获得的视频流和图像信息会清晰,易于进行定位计算。而如果在室外环境中,光线的明暗,物体的遮挡,以及聚焦问题,使得增强现实系统不能很好的识别出图像中的标志物,或是出现和标志物相似的图像,这样都会影响增强现实的效果。而此时,就需要其他跟踪定位方法的辅助。

全球卫星定位系统法

这种方法是基于详细的GPS信息进行跟踪和确定用户的地理位置信息。当用户在真是环境中行走时,可以利用这些定位信息和用户摄像机的方向失误,增强现实系统能将虚拟信息和虚拟物体精确的低价到环境景物以及周围的人物之上。目前由于智能设备的普及,智能手机的广泛应用,而又由于智能手机具有支持基于GPS定位法的增强现实系统的基本组件:摄像机,显示屏,GPS功能,信息处理器,数字罗盘等,并把它们集成为一体,因此这种跟踪定位法多用于这种智能移动设备上。一种称为增强现实浏览器的应用程序,主要就是应用这种方法。增强现实浏览器能够在智能手机上运行,它可以连接互联网,搜索相关的信息,然后让用户在真实的环境看到相关的信息。增强现实浏览器能够可以让用户了解到摄像机方向的几乎所有事物的信息,比如找到一家距离很近但是被遮挡住的餐厅,或是获取用户对一家咖啡馆的评价。

这种定位方式适合于室外的跟踪定位,可以克服在室外环境中,光照,聚焦等不确定因素对图像检测法造成的影响。

其实在增强现实系统实际运用的环境中,往往不会用单一的定位方法来定向定位。比如增强现实浏览器也会运用图像检测法来检测一些特定的符号,例如QR码。识别出QR码在进行模板匹配,即可为用户提供信息。

现实技术

当前的增强现实主要有如下三种显示技术:1、移动手持显示。2、视频空间显示和空间增强显示。3、可穿戴式显示。

智能手机通过相应的软件实时取景并显示叠加的数字图像,这就是移动手持式显示器的一般工作情况。同时现在平板电脑不断增加功能以及比智能手机更大的屏幕,也是的其日益流行。

手持增强现实标志物,通过网络摄像机在食品窗口或是显示器上显示虚拟叠加的图像,就是视频空间显示方式。带有增强现实功能的贺卡,既是用这种方式显示的。用户在收到贺卡后,登录相应的网站系统,用网络摄像机对准贺卡,用户即可从显示屏上得到贺卡内所存储的信息形成的虚拟物体和视频。而空间增强显示技术,则是利用把包括全息投影在内的视频投影技术,直接将虚拟数字信息显示在真实的环境之中。这种技术的系统不同于一般的增强现实系统,只适合于个人使用,而是能想增强现实与周围环境相结合,不仅仅限于单个用户。这种技术适用于大学或者图书馆,可以同时为一群人提供增强现实信息。也可以将控制组件投影到相应的实体模型上,方便工程师的交互操作。

可穿戴式显示器是一种可以戴在用户头上的类似眼镜的头盔显示器。我们熟知且期待的google glass正式这一类型的。可穿戴式显示器一般有一道两个内嵌镜头和半透明镜的小型显示器,在飞行仿真,工程设计以及教育训练等多个领域都有广泛的运用。头戴式设备可以让用户更加自然地体验增强现实,并且能够为用户提供更大的视场,给予用户更强,更真实的“身在该处”的感觉。

交互技术

最基础的增强现实人机交互就是用户查看虚拟数据。除此之外,还有以下一些交互技术

触觉接口交互

通过数字信息提供身体触感来进一步实现虚实结合。比如,可触碰的虚拟光球,可以在虚拟的碗上绘画的幻影笔。

协作式接口交互

使用多个显示器来支持远程共享与交互或是同地协作活动。这种交互能够与多种应用软件集成,可用于医学领域的执行诊断和外科手术,或是设备维修等。

混合接口交互

组合多种不同但是功能互补的接口,使得用户能够通过多种方式的增强现实的内容进行交互。这种交互使得增强现实的交互更加灵活,可以用于数字模型的测试。

多模态接口交互

通过语言和行为的自然存在的形式与真实物体进行交互,比如,说话,触碰,自然手势,凝视等。多模态交互能让用户灵活的组合多种模态,更方便用户与增强现实系统的交互。

AR技术常见的表现方式

基础3D模型

3D模型(静态或动态)是AR技术最基本的展现形式,比如动漫人物、建筑、展品、家具等。目前,国内AR行业正属于前期发展阶段,3D模型表现形式主要应用于AR初级移动app类产品。这种变现方式虽然是最基础的,但也是目前应用场景最广、开发成本最低、市场普及最好的产品。

视频

相对于简单的3D模型,酷炫的视频展示无疑更能博人眼球,在商业运营中,这种展示方式带来的经济效益会更好。比如,本来是普通的产品安装说明、菜单讲解、宣传单介绍,一旦应用AR技术,那么它就不再是一张平面的图片,而表现出立体形象了,表述也变得准确生动起来,有一种魔幻的感觉。在类似的场景应用中,AR技术都有巨大的市场空间可供挖掘拓展。在这里,需要提醒的是,利用AR技术实现视频播放并不难,难的是制作一段适合AR情景播放的宣传片,这就需要各位脑洞大开、细心雕琢了。

透明视频

初次看到的时候,感觉它更像是使用了超高清的3D人物模型,但严格的说,这是做了特殊处理的透明视频展示的效果。这种视频没有3D模型的高额成本,但却有逼真的演绎效果。如果在大型海报、宣传册、商场活动等场景中,设计好了,可是会有超级赞的效果。

场景展现

它可不是简单的一个个3D模型加上去就算完事了,场景展现虽然类似基础3D模型叠加,但实现起来要比单一3D模型复杂的多,场景里包含的更多,应用范围也更加广阔。比如娱乐、立体阅读、游戏等应用都会需要场景展现,当然这类场景的建设需要内容的支持。AR的场景展现不同于VR建造的全场景,AR场景展现是基于现实并与现实相互交错的,这也正是AR技术的迷人之处。

AR游戏

AR技术在游戏方式方面也带来了巨大的革新。目前像《Pokemon Go》、《小龙斯派罗》、《幻实新英雄卡》等,都是非常不错的AR游戏。想象一下,往后的游戏不再需要复杂的场景建模,而是在真实的世界里游戏,同时在真实的世界里又能出现许多虚拟叠加进去的事物,这是一种多么棒的体验!游戏也能摆脱场地与空间的束缚,可以随时随地开始。

VR结合

AR与VR技术共同丰富着我们的现实世界,AR技术旨在增强我们所处世界的内容,而VR技术则是将我们的注意力从现实中转移到一个虚拟的空间。AR和VR要是相结合起来,相信会有更好的体验,比如有了VR设备+AR显示,你也不在需要导游或者讲解员了,借助VR,让AR所反馈出来的增强信息会实时地出现在你所聚焦的物体旁边,告诉你这是什么,甚至还会告诉你关于它的详细信息。未来像这样的结合还可以体现在导航、医疗等领域。

大屏互动

大屏互动作为AR技术展现的延伸,其表现效果也是很让人惊喜的,主要应用于商场、博物馆、体验馆、大型活动(演唱会)等。大屏互动,简单来讲就是AR技术加投影,营造更为真实、震感的场景和氛围。

AR增强现实的应用领域

现如今,增强现实的用途已是十分广泛,接下来我们队其中一些代表性的领域做一些介绍。

体育娱乐与游戏

增强现实的发展,对于娱乐业有着极大影响。增强现实产生的三维虚拟事物,能够增强我们的娱乐感触,将各种娱乐,变成当今最前沿的科技体验。

增强现实目前常用于体育赛事的电视转播中。比如在美国橄榄球比赛的电视转播中,可以获取比赛场上的真实的场地和运动员,添加虚拟黄线表示第一次进攻线,通过增强现实的技术将虚拟的黄线融入真实的场景。而在游泳比赛的电视转播中,水道之间常常被加上一些虚拟的线条,用于显示当前比赛中运动员的位置;而比赛结束时的标示也可以清楚的显示运动员的名次和成绩。这些增强现实技术在体育运动转播中的运用,给能观众更清晰的视角,更全面立体的分析,更优质的赛事体验。

游戏产业是一个全球性的大行业,而增强现实的技术的反正,也一定会被游戏产业应用。索尼公司新推出的游戏平台PS Vita就是其中之一。这款移动社交网络平台具有增强现实功能,无论玩家身处何地,他们都能使用当前环境开始游戏,并获得更具有沉浸感的游戏体验。而微软公司的Kinect可以根据使用者信息添加虚拟物体,达到例如模拟面具,大头娃娃等效果。

此外,增强现实对于三维会议,社交网络,电影电视,旅游等方面的影响也在逐步的增强,交互式电视,交互式电影,实时翻译,方向提示等技术的运用也极大的丰富了人们的生活。

教育

近年来年教育事业的支出不断的升高,教育事业也不断的受到社会的注视。然而由于一些条件的限制,有些位置由于受阻无法通过其他方式接近的区域,比如正在运行的发动机,而通过增强现实的技术,可以让我们更清楚的了解这些区域的内部情况。同时,增强现实也可以在很多方面为学习增加一个新的维度,比如通过增强现实识别环境的物体并尝试用正在学习的语言描述他们,来练习外语。可见,增强现实在影响和改善教育方面的潜力是巨大的。

增强现实通过三维图形或动画,音频或视觉信息等方式来增强特定内容,实现增强现实图书,能够给平面的纸质书籍,甚至嗲你在书籍注入新的活力。也可以创建一个具有沉浸性,游戏性的学环境,让多人实现协作式学习。

修理和维护

由哥伦比亚大学的Steve Henderson和Steven Feiner程序的增强现实维护修理(简称ARMAR)程序是增强现实在这一领域的著名应用案例。ARMAR科技吧计算机图案定位在需要维护的真是设备上,从而提高机械维护工作的效率,安全性和准确性。增强现实辅助维修技术,能够使工程师尽快的确定故障位置,并开始修理工作,极大的减少工作消耗的时间。

此外,数字化的用户指南手册,采用增强现实技术,将手册的文本和图片叠加显示在真是的设备上,并提供分布指令,会是个指南手册共容易理解。

医学

医学领域中增强现实技术的运用是最振奋人心的。尽管医生和外科专家能熟练的运用现代医学设备,但他们只能用裸眼检查病人,虽然核磁共振或是X射线得出身体内部的影像,但这毕竟不是人能直接看到的。而增强现实技术的应用,能为医生提供类似X射线透视视觉的病人体内的影像,并且是彩色全谱图,不只是黑白二值得图像。

增强现实能使医生看到有效的逐层的餐刀病人内部的情况,掌握手术精确的位置,避开其他的重要位置,方便医生手术的进行。增强现实技术也能用于治疗某些恐惧症,以及改善人类的总体健康,比如控制饮食。

商业贸易

人绝大多数活动的基础是商业与贸易,而增强现实也被强有力的运用到业务的创建和维护,以及维持或增加市场份额等方面。

二维码目前已经在广告领域广泛的运用了,而将二维码与增强现实相结合,可以使用二维码作为增强现实的标志物,可以完美的避免注册的问题。对美每一个请张先生系统,注册信息往往是不同的,而二维码的使用,可以让增强现实系统从不通用的,封闭的系统变为通用的,开放的系统。因此这两者的结合,会使得新兴广告超越原本的广告。

在广告牌,海报,以及一些汽车广告,都已经使用了增强现实的技术,方便用户连接相应的信息以及方便订购。而在百货公司中的增强现实系统,可以让购物者不用拿起实体,便可以体验,尝试各种商品。


文章来源于:电子工程世界    原文链接
本站所有转载文章系出于传递更多信息之目的,且明确注明来源,不希望被转载的媒体或个人可与我们联系,我们将立即进行删除处理。

我们与500+贴片厂合作,完美满足客户的定制需求。为品牌提供定制化的推广方案、专属产品特色页,多渠道推广,SEM/SEO精准营销以及与公众号的联合推广...详细>>

利用葫芦芯平台的卓越技术服务和新产品推广能力,原厂代理能轻松打入消费物联网(IOT)、信息与通信(ICT)、汽车及新能源汽车、工业自动化及工业物联网、装备及功率电子...详细>>

充分利用其强大的电子元器件采购流量,创新性地为这些物料提供了一个全新的窗口。我们的高效数字营销技术,不仅可以助你轻松识别与连接到需求方,更能够极大地提高“闲置物料”的处理能力,通过葫芦芯平台...详细>>

我们的目标很明确:构建一个全方位的半导体产业生态系统。成为一家全球领先的半导体互联网生态公司。目前,我们已成功打造了智能汽车、智能家居、大健康医疗、机器人和材料等五大生态领域。更为重要的是...详细>>

我们深知加工与定制类服务商的价值和重要性,因此,我们倾力为您提供最顶尖的营销资源。在我们的平台上,您可以直接接触到100万的研发工程师和采购工程师,以及10万的活跃客户群体...详细>>

凭借我们强大的专业流量和尖端的互联网数字营销技术,我们承诺为原厂提供免费的产品资料推广服务。无论是最新的资讯、技术动态还是创新产品,都可以通过我们的平台迅速传达给目标客户...详细>>

我们不止于将线索转化为潜在客户。葫芦芯平台致力于形成业务闭环,从引流、宣传到最终销售,全程跟进,确保每一个potential lead都得到妥善处理,从而大幅提高转化率。不仅如此...详细>>