

当前VR 产品尚未形成统一的形态和主流的技术路线。从产品形态上,一体式、分体式共存,尚未形成统一的技术路线。轻薄化、类普通眼镜是发展的必然选择。目前仍受限于底层核心技术,特别是光学、 显示技术和电池续航等的技术突破。
从处理器上看,高通芯片一家独大。从显示上看,多种显示屏幕并存,Micro-LED 是未来。从光学系统来 看,光波导+Micro-LED 是未来发展的趋势,光学显示镜片的量产与成本问题有待解决。从感知交互来看,SLAM 开始普及,手势识别逐步具备。
AR 产品结构及产业链:光学组件成本占比接近一半
AR 终端的硬件部分主要由处理器、光学组件、摄像头和传感器、存储器几部分构成。Magic Leap One 主 要部件包含 6 个 LCOS 屏幕和一块 6 层的几何光波导镜片,一块可以续航三小时的电池,使用了英伟达 Parker SOC。HoloLens 主要部件包括深度感应摄像头、4 个环境感应摄像头、全息处理单元 HPU、Intel Atom x5-Z8100 CPU、一块 16.5Wh 的电池、3 层衍射光栅+LCOS 的光学显示方案。
近眼显示技术是目前主要难点,因此光学显示在 AR 终端成本中占比较高。近眼显示(Near-eye display, 简称 NED)目前是 AR 硬件最重要的问题,不同于半导体遵循摩尔定律,往往具有可预见的迭代周期,光学设 计则需要在最基本的物理定律的框架下,不断探索、论证各种的可能性,技术门槛较高,生产良率低。因此目 前的 AR 终端中,光学显示的占比最高,参考 Hololens 的成本结构,光学显示部分约占 40%左右。其次是处理 器(~30%),存储(~15%), 摄像头(~10%),电池(2%)。
光学显示系统:百花齐放,Micro-LED+光波导未来可期
AR 设备的光学显示系统通常由微型显示屏和光学元件组成。光学组合器的不同,是区分 AR 显示系统的 关键部分,市场上各种方案百花齐放,目前较多的搭配方案包括 LCOS+光波导、DLP+光波导、硅基 OLED+自 由曲面等。
显示:多种显示方案共存,Micro-LED 逐渐成熟并有望成为主流技术
目前 AR 设备中多种显示屏幕共存。目前发布的 AR 产品使用较多的是 LCOS、硅基 OLED、DLP 三种屏 幕,由于亮度上的差异,硅基 OLED 一般与 BB、自由曲面搭配、LCOS、DLP 基于亮度上的优势与光波导搭配。 Micro-LED 由于具有高亮度、低延时、低功耗等优点将成为 AR 眼镜微显示器件的最优选择。
(1)硅基液晶(LCOS)作为 AR 终端常用的显示技术得到了一定发展与认可,但其较高功耗与较低对 比度限制了该技术的发展。
硅基液晶(LCOS)是一种新型的反射式微液晶投影技术,它采用涂有液晶硅的 CMOS 集成电路芯片作为 反射式 LCD 的基片。传统的 LCD 是做在玻璃基板上,LCOS 则是做在硅晶圆上。前者通常用穿透式投射的方 式,光利用效率只有 3%左右,解析度不易提高;LCOS 则采用反射式投射,光利用效率可达 40%以上,而且可 随半导体制程快速的微细化,逐步提高解析度。LCOS 的优势在于性价比较高,缺点在于对比度不足以及功耗 较高。
(2)硅基 OLED(OLEDoS)可显著改善 LCOS 在对比度、功耗与响应时间等方面的性能表现,成为新 近发布 AR 终端的技术选择。未来需要进一步降低成本并完善生态体系。
硅基 OLED 显示采用单晶硅晶圆作为有源驱动背板,所以更容易实现高 PPI(像素密度)、高度集成、体积 小、易于携带、抗震性能好、超低功耗等优异特性。自 2020 年开始,国内显示厂商在硅基 OLED 领域投资动作 频繁,2020 年产线投资规模超过 200 亿元,包括安徽熙泰、京东方、维信诺、紫旸升光电科技等公司均有投资 兴建硅基 OLED 产线。
未来硅基 OLED 需要解决的问题包括:一是降低成本,硅基 OLED 是集成电路和新型显示两种技术的结合, 其中集成电路制程占据了器件成本的 70%到 80%,随着硅基 OLED 器件市场需求的不断增长,现有的生产方式 还有待探索和磨合;二是优化系统和提升整机设计水平,包括光学设计和制造、人体工程、操作系统和应用程 序等多方面的配合。
(3)Micro-LED 成为继 LCD 和 OLED 后业界期待的下一代显示技术,技术逐渐成熟,市场前景广阔, 诸多行业巨头加速战略布局。
Micro-LED 原理是将 LED 阵列微小化、可拼接化使其性能得到良好提升,具备低功耗、高亮度、高对比、反应速度快、厚度薄与高可靠等优势。Micro-LED 微显示屏幕当前量产的难点在于巨量转移技术,目前制造成 本过高,产业化仍需要时间。梳理晶元光电、友达光电、錼创科技、三星等重点企业的发展进度可知,预计其 规模量产时间在 2022 年左右。
苹果(LuxVue)、脸书(InfiniLED)、谷歌(Glo、Mojo Vision)、英特尔(Aledia)等纷纷投资或收购 Micro-LED 领域初创公司,布局 Micro-LED 显示技术。2020 年国内 Micro-LED 厂商 JBD 与 AR 眼镜厂商 Vuzix 达成供货, Facebook 已宣布与英国 Micro-LED 厂商 Plessey 合作推出了 Micro-LED AR 眼镜。
3.3.2 光机:多种光学方案并存,光波导技术发展趋势明确
AR 的光机设计是当前的难点之一。一方面,不同于 VR,AR 是需要透视的,成像系统不能挡在视线前方, 因此多了一个或一组光学组合器,通过“层叠”的形式,将虚拟信息和真实场景融为一体。另一方面,不同于 半导体遵循摩尔定律,往往具有可预见的迭代周期,光学设计则需要在最基本的物理定律的框架下,不断探索、 论证各种的可能性,技术门槛较高,进展相对缓慢,但目前在一些技术上已经取得了较为明确的突破。
在各种光学参数存在冲突的情况下做出取舍,是目前 AR 光机的重要挑战。由于现有技术方案在分辨率(清 晰程度)、视场角(视野范围)、重量体积(美观舒适)等方面存在潜在冲突,如何做到视觉质量、眼动框范围、 体积重量、视场角、光学效率与量产成本间的权衡取舍、优化组合成为驱动技术创新的主要动因。
(1)折反式(Birdbath)得益于设计与量产成本的优势,触发了消费级 AR 终端的规模上量。
Birdbath 的工作原理是把来自显示源的光线投射至 45 度角的分光镜。分光镜具有反射和透射值(R T), 允许光线以 R 的百分比进行部分反射,而其余部分则以 T 值传输。同时具有 RT 允许用户同时看到现实世界的 物理对象,以及由显示器生成的数字影像。从分光镜反射回来的光线弹到合成器上。这是一个凹面镜,可以把 光线重新导向眼睛。 基于这一传统技术路径的光学模组体积较大厚度减薄困难,眼动框范围受限,其光学系统须搭配算法缓解 畸变,且光效难以高于 15%,效果和成本较大程度受限于微显示器的发展,高亮的 OLEDoS 成为最优搭配, 目前我国已有厂商采用该技术大量出货。搭载 Birdbath 光学方案的 AR 头显包括:联想 Mirage AR 头显、ODG R8 和 R9、OPPO AR Glass 2021 等。
(2)自由曲面在早期得到业界认可,其显示效果、光效表现较好,但会产生畸变等问题。
自由曲面采用相对简单的光学设计,它搭载了低成本的 LCD 显示源,以及带反射透射(RT)值的曲面反 射镜。显示器发出的光线直接射至凹面镜合成器,并且反射回眼内。显示源的理想位置居中,并与镜面平行。 从技术上讲,理想位置是令显示源覆盖用户的眼睛,所以大多数设计都将显示器移至“轴外”,设置在额头上方。 凹面镜上的离轴显示器存在畸变,需要在软件显示器端进行修正。
但自由曲面量产加工难以保持较高精度,局部精度下降可导致图像局部扭曲和分辨率降低,存在产品一致 性难题。此外,通过厚棱镜观察真实世界会出现一定程度扭曲和水波纹样畸变,这些因素影响了自由曲面的发 展潜力。搭载自由曲面光学方案的 AR 头显包括:Mira Prism,Meta 2,Leap Motion,Dream World。
(3)光波导在 AR 领域的技术发展前景明确,有助于推动消费级 AR 产品显著升级,高性能光波导的发 展尚需时间。
(a)几何(阵列)光波导:镜面阵列设计,实现一维扩瞳,制造工艺复杂
几何光波导中,耦合光进入波导首先遇到一个棱镜或反射面,在多轮全反射后到达眼睛前方,耦合光出波 导的结构是一个“半透半反”镜面阵列。每一个镜面会将部分光线反射出波导进入人眼,剩下的光线透射过去 继续在波导中前进。镜面阵列相当于将出瞳沿水平方向复制了多份,这样眼睛在横向移动时都能看到图像,这 就是一维扩瞳技术(1D EPE)。
目前几何光波导代表光学公司是以色列的 Lumus,国内的珑璟光电。如果生产过程符合设计,几何波导的 成像质量比较好,但光效率比传统光学系统偏低,相当于出光面积变大,每一个出瞳位置看到的光就变少了。 但问题在于,几何波导的工艺难度非常大,主要在于复杂的镀膜工艺,由于光在传播过程中会越来越少,要保 证动眼框范围出光均匀,阵列中这五六个镜面的每一个都需要不同的反射透射比(RT),又由于光通常是偏振的, 每个镜面的镀膜层数可能达到十几甚至几十层;另一方面是胶合难度大,镜面之间的平行度和切割的角度都会 影响到成像质量,极易出现瑕疵,导致黑条纹,出光不均匀,鬼影等现象。因此几何波导的良率较低,可量产性较低。此外,基于阵列光波导的二维扩瞳方案对加工工艺的挑战极大,短期难以商用。
(b)衍射光波导:通过光栅调整,可以实现二维扩瞳
衍射光波导主要有利用光刻技术制造的表面浮雕光栅波导(Surface Relief Grating,SRG)和基于全息干涉 技术制造的全息体光栅波导(Volumetric Holographic Grating,VHG), HoloLens 2,Magic Leap One 均属于前 者,苹果公司收购的 Akonia 和 Digilen 则致力于后者。
衍射光波导依循光学元件从毫米级到微纳级、从立体转向平面的技术趋势,采用平面的衍射光栅取代传统 的光学结构。衍射光波导利用经过两次两个方向的扩瞳光栅或二维光栅以实现二维扩瞳,从而给以人为中心的 光学设计与用户体验优化留有更大的容差空间。
衍射光波导的原理简单来讲,就是通过设计衍射光栅的参数,将光衍射到想要的方向上去。衍射光栅是一 个具有周期结构的光学元件,这个周期可以是材料表面浮雕出来的高峰和低谷 ,也可以是全息技术在材 料内部曝光形成的“明暗干涉条纹”,但归根结底都是在材料中引起了一个折射率 n 的周期性变化。因此, 衍射光栅通过衍射级和色散实现分光特性,起到了与传统光学器件类似的改变光线传播方向的作用,但是它所 有的操作又都是在平面上通过微纳米结构实现的,所以非常节省空间,自由度也比传统光学器件大很多。
衍射光波导的可量产性较好,色散问题是比较大的技术挑战。衍射光波导技术与几何光波导相比主要优势 在于光栅在设计和生产上的灵活性,不论是利用传统半导体微纳米制造生产工艺的表面浮雕光栅,还是利用全 息干涉技术制成的体光栅,都是在玻璃基底平面上加镀一层薄膜然后加工,不需要像几何光波导中的玻璃切片 和粘合工艺,可量产性和良率要高很多。衍射光波导技术的不足主要来源于衍射元件本身对于角度和颜色的高 度选择性,光的效率偏低,另外还有色散问题。为了改善色散问题,针对 FOV 和动眼框内的“彩虹效应”,如 何用一层光栅作用于 RGB 三色且实现最大的 FOV 成为重要的技术挑战。
光波导的优势包括:能够实现通过一维和二维扩瞳技术增大动眼框,从而适应更多人群,改善机械容差, 推动消费级产品实现;波导镜片像光缆一样将图像传输到人眼,成像系统旁置,不阻挡视线并且改善配重分布; 波导形态一般是平整轻薄的玻璃片,其轮廓可以切割,外观形态更像传统眼镜,利于设计迭代;多层波导片可 以堆叠在一起,每层提供一个虚像距离,提供了“真”三维图像的可能性。
目前光波导技术也存在一些不足,主要包括:由于光在耦合进出波导以及传输的过程中都会有损失,并且 大的动眼框使得单点输出亮度降低带来的光学效率相对较低;对于几何波导来说,繁冗的制造工艺流程导致总 体良率较低;对于衍射波导来说,衍射色散导致图像有“彩虹”现象和光晕,非传统几何光学,设计门槛较高。
在微软 HoloLens,谷歌,Magic Leap 、DigiLens 等厂商的推动下,光波导目前成为 AR 眼镜的主流技术。 光波导技术在 AR 领域的技术发展前景是明确的,但预计在中近期难以大规模普及。光波导技术中各类技术路 线间存在明显的优势和短板,目前尚未确立主导地位技术方案。此外,由于受到基础物理定律的限制,光波导 要实现重大技术突破将面临巨大的研发困难,相关产品难以单独作为完整终端产品,须配套技术和零部件才可 能产出被市场认可的 AR 终端,而有关配套技术和零部件尚有相当比例需要进一步完善,因此高性能光波导的 发展尚需要时间。
3.4 感知交互:SLAM 开始普及,各大厂纷纷布局
SLAM(Simultaneous localization and mapping,同步定位与建图)技术近几年开始成熟,并被用于 VRAR 等消费者产品的追踪定位。简单理解,SLAM 就是某种设备(机器人、VRAR 设备)来到陌生环境中,需要精 准建立时空对应关系,并回答“我在哪里?”“这是什么地方?”“我该怎么走?”等问题,也就是定位、建图 和路径规划。由此可见,SLAM 是一套要求实时性和准确性的大型系统,涉及硬件上高速度高精度的感知和姿 态跟踪、算法上多线程并发执行,资源的分配、读写的协调、地图数据的管理、优化和准确性等系统整合的众 多问题。
SLAM 的数据来源是传感器,传感器的质量对于 SLAM 的效果影响很大。因此 SLAM 对于硬件的要求很 高,包括对于 IMU 要求高精度,对于摄像头要求全局快门,大的视角,快门速度足够高,能够保证图像在高速 运动时不会产生模糊。不仅如此,SLAM 数据来自于多个传感器的融合,以 Facebook 的 Oculus Insight 系统为 例,硬件架构包括三种传感器:IMU,摄像头和红外 LED,多个传感器需要精密的校准和调整,直接关系到算 法的准确性。
精确高效的算法则是 SLAM 的核心。以开源的 ORB-SLAM 算法为例,主要分为三个线程,Tracking 用于 跟踪 Camer a Pose,Local Mapping 用于构建点云地图,Loop Closing 用于闭环检测,优化点云位置。Place Recognition,即重定位,是利用 BOW(Bag of Words)模型在已经构建好的地图内定位 Camera。目前距离应用 到终端产品上还存在比较大的问题,主要包括代码 Bug 优化,传感器的位置跟踪不稳定,芯片实时处理所有数 据的算力不够,以及内存问题。
SLAM 是 AR 必备的核心技术,各大公司纷纷布局,未来前景可期。从 VRAR 的应用场景来看,由于 VR 设备主要是虚拟世界的沉浸感,SLAM 是对真实世界的描述,现有的 Outside-in 方案基本不需要 SLAM,Inside-out 需要 SLAM 配合解决跟踪用户位移的问题。而对于 AR 设备来说,为了实现虚拟元素和真实世界的融合,SLAM 则是必须拥有的最核心的一项技术之一,苹果 ARKit、谷歌 ARCore 与华为 AR Engine 推出的 AR SDK 普遍 遵循单目视觉+IMU 融合定位的技术路线,也验证了各大公司对其重视的程度,在 SLAM 相关的传感器、算法、 软件、硬件等方向,也出现了小公司在关键细分领域快速创新、大公司在各个关键方向布局并且频繁收购的趋 势。
在初期阶段,由于产品和硬件高度差异化,而 SLAM 相关技术的整合和优化又很复杂,目前有能力做好 SLAM 全套解决方案的仍是 Facebook、微软、谷歌、苹果等大厂。随着 SLAM 各个领域的产品化进程推进,细 分市场的创新和应用正在迅速推进。由于市场上算法和软件仍然比较碎片化,移动端硬件的计算能力还不够, SLAM 相关技术正在从软件和算法层面向硬件推动,可以期待在这个过程中必将会产生巨大的机会和众多优秀 的公司。