B端-工业场景:
B端在产品形态上不需要做到像C端那样小体积、低重力,会有较大的技术器件空间;作为信息展示,而非信息体验,也没有太大视场角的需求;且场景相对单一,用户的行为属于任务型可预见的,在软件规划及硬件设计上,只要满足这个垂直场景的任务型需求,提供更高的效率即可,对操作体验要求较低。
国内大部分B端工业巡检场景仅需要将信息叠加在场景之上,从某种意义上来说,更像是辅助现实。
目前B端工业C场景主要涉及到三种功能:流程指引、远程协作、数据标注;但因物理场景的不一致性,我们可以看到各种形态的AR产品,有头盔(与安全帽一体)式、头戴一体式、分体式、模块化分体式等等,采用的光学方案也各式各样,阵列波导、衍射光波导、BB等方案。
接下来我通过B端工业场景的典型用户旅程图,来分析各个部分的关键要素
B端工业场景典型用户旅程图
流程指引、巡视检查
1、识别(精确性、速率):
- 精确性:在精确性上主要看摄像头分辨率,以及是否满足基本的3A(自动曝光、自动白平衡、自动对焦),能在不同关照条件下都能做到准确的识别; 其次是摄像头数量,图像识别单摄像头可完成,但鲁棒性较之于双摄像头slam识别较低。
- 速率:处理器性能,以及因散热导致的性能运行效率
2、视角配准:
- 因摄像头和工人视差的差异,设备应从硬件的布局、软件的算法层面进行校准,做到准确的数据标注对齐。且要保证工人在走动过程中,保证一定的对齐频率,这涉及到摄像头帧率、算法效率、通信效率,且单目对齐和双目对齐涉及的复杂度也完全不同。(本人在做see through相关的AR方案时,在对齐上吃过不上苦头,最终结论就是硬件布局的对齐是最好的解决方案,也就是让摄像头尽可能的和显示模组靠近一些,但靠得太近就要考虑摄像头的电流信息传输对显示质量的影响)
3、信息展示:
- 高透过率:在工人巡检过程中,高透过率是必要的保证,而目前能实现高透过率的光学方案则是光波导,包括衍射光波导及阵列光波导,而高透过率则要求高亮度显示,相较起来阵列光波导的光效率会更高,大约20%而衍射光波导则只有10%,但阵列光波导的加工条件更为苛刻,产品良率相对较低。
- 高亮度:在室外的工业场景显示亮度起码要达到3000nit以上,并要与光波导配合起来的话,可行的包括Lcos以MEMs、Mirco-led等显示技术了,目前来说Lcos算技术最成熟的方案,但对比度稍微低一些,这在工业场景来说也不是那么刚需。
- 视场角:光波导的光学方案视场角基本都小于40°,但对于工厂中局部设备等信息的显示,30°上下的视场角即可满足。
- 分辨率:在工业场景只要能保证基本的1080p视频能看清即可,即1k的分辨率。
- 空间信息展示:工人在巡检过程中会需要一边操作信息面板一边看相关的视频,能让工人通过转头来进行多任务信息获取,则能提升很高的效率,这需要具备3dof功能的imu。
索引准确的空间建模、MR融合效果(显示和光学模组的配准,国内一般都是单目解决方案)、亮度和透过率的平衡、交互、摄像头(视场角、分辨率)
远程协作:
- 通信带宽:工人与远程专家要建立起视频通话联系且时常是多人通信,而工业场景很少有WiFi环境,自备的移动通信模块不可缺失。。
- 交互:工业环境下,工人对显示界面的信息进行点击交互,完成通话、数据标注的动作,手势交互算是比较重要的交互方式,如果配备相应的硬件交互方式会对用户造成很大的使用不便。你可以想象一个工人刚操作完设备的脏手去拿手柄去交互的场景吗?手势交互的话则需要双camer了,且摄像头需要间隔一定的距离,如果是RGB摄像头最好,会有更高的鲁棒性,但这会造成一定的散热和性能处理问题。
- 音频:工人在工业环境往往会遇到吵杂的噪声,好的音频尤其是定向阵列音频很关键。
大量与B端AR解决方案方的沟通,国内在这一块和Hololens的差距还是非常大的
数据标注(留痕):
- 摄像头防抖:可以想象工人在用交互设备对摄像头捕捉画面进行标注时,抖动的摄像头会造成多大的不便,而做好摄像头防抖,电子防抖就可以满足,因为摄像头的视场角一般都是超过44°的,而光学模组(光波导)的显示视场角一般低于这个视场角,显示时图像有较大的冗余,对图像进行电子防抖就有比较好的效果;当热,最光学iso防抖或机械防抖是更好的方式,但成本会显著提升。
- 存储空间:工人会有大量的图片或视频的资料需要存储在本地,加上“识别”功能需要的算法数据,所以存储空间是一个关键的要素,2k、60帧视频一分钟差不多高达0.5g,所以存储空间应保证在200g以上为好。
几款典型产品分析:
亮亮视野Leion Pro
优点:
- 在“识别”层面,摄像头分辨率(1200万像素)、视场角很出色,提供了好的硬件入口条件;处理器采用的intel专业的视觉学习芯片,给“识别”提供很好的计算平台。
- 显示上采用的是阵列光波导,4000nit显示亮度换算成入眼亮度能达到800nit加上30度视场角能满足多场景性;且摄像头与显示模组距离控制得很好,在图像对齐上会有较好的效果。(但阵列光波导良率一直是个大问题)
- 摄像头电子防抖也是一个亮点,这得益于其超大的视场角,给防抖留出足够的计算空间。
- 重量90g,算是工业领域比较轻薄的眼镜了。
缺点:
- 内存太低,本地计算空间、存储空间明显不足。
- 缺少通信模块,在整个工业场景缺失了远程协作的功能入口。
亮风台G200
优点
- 显示上入眼亮度500nit能满足多场景性
- 具备移动通信模块、GPS定位,在远程协作上有了通信支撑
- 内存达到258G且支持T-flash拓展,保证了文件存储、本地计算的充足空间
- 独立计算单元,且有较高的电池容量,不会产生对手机耗电的焦虑心理。
- 80g佩戴重量,能保持长时间戴的舒适性
缺点:
- 摄像头像素太低,在工业场景“识别”上会有很大的缺陷。
- 较黑的挡光镜片,透过率不高,在虚实融合的显示上容易造成信息获取误差。