作者 | 皇甫钰文
沉寂已久的AR眼镜行业,突然间波澜四起。
2022年下半年突然掀起了一阵AR眼镜新品发布狂潮。8月,Nreal一口气发布了Nreal Air与Nreal X两款产品;9月,亮亮视野发布“听语者”AR字幕眼镜。到了十月,众多品牌更是一股脑扎进会场,密集召开的新品发布会将AR眼镜这个“新品类”重新带到大众眼前。雷鸟创新发布了一年内的第二款产品雷鸟Air 1S,Rokid时隔一年为第一款消费产品Rokid Air发布了外接算力终端Rokid Station。除此之外,影目科技、OPPO都发布了第二代AR眼镜。AR眼镜产品迭代速度之快,令人瞠目。
2023年伊始的CES 2023,AR眼镜更是成为万众瞩目的焦点之一。雷鸟创新、Arges、MAXST等厂商争相在展会上秀出肌肉,AR眼镜行业大有百花齐放之态。传统厂商布局、初创企业狂奔,AR眼镜这个全新的行业正在由一个个充满活力的主体共同构建起来。
过去常常以“数字人公司”出现在大众视野中的李未可科技(下文简称为“李未可”),在去年10月17日发布了户外AR眼镜Meta Lens S1和Meta Lens S1 Pro。作为现阶段业内少有的将AR眼镜应用场景定位于户外的品牌,李未可对于AR眼镜和行业的思考,代表了AR产业发展的可能路径之一。
李未可科技创始人兼CEO茹忆曾任阿里人工智能实验室硬件终端总经理、天猫精灵产品总经理、小米电视合伙人及副总裁。近日「深响」与茹忆展开了一次访谈,其对下一代人机交互设备以及计算平台有自己的理解,他向我们详细阐释了李未可的产品理念与设计逻辑,并对AR行业的现状和未来进行了分析与预测。
“AR眼镜行业其实是一个技术驱动的行业。”去年下半年AR眼镜行业整体提速,茹忆认为其根本原因在于技术的发展。从光学模组方案优化,到芯片的迭代升级,技术的发展带动了整机产品的成熟,体现在产品变轻、功耗降低上。
AR眼镜行业的痛点之一就在于光学与显示。低重量、优显示、低功耗,几乎就是AR眼镜的不可能三角。而如今光学技术已经发展到了一定的水平,过去的于BirdBath技术逐渐成熟,光波导技术也开始量产应用,不可能三角逐渐找到平衡方案。至少2022年发布的新品,可以像传统眼镜一样很轻薄地佩戴在用户头上了。
李未可现阶段推出Meta Lens S1和Meta Lens S1 Pro的逻辑,是希望借助新技术打造AR眼镜产品,从而创造更好的用户体验。其推出产品的思路则是围绕如何将新的技术运用到一个新的服务场景中,以及用新的技术提高旧场景中的用户体验来探索的。
为了这个目标,结合产品主打户外使用的场景定位,李未可和供应链合作研发了光学方案,保证用户可以在室外看得清楚、佩戴舒适、足够轻薄。在这样的硬件基础上,设计出骑行导航、徒步导航、户外拍照和音乐播放等满足用户真实需求的功能。
AR眼镜的两大痛点是续航和发热。一方面,AR眼镜的显示方案和芯片本身的功耗很高;另一方面,消费级产品往往要满足多种场景,既要能播视频,又要能玩游戏等等。业内一些厂商尝试外接计算平台来解决这些问题,很多AR眼镜只充当“头显”功能,把计算交给手机或其他主机来解决。
但这种分体式的方案并不适用于李未可的主打户外场景。“我们希望不让用户从头上接一根线一直连到兜里,这不适合户外的用户行为。”
Meta Lens选择一体机方案,对于续航和发热的要求势必更加严格。
李未可首先尽量了降低硬件的基础功耗。算力采用高通可穿戴设备平台而非XR平台、光学方案采用自主研发的Binoculars双目AR显示系统等选择,都是为了降低功耗。李未可与供应链共同研发的Binoculars系统采用单光机双目技术,相比于双光机方案,在保证了亮度足够的同时,实现了更低的功耗、更轻的重量。
其次,李未可团队在软件架构上也做了取舍。针对户外场景,Meta Lens暂时选择不支持玩游戏和看电影这样功耗较高的场景。而是根据现有硬件的能力,专注于满足户外的需求,如导航、听音乐、拍照、运动检测和心率监测等。
另外,Meta Lens的一大特点是内置eSIM卡,是市面上少有的具有独立4G联网能力的AR眼镜。因此,部分功能如AI能力和语音交互识别的运算被放在云端进行,从而降低了终端的性能需求,减少了功耗。
在产品设计层面就考虑好续航和功耗问题,接下来只要在应用场景上做好优化,便可以带来优秀的使用体验。李未可选择用AI赋能AR的使用场景,为Meta Lens定位了六大AI场景:旅行、骑行、逛街、通勤、运动以及郊游。
交互方面,Meta Lens在佩戴全过程都采用语音交互的方式。
用户在使用Meta Lens的三大功能导航、音乐和拍照时,语音交互都可以很自然地完成。例如在导航中想要更换目的地,喊出数字人助理“小柯”或“零下”,直接说导航去哪里就可以了。在骑行中腾不出双手的情况下,语音交互算得上既安全又高效的交互方式了。
用户还可以使用快捷词发出指令,例如用户想要拍照,可以直接说“小柯,快看”,照片就拍好存到相册中了。过程之快,让人在高速骑行中也不会错过美好的风景。快捷词功能的设置,还让用户与眼镜的交互更加自然,就像是和身边的朋友交流,而不是一个冷冰冰的语音助手。
通用语音助手常因所答非所问被消费者吐槽为“人工智障”,李未可通过建设基于地理位置信息的实时数据库“LBS知识图谱”来提供更精准的AI服务。
以骑行为例,“小柯”和“零下”不仅仅能做到像传统导航一样,告诉用户从A地到B地哪条路最近,还可以针对用户的个性化需求给出建议。比如爸爸妈妈带着孩子在西湖边骑行,语音助手可以根据大数据推荐给这家人适合亲子游的路线。再比如外地游客来到西湖游览,语音助手不会只把最近的路线告诉用户,而是告诉用户哪条路线被80%的游客走过,这可能是一条经典的游览路线。
更精细一些,未来LBS知识图谱甚至可以赋予语音助手导游的功能。比如游客来到岳王庙,语音助手可以播报岳飞事迹、文物特点以及当时历史背景的介绍。
这就是AR眼镜厂商针对旅游场景优化AI的例子之一,这些功能是通用语音助手难以做到的。
茹忆难掩李未可对知识图谱的重视程度,同时也向我们表达了未来与行业各个参与方共建AR生态的愿景。“细分场景太多,不可能都由一家公司负责优化。所以开放是必然的,最终还是要与各个垂直场景的玩家合作,接入他们的服务。现在我们考虑的不是开不开放,而是什么时间点与各方开展合作更合适。”
茹忆总结了李未可设计AR眼镜功能以及技术路线选择的原则:
第一,基于轻薄和功耗的考虑,李未可现阶段主打户外场景。等到彩色光波导技术更加成熟,光学模组更轻、电池容量更大时,产品会进入室内场景,适配影音娱乐等更多功能。
第二,李未可的产品设计原则是可以接受能带来体验稀缺性的成本增加。例如使用「Micro LED+光波导」的显示和光学方案,是为了解决传统BB方案的遮挡问题,在此基础上可以提供HUD导航等功能。如果更贵的方案没能带来更好地用户体验,就不会被选择。
第三,李未可以动态的视角看待AR眼镜的技术路线。“我们不会押宝技术,认为哪个技术就是终极方案。技术在进步,产品也在迭代。在研发上,我们会探索多个技术方向;在产品上,会用现阶段最理想的技术。”
从应用场景角度了解李未可Meta Lens的产品理念后,为了进一步理解AR眼镜厂商行为的底层逻辑,我们讨论了整个行业的情况。茹忆分享了行业面临的问题以及新消费场景下的新举措,并向我们描述了李未可对AR行业未来可能走向的判断。
苹果CEO蒂姆库克认为VR眼镜是过渡方案,AR眼镜才是未来代替手机成为新一代计算终端的主流产品。对于VR与AR,茹忆认为二者的区别主要是应用场景的不同,VR眼镜适合沉浸式场景,AR眼镜则适合需要与现实环境交互的场景。二者也有一些重合场景,比如室内场景的娱乐影音功能。未来,当产品能够做到足够轻薄之后,AR和VR都会走向XR。
由于技术限制,现在无法做出一款全功能的、覆盖所有场景的XR眼镜。等到技术足够成熟后,XR眼镜可以搭载几乎所有功能。即便如此,到时很可能仍会出现很多针对不同场景设计的不同的XR眼镜。“我认为从技术上来说,XR眼镜有融合的趋势,大的方向一定是越来越轻薄、佩戴越来越方便、娱乐功能越来越完善。但从场景上来说,依旧会出现针对特定场景做优化的XR眼镜。”
不同于传统3C产品选择在京东和天猫发售产品的上新路径,李未可选择在抖音的“李未可旗舰店”销售Meta Lens。传统电商渠道方面,李未可只在淘宝开设了旗舰店。这一细节的背后,是李未可对于新品类销售链条以及电子商务销售趋势的理解。
对于传统产品来说,通过传统广告触达用户,用户再去电商搜索,最终促成转化,这个流程是比较高效的。而对于AR眼镜这样的新品类产品来说,用户对产品不了解,不知道AR眼镜可以用来做什么。如果简单通过传统广告进行宣传,很难推动消费者去电商平台“找货”的环节。
人货场三者需要匹配,适合AR眼镜的“场”应该是抖音、小红书这样的社区平台。李未可在抖音上以数字人为载体展示Meta Lens,与用户进行互动,将产品代表的生活方式、价值观以及应用场景影响辐射给年轻人。对产品感兴趣的人群又到小红书和抖音分享用Meta Lens在户外拍的照片。这种多层次触达用户的方式,比仅仅在电商平台上架商品等着用户主动来买的转化率要高。
说到底,AR眼镜厂商对于销售渠道的新选择,根本原因在于用户心智尚未形成。基于此,茹忆认为AR行业出现出货量超过100万台的爆款产品,可能还需要两三年。同时,他预计李未可的AR眼镜在2023年的出货量可以提升到几万台,到2024年将达到几十万台。
目前做AR硬件的厂商包括互联网科技大厂、AR初创企业以及传统硬件厂商三类玩家。作为一个创业公司,李未可的优势是可以快速接受市场反馈,不断迭代。新公司的反应速度往往比传统大型企业更快,这是创业公司始终存在的原因,也是商业的规律。
茹忆也坦承创业公司在一些方面比大厂存在劣势:“主要问题还是用户认知层面的问题。AR眼镜这个品类太新了,新品类获得用户认知需要时间和成本。在教育市场的过程中,大厂最大的优势是用金钱换时间。通过补贴的方式降价,使用户获取产品的成本降到最低,从而形成很强的用户认知。很多行业采用过这种打法,例如滴滴吸引用户用App打车,再到现在Pico的补贴。对于我们来说,我们没法采用这种方式,因此需要的时间更多。”
茹忆表示李未可并不追求短期内一下子获得一百万甚至一千万用户,将会按照正常的市场营销逻辑,通过数字人找到核心用户进行推广,之后通过用户自发宣传实现破圈。
“Meta Lens去年12月正式发售,我们最近就是一直在和前期用户沟通,获得他们对于产品的反馈。目前我们得到了非常多正面的反馈,80%以上的用户都觉得这个产品是他想要的。因此我们对自己的产品还是很有信心的。”
茹忆结合过去在智能音箱和电视行业的从业经验,还分享了AR眼镜产业供应链的特点。
现在智能音箱、智能电视以及智能手机产业的供应链都非常成熟。事实上,这三类产品分别是从传统音箱、传统电视以及传统手机(功能机)发展而来。将原有的电子设备上智能化,本质上传统产品与智能产品同属于电子消费品。在加入智能化体系之前,这些产品的制造体系就已经搭建完成了。
但AR眼镜并非是在传统眼镜上加入智能功能这么简单。传统眼镜不是电子消费品,因此眼镜行业并不处于“演进”的过程,而是“突变”成科技行业。李未可团队在产品立项前去深圳考察过传统眼镜的制造,制造方式偏向于手工。而AR眼镜却需要智能的制造方式,工艺甚至比手机更精密。
例如,手机屏幕在发展初期继承了电视行业的LCD,不需要从零开始研发。而AR眼镜用到的光学模组是一个全新的行业,之前从来没有相关的供应商。在供应链上,上下游都没有经验。由于没有过往的供应协议可参照,在定制零部件时签订质量协议,双方甚至都不知道良品率定在多少合适,是百分之一,千分之一还是万分之一。因此,AR眼镜的供应链正处于探索和完善的阶段。
李未可团队在创立伊始同时启动了AR眼镜项目和数字人项目,由于硬件研发周期较长,数字人率先呈现在人们眼前。数字人成为了AR眼镜产品的营销引流阵地,但这种方式也可能带来负面效用。在很多人的认知里,李未可是一个做数字人的公司,推出AR眼镜属于“不务正业”。这可能会影响消费者对于李未可公司专业性的判断。
业务路线的争议只是AR行业方向不确定的表现之一。在这个新兴行业中,从技术到产品形态再到应用场景,无不需要各家厂商精心构思,以对AR行业的理解为基础,以构想的未来世界为参照,设计出别具一格的实用型产品。
李未可选择较为冷门的户外场景,既有对现实的妥协,也有对未来的畅想,路线正确与否需要经过时间的检验。作为消费者,我们期待的是AR眼镜行业能够带来更多的差异化产品。
以下为「深响」整理后的部分访谈实录
Q=深响
A=茹忆
【关于产品】
Q:2022年国内AR厂商发布新品的节奏都明显提速,产品矩阵也更多了,包括不同规格的头显,还有外界的主机Station等。去年行业提速的原因是为什么?
A:我觉得去年整体行业提速的原因主要是,AR眼镜行业其实是一个技术驱动的行业,不管是从光学模组的发展、整机的轻量化以及芯片的迭代,整体产品的成熟度随着这些技术的发展而提高到了一个层级。ARVR行业其实已经挺久了,2015年就有一波VR热。这两年我们会看到AR技术的发展,特别是光波导技术和BB技术逐渐成熟,这些光学方案支撑了AR眼镜制造商量产消费级产品。但现在整个行业依旧处于早期探索阶段,我们所看到的密集发布更多是在试水,其实AR眼镜供应链远远没有达到像手机、智能家居的供应链的成熟度。
Q:李未可推出产品背后的演进逻辑是怎样的?为什么现阶段推出Meta Lens两款产品,以后的迭代路径是怎样的?
A:刚刚说行业的发展和新产品的推出都源自技术推动。技术推动的实质是新技术解决了一些之前不容易解决的问题,进而在产品上创造了更好的用户体验。
比如李未可的产品就是沿着AR眼镜的技术路径去探索的。我们在探索如何把AR眼镜做的更轻薄,可以真正在户外使用。为了这个目标,我们和供应链一起研发光学方案,保证用户可以在室外看得清楚、佩戴舒适、足够轻薄。在这个基础上,我们开始讨论这样一套光学方案,能够解决用户的什么问题,也就是给用户带来什么新的体验。我们针对室外场景,设计了骑行导航、徒步导航、户外拍照和音乐播放等功能。这些功能满足的是我们对用户的调研中发现的用户真实的需求。
总结下来,李未可现阶段推出产品的思路就是在探索如何将新的技术运用到一个新的服务场景中,以及用新的技术提高旧场景中的用户体验。
Q:AR眼镜的目标用户群和数字人的粉丝群重合吗?我们发现李未可并没有按照3C产品上新的通常路径在京东开设旗舰店。Meta Lens的销售主阵地是通过抖音李未可数字人账号引流到抖音李未可旗舰店,这是不是意味着数字人粉丝拥有更高的转化率,可以转化为AR眼镜购买者?可不可以理解为相对于破圈,李未可现阶段还是想把产品卖给粉丝?
A:这个问题问的非常好。电商领域其实一直在演进。最早的电商逻辑是人找货,消费者到网上主动搜索自己想买的产品。而发展到现阶段的电商,更讲究人货的匹配。电商行业经常说“人货场”,那人货匹配对场的要求必然和以前不同。
李未可今天做的AR眼镜产品不是一个单纯的户外骑行眼镜,而是打造了一种年轻人喜欢的生活方式。所以这个眼镜一定得是潮流年轻人觉得很酷的产品。从这个角度来讲,我们的目标用户就是这批喜欢潮酷、喜欢二次元的年轻人。他们如果喜欢一款产品,就会到小红书、到抖音去分享,分享用李未可AR眼镜在户外拍的照片、分享生活中的点滴。
因此我们在抖音上以数字人为载体,与用户进行互动,影响辐射感兴趣的年轻人。我们自身的李未可数字人和其他的KOL都可以作为展示Meta Lens的窗口,更直接地触达用户,从而促进转化。这种方式比仅仅在电商平台上架一款商品等着用户主动来买的转化率要高。同时,Meta Lens作为一种生活方式,也需要多层次的触达用户,不仅仅是商品介绍,还要有视频内容,甚至是直播的方式。
对于传统产品来说也许简单通过传统广告触达用户就可以立刻促成转化,但AR眼镜行业是个全新的品牌,用户还不清楚能够用AR眼镜做什么。因此我们需要将产品的价值观、生活方式以及应用场景,通过多种内容形态传递给用户。这才面向未来的产品适合的销售方式。
所以电商平台只是流量承接的阵地,是销售的最后一环,是完成转化的环节。
Q:我们知道AR眼镜的一大痛点就是续航和功耗。Meta Lens从户外场景切入,对于续航和发热的问题我们怎么解决呢?
A:从硬件的角度,大家觉得AR眼镜的续航问题很难解决。其中的原因,一方面是AR眼镜的显示方案和芯片本身的功耗很高,另一方面是产品要实现的场景特别多,又要能播视频,又要能玩游戏,希望它无所不能。业内尝试外接一个充电宝或者计算平台来解决这些问题。但这种分体式的方案并不适用于所有场景。李未可主打户外场景,我们希望不让用户从头上接一根线一直连到兜里,这不适合户外的用户行为。
因此我们还是选择在一体机上下功夫,解决功耗问题,方案要足够省电。首先我们要降低硬件的基础功耗。我们选择高通穿戴式芯片,光学方案采用自主研发的Binoculars双目AR显示系统,都是为了降低功耗。我们用了六个月时间,与供应链共同研发了Binoculars系统,采用单光机双目技术,相比于双光机方案,我们在保证了亮度足够的同时,实现了更低的功耗、更轻的重量。
其次,我们在软件架构上也做了取舍。我们认为针对户外场景,我们可以暂时选择不支持玩游戏和看电影这样功耗较高的场景,根据现有硬件的能力,先专注于满足户外的需求,如导航、听音乐、拍照、运动检测和心率监测等。
同时,我们将一部分运算放在云端,比如实时AI能力和语音交互的识别。这样一来,我们的终端性能不需要外接主机,就足够支撑起我们设计的应用场景。
Q:续航和功耗问题被解决的话,Meta Lens 确实是一款非常适合户外骑行等运动的产品。Meta Lens也和自行车协会开展了合作,在户外运动时带上Meta Lens后真的可以不用再掏出手机吗?比如用户想切换正在播放的歌曲,或者更改导航目的地,这个交互过程自然吗?
A:Meta Lens在全流程都采用语音交互的方式。在进入AR眼镜之前,我们团队在语音交互领域做了五年。做AR眼镜相比做搭载语音交互功能的智能硬件来说难度更高,但主要是硬件层面更难一些,在交互上其实可借鉴的地方很多。
Meta Lens的三大功能导航、音乐和拍照,对于这些场景,语音交互都很适合。例如在导航中想要更换目的地,喊出小柯或零下,直接说导航去哪里,整个流程就完成了。同时我们还专门设计了一些快捷词,让用户在和语音助手的交互中更加方便。例如用户想要拍照,可以直接说“小柯,你看”,照片就拍好存到相册中了。应该能感受到,这个快捷词交互很自然,就像是和身边的朋友交流,而不是一个冷冰冰的语音助手。
AR眼镜被很多人认为是下一代计算平台,很有可能在未来代替手机。但在探索的过程中我们发现,手机的屏幕可以直接触摸,但AR眼镜不像手机一样可以直接用手指交互。AR眼镜将屏幕直接呈现在眼前,就像眼前挂了一个无边界的巨大电视一样,用户的视觉体验确实会更好。但大家都用过电视,应该能体会到,电视用遥控器操控其实是很累的。AR眼镜也是一样,画面在你眼前,但是你又摸不到。所以对待下一代计算平台的产品,它的交互方式一定要比手机和电视更加自然和方便,得采用颠覆性的技术,而不是在手指触摸、遥控器上小修小补。
我们团队深耕语音交互多年,我们认为智能硬件的一个方向是必须和人建立起情感连接,一定要随身,要摆脱传统的交互指令。在这种考虑下,我们选择做了虚拟数字人。他有自己的人格,能和人进行深度的沟通。就像最近讨论度很高的问题——ChatGPT能不能代替搜索引擎一样。虽然现在模型在训练上还有改进空间,但未来趋势一定是人工智能逐渐摆脱纯工具性,朝着人格化发展。
Q:您提到人工智能,我们知道此次Meta Lens也强调了AI+AR。具体到应用上,AI提供了哪些能力,如何赋能AR眼镜的应用场景?Meta Lens定位了6大AI场景:旅行、骑行、逛街、通勤、运动、郊游。相比于通用语音助手比如用户熟知的小爱、Siri,Meta Lens在这些领域做了哪些优化,提供了怎样的差异化产品力?您可以以其中一个场景为例介绍一下吗?
A:我来举一个户外的例子吧。我们现在在做的一件事是建设“LBS知识图谱”,相当于一个基于地理位置信息的实时数据库。过往我们和通用语音助手交谈,你可能能问他今天天气怎么样,然后AI根据你所在的位置,告诉你天气情况。但这个信息检索的路径比较粗糙,我们在做的知识图谱更加细致。
以骑行为例,我们的语音助手不仅仅能做到像传统导航一样,告诉用户从A地到B地哪条路最近,还可以针对你的个性化需求给出建议。比如爸爸妈妈带着孩子在西湖边骑行,那我们的语音助手可以根据大数据推荐给这家人适合亲子游的路线。再比如外地游客来到西湖游览,我们的语音助手不会只把最近的路线告诉用户,而是告诉用户哪条路线被80%的游客走过,这可能是一条经典的游览路线。
更精细一些,未来LBS知识图谱甚至可以赋予语音助手导游的功能。比如游客来到岳王庙,语音助手可以播报岳飞事迹、文物特点以及当时历史背景的介绍。这就是针对旅游场景优化AI的一个例子,我们的知识图谱针对很多户外场景都做出了类似的优化,这是通用语音助手难以做到的。
建设知识图谱是一个很大的工程,我们也一直在推进知识图谱的完善,希望将其拓展到更多的场景。我们将知识图谱作为AI的基础能力之一,让语音助手拥有人性化的、知识化的问答能力。
Q:知识图谱涉及很多垂直场景,如果单单由李未可一家公司来做的话,确实工程量很大。说到这里正好涉及到一个问题:茹总曾经说过,Web3 和 XR 的时代应该是大家一起创造出来的。那么李未可未来有没有和创作者共建生态的打算呢?
比如现在Meta Lens的功能打磨比较完善,但大多都是自有应用,例如录像拍照、运动记录、播放音乐和天气查询等都是平台自有应用。此后Meta Lens的软件路线也会以功能性为主,弱化内容生态吗?
A:未来肯定会和行业的各个参与方共建生态的。不过我们认为,“生态”无法强求,而是顺其自然。当你的产品做到一定程度时,用户自然会在你的平台上开发应用。包括硬件销量和用户数达到一个足够的量级,包括平台提供的开发工具和能力接口足够完善。
iPhone在2017年1月发布,App Store却等到2008年7月才上线,而上面的应用逐渐丰富和完善更是等到了2010年之后。因此苹果生态其实也经历了很长的过程,用了两三年的时间去迭代、去完善产品,等到用户基数足够时,开发者才开始重视这个平台。没有操作系统能脱离用户,它不单单是技术问题,还是市场问题。
我们现在需要做的事情,是考虑未来的接入方式会有哪些,系统未来如何扩展,去容纳越来越多的用户。比如Web3时代,我们用“AI云端化”的方式让开发者接入。就现在来说,用户量不足,开发者就没有收益;开发工具不完善,开发效率就会低。当这两个事都解决了,生态会自然形成。
Q:刚刚我们聊了语音交互。茹总曾经提到过,在元宇宙中,人们的交互依赖于视觉注意力,因此数字人将成为元宇宙中最好的用户交互中介。可以看出您对语音交互作为看好。除了语音交互外,您对于AR眼镜的其他交互方式有哪些思考?
A:从交互层面来说,我确实认为语音数字人是更自然的交互方式,是未来AR眼镜的主要方向。语音交互在大多数场景中足够用了,但我们的交互可以做得更好,在更细节的地方带来更好的体验。我们对未来交互方式提出了一个概念“多模态交互”,以语音交互为主,手势追踪、眼动追踪、基于位置的识别等未来交互技术为辅。探索更多技术是为了在更加细分的场景中带来更好的用户体验,而不是完全颠覆已经成熟的技术。
其实我们回溯从PC发展到智能手机的过程中,键盘和鼠标始终没有被替代。手机主要基于消费内容的交互,而输入并没有那么方便。下一代计算平台在消费内容的交互上靠语音交互可能够用了,但在输入层面其实整个行业还没有找到更好的替代鼠标和键盘的方法。这个也需要在多模态交互中探索,新的方案不可能是一个虚空键盘平移到AR中的,它肯定是革命性的,效率远胜键盘。甚至可能要从底层就开发全新的创作生态,比如做一个原生于AR眼镜的Office。但这个问题全行业都在探索,包括Apple在平板上也没有很好的解决这个问题,AR行业还需要时间。
Q:既然您将虚拟人和语音交互看做是元宇宙的基础设施,那以后会考虑将李未可的能力和虚拟形象作为AI助理开放给其他AR眼镜硬件厂商?现在手机领域的AI助理,例如小爱同学,不仅仅内置于在小米手机,其他品牌的手机也可以安装App来使用,以此增加了受众人群。还说是出于打造竞争壁垒的考虑,李未可只会将数字人搭载于自己的AR眼镜产品?
A:首先我们肯定不会不愿意开发,因为我们觉得数字人的系统本身就是需要共建的,单独一个公司不可能他做到完美。举个例子来说,用户在实际使用中可能会问数字人附近有什么好吃的推荐。要让数字人支持点餐功能,相当于要把点餐系统嵌入数字人系统,那就得饿了吗和大众点评自己重新做一遍。这个工作量太大了,不可能说我们一个做数字人的公司,要重新做一个美团吧。就算你做了餐饮行业的,还有成百上千的行业、成千上万的互联网应用,怎么办。细分场景太多了,不可能由一家公司负责优化。所以开放是必然的,最终还是要与各个垂直场景的玩家合作,接入他们的服务。现在我们考虑的不是开不开放,而是什么时间点与各方开展合作更合适。
Q:那以后还会拓宽场景吗?比如进入室内场景。
A:未来我们的场景肯定不会局限于现在这几大户外场景,我们开始设计架构时,就支持了以后的扩展。包括交互能力的外放、服务接入的方式等。所以李未可想要拓宽场景是比较容易的。
进入室内场景,像影音娱乐这些功能做起来并不难。核心的问题一个是前面说过的硬件适配的问题,我们要兼顾轻薄和功耗。现在我们没有开发室内场景主要是觉得技术很不成熟,还没到不连一根线外接主机就能佩戴三个小时玩游戏或看电影的阶段。VR比较重,现在能做到,但AR需要轻薄,现阶段还无法做到。室内肯定是很好的应用场景,我们会慢慢探索,平衡好佩戴舒适度与性能。
Q:那进入室内场景的时间点大概是什么时候呢?是等云计算传输速度足够、终端芯片的性能足够以后吗?
A:对,除了这两个还有就是要等彩色光波导技术更加成熟。现在我们做的单色光波导,整体光机重量才12克。如果要做彩色光波导,第一光学模组很重,第二功耗很高。AR眼镜上的电池很轻很小,用彩色光波导的话可能十分钟就没电了。这也是很多友商现阶段选择分体机方案的原因,将计算模块和电池外置了,眼镜上占大头的只有光学模组。
Q:说到光波导,我们知道Micro LED+光波导被业内普遍认为是目前在体验上更理想的解决方案,但同时成本也较高。如何在行业初期兼顾成本与体验?Meta Lens从定价上来看定位偏高,如何能够在消费者未被AR充分教育的市场中触达更多人群?
A:我们做了很多努力,跟供应链厂商建立了良好的沟通,合作研发把成本降下来。比如我们只搭载了一个光机,在保证一定的光效的同时降低了成本。光波导确实是相对更优的方案,成本肯定比传统的BB方案要贵。我们做产品考虑的是产品有没有价值,取决于你带给用户的体验好不好。如果说我们创造的体验是其它眼镜没有办法创造的,那我们在定价上可以稍微贵一点,用户也愿意买单。比如BB方案遮挡很严重没法做HUD导航,我们的方案没有遮挡问题,就可以实现HUD这种功能。
如果你的成本增加能带来稀缺性,那就值得上更好的方案。如果你的功能并不是市场上唯一的,那你就得把成本降下来。
Meta Lens去年12月正式发售,我们最近就是一直在和前期用户沟通,获得他们对于产品的反馈。目前我们得到了非常多正面的反馈,80%以上的用户都觉得这个产品是他想要的。因此我们对自己的产品还是很有信心的。另外现在是冬天,是户外场景的淡季。我们认为到春天的时候,会有越来越多的人佩戴Meta Lens到户外使用,相信到时也会形成更大的传播效应。
Q:除了光学显示,AR眼镜的很多技术路线都没有定论,比如说声学方面的开放式扬声器和骨传导,比如计算单元内置还是外置,李未可团队在设计产品时,是如何在不同路线中抉择的呢?有没有一个原则性目标,比如想要保证哪些体验优先,其它体验可以适当往后放?
A:这个问题和刚才成本的问题一样,还是要站在用户角度。选择什么样的技术路线要由场景来决定。比如音响方面,像骨传导和开放式扬声器的方向不同,我们在设计时,就要考虑哪个对于我们的目标用户来说体验更好。我们最终选择开放式扬声器,主要是因为我们有语音交互,需要能定向的输入输出才行。评估了很久,最终觉得能定向的Speaker效果更好。我们也在产品研发过程中试验过骨传导方案,发现在高音上损失比较多,整体音质不太好。再有一个,骨传导需要搭载一个振子,这个元件是铁的,这就增加了整机的重量。最终综合用户体验的多个角度,我们选择了开放式扬声器。
我们不会押宝技术,认为哪个技术就是终极方案。技术在进步,产品也在迭代。在研发上,我们会探索多个技术方向;在产品上,会用现阶段最理想的技术
Q:Meta Lens具备拍照功能,这可能会让人质疑隐私和肖像权等问题。手机时代如果要进行拍摄,其实动作还是比较明显的,但AR眼镜几乎做到了“所见即所得”,佩戴者的视野在什么方向,就有可能照到什么方向。甚至以后可能眨一下眼就能完成拍摄。而这也是行业共同的问题,李未可是如何考虑这个问题的,有没有做出一些防范措施。
A:这个问题我们在产品刚立项的时候就讨论过。一开始有点不想上摄像头和拍摄功能,但我们发现这个问题不是我们一家的问题,是行业都要面对的,甚至还有厂商专门做拍照眼镜呢。我们从自己产品的应用场景考虑,我们的场景在户外,实际上户外大家的隐私问题没有室内那么严重,因为大家都是直接展现在人眼前的,会打扮好自己的形象。手机在户外也经常碰到有人拍照的情况,其实大家也可以接受。
我们做的防范措施就是构建拍照时的隐私规范,比如用摄像头指示灯向外提示正在拍照。目前我们对这个问题也没有完全解决,也处在尝试的过程中,在陆续收集用户的真实反馈,看看大家对于隐私的需求是怎样的,之后我们在针对性做出改进。
Q:Meta Lens强调一体性,注重便携性,同时还内置eSIM卡,拥有独立的联网能力、独立的供电能力、独立的运算能力。这不禁让消费者好奇,李未可设想中的AR眼镜的理想形态是怎样的?哪些功能您觉得很棒但现在由于各种原因还未能放到产品上?
A:如果大家都觉得眼镜是下一代计算平台的话,它的终极形态一定是可以解决大部分手机上能解决的问题,而且能解决的更好。我们对很多场景都已经有了设想,例如现在手机导航就是在地图上划线,来告诉用户怎么走。而AR眼镜可以直接在前方的路面上显示箭头,用户看路而不是看地图就可以到达目的地。同时,我们基于AI和LBS以及用户数据,根据用户特点提供综合服务,我们会告诉用户你能在这附近吃什么、看什么,等等。
我们能想象到的科幻,其实未来在AR眼镜中都能实现。坦率地说,从技术角度讲,这些东西今天已经可以做到。只是现在算力和功耗问题还没有很好的解决。我们相信未来三到五年,随着硬件的发展、算力足够支持丰富的功能和应用,那每个开发者都可以利用我们的设备展现想象力。这正是我们努力的方向。
【关于行业】
Q:前面咱们提到的这些技术,对于供应链有哪些要求?这个行业供应链的特点是什么?茹总以前负责过天猫精灵和小米电视的业务,能不能对比智能音箱和电视的供应链来讲一下异同点。
A:AR眼镜的供应链和这些行业相似度不高。音箱、手机和电视的供应链已经相对比较成熟,这些行业其实是从传统音箱、传统手机和传统电视发展到智能音箱、智能手机和智能电视的,传统产品和智能产品同属于电子消费品,我们叫3C产品。因此在加入智能化体系之前,他们的制造体系就已经搭建完成了。但AR眼镜,不能说他是在传统眼镜上加入了智能功能。过去的眼镜就是一个传统行业,它不是电子消费品。这个行业不是演进,而是突变成一个科技行业,这个跨度太大了。我们在产品立项前去深圳考察过传统眼镜的制造,制造方式偏向于手工。而AR眼镜却需要智能的制造方式,而且它的工艺比手机更精密。
另外,手机屏幕在初期其实继承了电视行业的LCD。而AR眼镜用到的光学模组是一个全新的行业,之前从来没有过。在供应链上,上下游都没有经验。比如定制的时候签订质量协议,双方都不知道良品率多少合适,是百分之一,千分之一还是万分之一。没有过往的协议可参照,完全是从0开始摸索。
Q:供应链确实是AR这个新兴行业的痛点之一,除此之外,茹总以前接受采访的时候说过,现在行业的问题外在是技术,内在是用户心智的形成。可能很多消费者对AR眼镜还不是很了解,不知道AR眼镜能给自己带来哪些效用。同时,我们都怕好的产品和坏的产品放在一起,大家分辨不出来。面对消费者,您能给出一些挑选合适自己的AR设备的诀窍吗?
A:其实消费者挺聪明的,只是现阶段消费者可能不清楚AR眼镜能干什么,还是需要被别人推荐,或者通过某种途径了解到这个眼镜的实际用途,再据此判断这个产品是不是符合自己的需要。
我觉得其实没有什么诀窍,消费者挑选AR眼镜一定是根据自己的需求和预算,找到适合自己的产品。比如想用来玩游戏,那可能很多人会选择VR眼镜或者Rokid、Nreal这种主打影音的AR眼镜。这类产品其实和Xbox是替代关系,本来要买传统游戏机的用户,就适合购买这类产品。
又有一类人群想要去户外徒步,他想要买墨镜、耳机,想要买运动相机。这类人群发现有一款AR眼镜可以同时代替这些功能,那他就适合买我们李未可的Meta Lens。根据预算以及本身要花多少钱满足这些需求,来判断Meta Lens是不是他的选择。
现阶段不可能找到一款AR产品能解决消费者的所有需求,因此消费者需要根据自己最核心的一两个需求,来选择产品。
Q:您提到不同功能的眼镜满足消费者的不同需求。包括VR眼镜与AR眼镜,它们之间并非是替代关系。很多从业者都会考虑AR与VR的区分度。例如Apple的蒂姆库克,他认为VR是过渡方案,AR才是未来代替手机成为新一代计算终端的主流产品。您是怎么如何看待这两种路线的呢?
A:主要还是场景不同。有一些重合场景,特别是在室内,例如一些娱乐影音功能。库克所说的AR是未来,其实应该这么说,当产品能够做到足够轻薄之后,AR和VR都会走向XR。只是现在没办法做出一款全功能的、覆盖所有场景的XR眼镜,因为技术上不支持。未来技术足够成熟后,的确可以做出一款XR眼镜尽可能的搭载所有功能。但我们也可以预见到,即便如此,到时很可能仍会出现很多针对不同场景设计的不同的XR眼镜。
我们在研究传统眼镜这个品类的时候发现一个很神奇的现象,就是现在人们佩戴的眼镜往往也不止一副,可能看书有看书的眼镜,出门有出门的眼镜,等等。
总的来说,我认为从技术上来说,XR眼镜有融合的趋势,大的方向一定是越来越轻薄、佩戴越来越方便、娱乐功能越来越完善。但从场景上来说,依旧会出现针对特定场景做优化的XR眼镜。
Q:有道理。其实即便如手机这般成熟的产品,到目前为止的产品分类也是有主打方向的。例如有影像旗舰、商务旗舰、游戏小钢炮等等。
接下来的问题是有关李未可公司和整个AR行业的。在李未可内部,数字人和AR业务之间是什么关系?现在AR业务在整个公司层面的重要级别、资源分配大概是什么水平?公司对于AR业务的定位是什么?
A:我们公司的主营业务是AR产品,也就是Meta Lens这样的AR眼镜。数字人其实是我们的一个营销品牌和营销阵地,用来传播和营销我们的AR眼镜。数字人业务是为AR硬件服务的,但它也有自己的发展内容的主线和逻辑。
(李未可团队在创立伊始就开启了硬件项目,但由于硬件研发周期较长,数字人项目同时启动,作为硬件产品推出之前的造势和引流阵地)
Q:关于行业竞争,我们看到现在做AR硬件的主要是互联网科技大厂、AR初创企业以及传统硬件厂商三类,您觉得李未可做这件事有什么优势和劣势?
A:作为一个创业公司,我们最大的优势就是可以快速接受市场反馈,不断迭代。在很多新行业崛起之时,我们都会看到一些新的公司出现,他们的反应速度比传统大型企业更快,可以更虚心地接受反馈、更快地调整,这就是创业公司始终存在的原因,也是商业的规律。
具体到李未可的优势来说,我觉得一是我们的团队更加完整,我们团队既有对AI的理解,也有对硬件制造的理解。例如我们一些合伙人在做李未可前做了五年的AI交互,我们知道AI背后需要什么样的能力,如何构建AI的体系。同时,相对于大厂业务广泛,我们也更加专注,对AR眼镜目标用户群的理解更加深刻。
说到我们的劣势呢,AR行业大家现在都在一个起跑线上,主要问题还是用户认知层面的问题。AR眼镜这个品类太新了,新品类获得用户认知需要时间和成本。在教育市场的过程中,大厂最大的优势是用金钱换时间。通过补贴的方式降价,使用户获取产品的成本降到最低,从而形成很强的用户认知。很多行业采用过这种打法,例如滴滴吸引用户用App打车,再到现在Pico的补贴。对于我们来说,我们没法采用这种方式,因此需要的时间更多。
Q:如果大厂打价格战,并且大力投放广告,是不是意味着李未可对融资的需求量较大,要有足够的资本度过培育市场的阶段?
A:我觉得还好,对我们来说融资是企业经营的一个方面。
中国互联网发展到今天,包括硬件行业,已经不太适合完全通过价格战的方式培养用户了。在初期,价格战确实对培养用户认知有帮助。但在中后期,仅仅通过价格战让用户了解到这个产品,之后当用户购买的时候,补贴并没有很大的益处。因为一个产品的价格锚点一旦确定,其定位就在用户心中形成了,这对产品品牌来说是一个极大的伤害。
所以我们并不觉得这个事情一定要通过砸钱去做,像我们通过数字人去找到核心用户进行推广,在找到前几批用户后,可以通过用户破圈推广,让用户自发地传播产品,我认为合理的消费品思路是这个样子。
只要企业没想一下子就做到一百万一千万的量,短期就获得很高的用户数,那我们按照正常的市场逻辑去走,只需要做好常规的营销就可以了。话说回来,AR市场还处于前期阶段,现在完全没必要自降身价换取销量。产品也并非越便宜越好,消费者现在配传统眼镜的时候,也不会就瞄着100块钱的眼镜,1000元以上的眼镜也有极强的市场吸引力。
Q:听起来茹总现阶段对于产品起量没有那么执着,那您对Meta Lens的出货量有什么期望吗?
A:我觉得应该是一个逐步上量的过程。2023年应该能到几万的量级,后年应该有几十万的量级。这个量指的是包括我们之后迭代推出的新品,不只是现在的两款Meta Lens。
Q:迭代很快的话就出现一个问题,如果AR眼镜每年的新品都搭载了很多不同的技术,那是不是消费者购买旧产品不太划算,厂商的库存就很难消化呢?
A:迭代其实没有那么快。根据AR眼镜现在的技术难度来说,研发一款新产品至少需要一年。研发完成之后,如果新产品用上了更新的技术,核心功能提升确实能带来更好的效果,但同时产品成本也会更贵,售价没有老款那么便宜。
其实我们在设计产品的时候,已经考虑到了很多基础功能的迭代。像Meta Lens支持4G,能做到云端一体,很多功能我们可以在云端进行升级,在硬件不变的情况下,通过OTA把系统固件升级直接投放到终端。在这种思路下,我们的第一代AR眼镜相对于此后的迭代产品,并不会有太大的落后。
Meta Lens这款产品我们在设计上考虑了很久,路线非常明确,我觉得在户外的场景支持两三年是没有问题的。
Q:AR行业还没有出现一款像Quest 2之于VR行业一般的用户超过1000万的代表性产品。您怎么判断AR行业接下来的发展节奏?例如什么时间点会出现爆款产品?有几家企业会进入决赛圈?
A:爆款产品可能还要两三年,说不好,但我觉得是有机会的。两三年左右,上百万的产品肯定会出现,上千万的话可能得看运气了。
有哪些企业会留下来,这个就不好说了。AR眼镜行业和手机行业比较像,未来的市场空间很大。我觉得初期应该有十到二十家。等到市场容量足够大以后,经过充分的竞争,AR可能会想现在手机行业一样,至少有五家左右的领头企业,但很难有市场份额超过30%的企业,基本上都在10%左右,不可能出现一家独大的情况。
AR眼镜这个品类也有点像汽车,它们都是炫耀属性比较强的产品。不可能所有人都要开奔驰,或者都要开特斯拉,每个人会有自己偏好的车型。AR眼镜也是一样,有很强的社交属性,因此AR眼镜的品牌也会比较多。
Q:在这样的市场特点下,各家AR眼镜品牌对于眼镜形态的设计是不是需要体现很多个性化的东西?我们看到Meta Lens眼镜外观就比较新潮的,前挡有多种潮流墨镜片可选,年轻人戴上以后可以在户外保持特立独行的外观,可能还会引来路人的目光。
A:没错,个性化很关键,我们也一直在形态设计上下足功夫。我们主打目标客群中也有潮酷人群嘛,年轻人带上Meta Lens挺拉风的。
Q:国内AR人才的流通情况如何?国际上Magic Leap曾给行业输送了很多人才。就国内来说,AR行业的人才流动性大小和人才缺口是怎样的?
A:AR行业现在还处于非常初期的阶段,行业真正起来也就两年时间,2021年有一些小公司开始创业,2022年出现了一批公司。现在大家还都从硬件入手,从光学到整机厂商。现在还没有多少人做应用,包括算法也处于比较早期的阶段。应该说整个行业都比较缺乏人才。
现在积累了一批光学层面和整机层面的人才,很多人从手机厂商出来做AR,至少在制造工艺上已经可以做到一定的水平了。但AR本身的人才并不多,现在有一些做自动驾驶的、做图像识别地人跨到AR行业,跨过来本身并不难,难的是做AR真正需要的是既要懂技术,又要懂和知识的结合,还要懂点美术,等等的经验。再往上,需要对AR眼镜整个系统有清晰的理解,得有融合AI、AR、硬件、算法、设计的能力,最终才能做出一款接近手机品质的智能硬件。
总的来说AR行业处于一个培育过程,其他行业转过来的人比较多,原生人才和综合性人才还是比较少,几乎没有。