AR和图像识别的关系到底是什么?
admin
2023-06-25 04:41:04
0

先给出结论:

1、SLAM 是支撑 AR 的必须技术;

2、基于视觉(即图像)的 SLAM 方法,虽然使用了图像信息,但不需要对图像进行识别;

3、物体识别、文字识别是为了实现某种效果,在使用 AR 的同时可以自由选择的技术;

画张图大概是这样的:



4、物体识别、文字识别是图像识别的子任务,除了这两项,图像识别还包括细粒度识别、场景识别、场景描述等其他子任务。

SLAM 能让机器对周围环境和距离有所感知,有多种实现方法。AR 想要实现的,是在现实世界中,「稳定」的呈现虚拟的事物,对周围环境的感知和定位,是实现 AR 的基础。

手机上或眼镜类设备使用的 AR 通常基于视觉,也就是图像。单目摄像头通过对比移动中的图像对环境进行三维构建,例如单摄像头的手机;如果有两个摄像头,机器就能像人眼一样更轻松的对环境作出估计。

在这个过程中,机器只要对接收到图像的不同进行对比就可以,并不需要理解、也就是识别图像是什么。


「知智一分钟」第二季有详细讲过这些,关于 SLAM 的更多信息可戳此了解:

有了对环境的感知和定位,虚拟的三维图像就能在空间中稳定呈现。如果想要实现其他的效果,比如用手机拍商品实时显示价格,配合道具玩的 AR 游戏,就需要对现实场景中的物体或者文字进行识别。

除了图像识别,AR 也可以与自然语言处理等技术相融合,比如火了一次又一次的 Google 即时翻译。



根据AR 产品目的的不同,使得最终搭配的技术和算法都会不同。


到这里回答完了题主的第一个问题,至于第二个「物体识别、文字识别等在技术上是否有本质区别」?

图像识别的本质是将一张图对应到文字或者标签上,从这个角度看,本质的确是相同的。

希望能够解答题主的疑惑~

相关内容