AR和图像识别的关系到底是什么？ _营销

admin

2023-06-25 04:41:04

0次

先给出结论：

1、SLAM 是支撑 AR 的必须技术；

2、基于视觉（即图像）的 SLAM 方法，虽然使用了图像信息，但不需要对图像进行识别；

3、物体识别、文字识别是为了实现某种效果，在使用 AR 的同时可以自由选择的技术；

画张图大概是这样的：

4、物体识别、文字识别是图像识别的子任务，除了这两项，图像识别还包括细粒度识别、场景识别、场景描述等其他子任务。

SLAM 能让机器对周围环境和距离有所感知，有多种实现方法。AR 想要实现的，是在现实世界中，「稳定」的呈现虚拟的事物，对周围环境的感知和定位，是实现 AR 的基础。

手机上或眼镜类设备使用的 AR 通常基于视觉，也就是图像。单目摄像头通过对比移动中的图像对环境进行三维构建，例如单摄像头的手机；如果有两个摄像头，机器就能像人眼一样更轻松的对环境作出估计。

在这个过程中，机器只要对接收到图像的不同进行对比就可以，并不需要理解、也就是识别图像是什么。

「知智一分钟」第二季有详细讲过这些，关于 SLAM 的更多信息可戳此了解：

有了对环境的感知和定位，虚拟的三维图像就能在空间中稳定呈现。如果想要实现其他的效果，比如用手机拍商品实时显示价格，配合道具玩的 AR 游戏，就需要对现实场景中的物体或者文字进行识别。

除了图像识别，AR 也可以与自然语言处理等技术相融合，比如火了一次又一次的 Google 即时翻译。

根据AR 产品目的的不同，使得最终搭配的技术和算法都会不同。

到这里回答完了题主的第一个问题，至于第二个「物体识别、文字识别等在技术上是否有本质区别」？

图像识别的本质是将一张图对应到文字或者标签上，从这个角度看，本质的确是相同的。

希望能够解答题主的疑惑～

图像5物体5文字5摄像头5技术