acm-header
登录

ACM通信

ACM TechNews

利用2D图像提高人工智能理解3D空间的能力


MonoCon如何在“边界框”中放置它所感知的对象。

这项工作将帮助自动驾驶汽车中的人工智能利用从车载摄像头接收到的二维图像与其他车辆进行导航。

来源:吴天福,马特·希普曼

北卡罗莱纳州立大学(NC State)的研究人员开发了一种技术,利用二维(2D)图像来提高人工智能(AI)程序识别三维(3D)物体的能力。

这项技术被称为MonoCon,它可以利用来自车载摄像头的2D图像,改善自动驾驶汽车与其他车辆之间的导航关系,这种技术比激光雷达传感器更便宜。

MonoCon可以将2D图像中识别的3D对象放入“边界框”中,该框向AI指示对象的最外层边缘。

北卡罗来纳州立大学的吴天福(Tianfu Wu)表示:“除了要求人工智能预测相机到物体的距离和边界盒的尺寸,我们还要求人工智能预测每个盒子的八个点的位置,以及它到边界盒中心的二维距离,”这“有助于人工智能更准确地识别和预测基于2D图像的3D物体。”

北卡罗莱纳州立大学新闻
查看全文

版权所有©2022SmithBucklin,美国华盛顿特区


没有发现记录

Baidu
map