acm-header
登录

ACM通信

贡献的文章

通过标记像素来理解场景


通过标记像素来理解场景,插图

信贷:安德鲁·乔伊斯

编程计算机自动解释图像的内容是人工智能和计算机视觉领域长期面临的挑战。这种困难在计算机视觉研究早期的一件众所周知的轶事中得到了回应:麻省理工学院的一名本科生被要求用整个夏天的时间让一台计算机描述它从摄像机获得的图像中“看到”了什么。35近50年过去了,研究人员仍在努力解决同样的问题。

回到顶部

关键的见解

ins01.gif

场景可以用多种方式描述,包括关于对象、区域、几何形状、位置、活动的细节,甚至是非视觉属性(如日期和时间)。例如,一个典型的城市场景图1)可以通过指定前景汽车对象和背景草地、天空和道路区域的位置来描述。或者,也可以将图像概括为街景。我们希望计算机能够推理场景的所有这些方面,并提供粗略的图像级标记和详细的像素级注释,描述场景的语义和几何形状。早期的计算机视觉系统试图通过使用单一的统一模型来联合描述场景的所有方面。然而,问题的难度很快压倒了这种统一的方法,直到最近,对场景理解的研究沿着许多不同的轨迹进行。


没有发现记录

登录阅读全文

登录

如果您是ACM会员、通讯订阅用户或数字图书馆订阅用户,则使用ACM Web帐户用户名和密码登录以访问优质内容。

需要访问吗?

请选择下面的一个选项以访问高级内容和功能。

创建一个网上帐户

如果你已经是ACM会员,通信订阅者或数码图书馆订阅者,请设置网页帐户,以浏览本网站的优质内容。

参加ACM

成为ACM的会员,可以充分利用ACM卓越的计算信息资源、网络机会等优势。

订阅ACM杂志通讯

获得50多年的中华中医药学会内容的完整访问权限,并每月获得杂志印刷版。

购买这篇文章

非会员可以购买这篇文章或刊登这篇文章的杂志。
登录为完全访问
»忘记密码? »创建ACM Web帐号

通过标记像素来理解场景

" >
Baidu
map