的第二天ACM多媒体2013充满了挑战和竞争。
的多媒体大挑战是一个全体会议,在这个会议上,研究人员以非常快的节奏(5-6分钟)提出他们的解决方案,以解决一些公司提出的挑战,如雅虎!微软、特艺七彩、华为等。
这些挑战确实是相当大的:想想如何解决200万张图片的大规模Flickr-tag图像分类(由雅虎提出),从查询视频中提供丰富的多媒体检索(由Technicolor提出),在视频中找到漂亮的镜头(由NHK提出),或者为必应开发一个网络规模的图像检索系统(由微软提出)。
关于Bing的挑战任务,我想强调的是,微软做了一件对科学界非常有用的事情:他们提供了Bing的查询日志和用户点击的信息。该数据集仍可用于未来的开发。
在提出的解决方案中,我更喜欢的是那个获得二等奖)载于“视频美学评价的综合计算模型研究”。作者提出了一种方法,使用美学模型强调从多个层次提取的心理-视觉统计,与依赖视觉概念分类器集的更典型的方法形成对比。特别是在中间层的制度上,有了新的大规模视觉情感本体(以及相关的检测器- >1200)。关于此本体的详细信息,请参阅“使用形容词名词对的大规模视觉情感本体和检测方法的论文,该论文已在“勇敢的新话题:社会和认知方面”会议上发表。
没有发现记录