本周,芝加哥将举办第19届thACM知识发现和数据挖掘SIGKDD会议.来自学术界和工业界的1200多名研究人员和实践者聚集在一起,讨论、辩论并推进从数据中发现知识的领域。融合了理论和算法的进步,非常新颖的应用和应用数据挖掘解决现实世界问题的经验,展示了这个充满活力的社区的多样性。
KDD是计算机科学和统计学社区中最具竞争力的会议之一,在研究轨道上,论文的接受率只有17%。关于KDD更值得注意的是,行业政府(IG)轨道与研究轨道的显著集成。IG的跟踪论文展示了最好的应用程序,其中许多应用程序是利用现有的机器学习技术来解决现实问题的。这些论文还有助于开发广泛适用于跨数据集和领域的新范式。以下是今年的最佳论文奖得主:
查看KDD 2013主题区域:
现在成熟行业实践博览会(IPE)轨道使得KDD成为大数据从业者的必参加活动,因为它为精选的资深和有经验的数据挖掘专家提供了一个论坛,介绍他们在不同行业环境中部署数据挖掘和机器学习解决方案的经验。今年的公众政治研究中心邀请了8位世界著名的专家,并首次就一个具有煽动性的话题举行小组会议:“专家死了?”算法的兴起和领域专家的衰落。”
KDD的另一个突出特征是其年度首要数据挖掘比赛KDD杯的威望。你可能还记得著名的Netflix奖,它是KDD杯的先驱。在会议社区环境中举办竞赛以促进研究的最初想法诞生于SIGKDD,并已被许多其他SIGs和其他计算机科学论坛采用。今年的KDD杯2013比赛的特点是异构的,复杂的和嘈杂的现实世界数据集提供微软学术搜索.超过800个团队为两个挑战设计了精确的解决方案:(a)消除重复的作者名称的歧义,(b)改进作者论文分配。学生、教师和行业开发人员在短短两个月的时间内开发和测试了超过10,000个数据挖掘模型!挑战和获胜的解决方案/模型都是开源的,并且在网络上广泛可用KDD杯2013网站.今年这两项挑战的冠军是台湾大学团队算法。
尽管过去的会议和KDD 2013有很多相似之处,但我在今年的会议上注意到一些独特之处。在前几年,一个与会者通常会在一个会议上停留两个小时,而现在,他们会在不同的会议上参加会议!起初,我以为这可能是一个零星的事件,人们蜂拥去听我们的“明星”演讲者的演讲。经过仔细观察,我注意到不断有参与者在研究、行业和行业实践博览会的轨道上选择各种各样的演讲。这对SIGKDD来说尤其是个好消息,对计算机科学来说更是如此。随着理论进步与应用研究人员共享领奖台,新一代的数据科学家即将出现,在那里,安全帽和实验室外套融合在一起,成为潜在的科学数据驱动的进步的海洋,不仅平等地,而且公平地造福于我们社区的每一个组成部分。也许这种科学和工程结合的最好例子是SIGKDD博士论文奖的评选,获奖者关注的是异构信息网络,而亚军则深入研究了机器学习原理在健康信息学中的应用:
SIGKDD博士论文奖亚军华莱士:拜伦,“健康信息学中的机器学习:更好地利用领域专家”,导师:卡拉Brodley,塔夫斯大学
为社会造福的数据科学的确是朝那个方向迈出的第一步,但稍后再谈。请继续关注芝加哥新闻!
KDD 2013的完整程序是可用的在这里.你可以在Twitter上关注我@kdd_news或# kdd2013。
--Ankur Teredesai是2013年KDD的联合主席
没有发现记录