不幸的是,我今天早上起床时身体不太舒服,所以我不得不在第二天远程报告WSDM 2010根据出版的论文集和推流.
这一天以哈佛经济学家的主题演讲开始苏珊阿塞.她的研究重点是基于拍卖的市场设计,这是搜索业务的核心课题,很大程度上依赖于基于拍卖的广告模式。谷歌AdWords).然后是关于学习和优化的讨论。有一篇论文提出了一种同时学习排名函数和查询分类的方法,反映了不同的查询类别会导致用户对排名的期望不同。另一项研究结合了传统的基于列表的排名和结果之间的成对比较,将结果划分为反映相关性等级的层。一种有趣的查询推荐方法将其视为一个优化问题,干扰用户的查询-重新制定路径,以在搜索会话中最大化效用函数的期望值。另一篇论文关注的不是排名本身,而是提高使用机器学习进行排名的训练数据的质量。会议的最后一篇论文获得了最佳论文提名,它没有基于点击行为,而是基于点击后的用户行为来建模文档相关性。
下一个会议是关于用户和度量的。它以另一篇最佳论文提名开始:对超过1亿用户的分析,以了解他们如何重新找到网络内容。另一篇文章则对经常草率呈现的“长尾假设:它发现轻度用户不成比例地喜欢分布头部的内容,而重度用户不成比例地喜欢尾部的内容。另一篇日志分析论文使用部分可观察马尔可夫模型分析搜索日志隐马尔可夫模型并不是所有的隐藏状态转换都会产生可观察到的事件,并将潜在变量与眼球跟踪研究进行了比较。一项有趣的研究表明,用户行为模型比基于文档相关性的模型更能预测目标的成功。会议的最后一篇论文提出了量化测试集合的可重用性的方法,这是信息检索评估的核心。
当天的最后一个环节集中在搜索的社交方面。其中两篇论文是关于在社交网络中建立权威和影响力的模型,这是一个我非常关注的问题个人兴趣.另一个推断社交网络用户的属性是基于他们社区中的其他用户的属性(cg。麻省理工学院的项目同性恋行为).另一个分析Flickr而且last . fm用户日志显示基于标签行为的用户语义相似度可以预测社交链接。最后一篇论文通过从共享标签和空间信息中推断潜在主题来解决社交媒体标签的稀疏性问题。
不出所料,这次会议的贡献者中有相当一部分来自主要的网络搜索公司,他们既有动力改进搜索结果,又能获得这类研究所需的数据。该领域正在进行的研究挑战之一是,如何在尊重搜索引擎公司的业务关切和用户隐私关切的同时,将这些数据提供给其他人。
没有发现记录