今天是最后一天WSDM 2010不幸的是,我在家里喝了鸡汤。但我一直在通过诉讼而且微博.
这一天以短暂的时间互动开始。主题包括聚集社交媒体文档(例如,Flickr照片),基于它们与事件的关联,用于早期识别流行社交媒体内容的统计测试,以及对答案网站(如雅虎答案)作为不断发展的双边经济市场。
下一个会议的重点是广告。两篇论文关注点击预测:一篇提出了一个贝叶斯利用推理模型更好地预测广告尾部的点击量分布;另一个为个性化点击模型提供了一个框架。另一篇论文讨论了与此密切相关的预测广告相关性的问题。其余的论文讨论了搜索广告的其他方面:一篇是估算每点击一次的价值谷歌广告联盟,由第三方提供存货;另一个提出了一种算法方法,自动在线广告活动基于着陆页内容。
接下来的会议是关于系统和效率的,考虑到与网络搜索相关的巨大数据和流量,这是一个很受欢迎的话题。两篇论文提出了帮助短路排序计算的方法:一是优化的组织反向索引考虑文档的静态排名和每个文档中包含的所有术语的术语得分上界的条目;另一种是使用提前退出策略进行优化ensemble-based机器学习算法。另一项研究则是利用机器学习来挖掘基于URL字符串模式的网页重复数据删除规则。另一项研究关注的是压缩,表明网络内容的可压缩性至少比通过计算机实现的内容强一个数量级gzip.最后一篇论文提出了一种通过预计算一组以节点为中心的子图来对图(即网络图或社交图)进行高效距离查询的方法。
会议的最后一届讨论了web挖掘的各种主题。其中一个提出了一个识别分布式搜索机器人攻击的系统。另一人提出了一种结合实体信息和视觉相似性的图像搜索方法。最后的论文表明,浅文本特征可以用于低成本的网络文档样板文本检测。
总之,WSDM 2010是一个极好的会议,我很遗憾不能亲自参加更多的会议。我很高兴看到学术界和工业界的代表都在分享想法,努力使网络成为更好的信息获取场所。
没有发现记录