推荐系统是互联网上最普遍的机器学习应用程序之一。社交媒体、音频和视频流媒体、新闻和电子商务都在很大程度上受到数据密集型个性化的驱动,它们利用从大型用户群体的行为中提取的信息来提供无数的推荐服务。兴趣点(PoI)推荐的任务是推荐地点(商业,文化景点,自然地区),用户访问。这是推荐系统中一个完善的子领域,作为一个应用领域,它很好地介绍了在实际环境中应用个性化推荐的挑战。
一个有效的PoI推荐者必须考虑用户的兴趣和偏好,就像在任何个性化系统中一样,但也要考虑旅行的实际方面:天气、拥堵、运营时间、季节性,等等。此外,一些PoI建议被设计为考虑到问题的多方涉众方面。例如,在一个庞大的用户群中推荐一个有限的资源会产生竞争:一个在同一天和同一时间向1000人推荐同一个50座餐厅的系统会让许多用户失望。
PoI推荐系统可以在流行的Web应用程序中找到,比如Yelp!以及谷歌Maps,这些都是典型的大数据驱动工具。然而,在建立为大众优化的实用系统的过程中,总有这样一种危险,即人口的子群体得不到很好的服务。最近对机器学习公平性的普遍关注(尤其是推荐)的一个重要结果是,认识到一个系统的利益(或危害)的分配可能与它的集中趋势一样重要,特别是当这种分配的不公平严重落在已经处于不利地位或少数群体身上时。
以下是28年最佳论文奖得主th2020年的ACM用户建模、适配和个性化会议就是一个很好的例子,它认真地支持了现有应用不能很好地服务的小群体。作者考虑了向患有自闭症谱系障碍(ASD)的成年人推荐PoIs的问题。这项任务之所以具有挑战性,有几个原因。首先,它必然是高度个性化的——这个群体中的个体通常对他们的环境有特殊的反应。简单的对等档案匹配或以潜在因素的形式提取共同模式很可能会遗漏这些特征。与此同时,不良建议带来的风险也很高。自闭症患者可能很容易被太吵、太亮或太拥挤的环境所淹没和造成创伤,这取决于该综合症如何表现。
作者描述了与参与者的交互的重要程度,这需要获取捕获他们PoI偏好的复杂性的数据。由于需要详细的数据收集,参与者的数量必然非常有限,比训练当今最先进的推荐算法所需的数量少了许多个数量级。相反,作者对用户需求和环境特征进行了敏感而详细的分析,以提供用户基础需求的最佳表示。
下面的文章是一个工作的例子,它认真地对待支持现有应用程序不能很好地服务的小团队的任务。
在这个初步阶段,必须在线下进行的评估反映了现代推荐系统研究的另一个真理,即需要使用多个评估指标来捕捉系统性能的多维视图。在这种情况下,我们看到作者提出的个性化治疗导致ASD受试者的结果得到改善,正如预期的那样。因此,该算法是对这些用户进行额外开发和最终部署的一个很好的候选。尽管(假定的)神经正常组的结果比较复杂,但他们并不比基线差多少。
最后,作者展示了他们的人工智能和用户建模技术的综合价值,为弱势和研究不足的群体解决一个具有挑战性的实际问题。(作者指出,自闭症领域的大多数HCI研究都集中在儿童身上。)这一努力是朝着创建一个为ASD用户提供地理信息和支持的应用程序这一更大且正在进行的目标迈出的一步。虽然机器学习的公平性研究通常专注于确保系统用户群体整体的公平结果,但这项工作提醒我们,真正的包容性和公平性可能需要针对特定群体的需求进行设计。
数字图书馆是由计算机协会出版的。版权所有©2022 ACM股份有限公司
没有发现记录