相似性搜索是一种基本的算法基元,广泛应用于计算机科学的许多学科中。给定一组点年代还有一个半径参数r> 0, 0r-近邻(r-NN)问题要求一个数据结构,给定任何查询点问,返回一个点p最多在距离之内r从q。在本文中,我们研究r-基于个人公平和提供平等机会的神经网络问题:所有的点都在距离之内r返回的概率应该是相同的。这个问题在高维中特别有趣局部敏感哈希(LSH)是理论领先的相似度搜索方法,但它并没有提供任何公平的保证。在这项工作中,我们证明了基于lsh的算法可以在不显著损失效率的情况下变得公平。我们为公平神经网络问题的精确和近似变体提出了几种有效的数据结构。我们的方法更适用于从给定集合的集合的子集合中统一采样,并且可以用于其他一些应用程序。我们还进行了一项实验评估,强调了现有神经网络数据结构固有的不公平性。
近年来,随着对算法的公平性及其对特定人群或特征的偏见的日益关注,构建实现(适当定义)的算法的兴趣越来越大。公平。14其目标是消除,或至少最小化算法决策中的歧视和偏见等不道德行为,因为如今,许多重要的决策,如大学录取、提供住房贷款或估计累犯的可能性,都依赖于机器学习算法。尽管算法本身并没有偏见,但它们可能是由于粗心的设计造成的,或者是放大了数据中已经存在的偏见。
公平并没有唯一的定义。18以及其中的参考资料),但不同的公式取决于手头的计算问题,以及我们所追求的伦理目标。公平目标通常是在社会技术系统的政治背景下定义的,必须在涵盖计算机科学以外的许多领域的跨学科光谱中看到。特别是,研究人员对两者都进行了研究组织公平(也被称为统计公平),即在结果中保留了人口统计数据,12而且个人公平美国的目标是以同样的方式对待有类似情况的人。14后一种“平等机会”的概念要求那些能够获得某种有利结果的人,比如完成大学学位或偿还贷款的人,在一开始就有平等的机会获得它。
没有找到条目