数据集和软件是依赖数据密集和高性能计算的领域研究的重要副产品。但当研究结果被记录在期刊文章或会议记录中时,这些元素通常是不存在的。计算界越来越意识到,如果我们要建立一个稳定的研究基础,在此基础上可能建立可靠的进展,就需要填补这一空白。简而言之,我们需要确保计算结果和实验结果一样具有可重复性。
我是一个小团队的一员SC16在未来几年里,它将致力于促进和支持计算结果的复制和可重复性。我们正在探索的方法之一是使用SC学生分组比赛(SCC)以测试在以往SC会议上发表的论文的结果的重现性。这是学生第一次面临挑战,要求他们从最近的计算论文中再现结果,而不是运行更传统的基准测试应用程序。
在评估了过去SC论文作者提交的论文后,SCC选择了Flick、Jain、Pan和Aluru的“宏基因组应用中de Bruijn图的并行连接算法”作为SC16的首次可重复性计划(这篇论文可从ACM数字图书馆获得)。这篇论文的结果将被参加11月集群比赛的14个团队复制,论文的合著者之一Chirag Jain将帮助SCC委员会为学生们创建一个具有挑战性的比赛任务,并将在比赛中担任裁判。
我们希望我们的学生团队能够特别参与到这样一个理念中:他们不是在运行一个乏味的基准测试应用程序,而是通过尝试再现以前报告的应用程序性能,他们积极地参与到科学过程中。我们相信这种早期的参与对于使可重复性成为计算研究过程的标准部分的努力是非常重要的。
Michela Taufer是特拉华大学David and Beverly J.C. Mills职业发展主席,也是SC16组委会成员。
没有发现记录