在过去的三十年里,处理器和内存性能之间的差距已经成为微处理器研究和开发的焦点。现代架构使用两种正交的方法来帮助缓解这个问题:(1)几乎每个微处理器都包含某种形式的片上存储,通常以缓存的形式,以减少内存延迟,更有效地利用有限的内存带宽。(2)大规模多线程体系结构,如图形处理单元(gpu),试图通过直接在硬件中多个线程之间快速切换来隐藏对内存的高延迟。本文探讨了这两种技术的交集。我们研究了在一个大规模多线程GPU上用显著的局部性加速高度并行工作负载的效果。我们观察到,片上缓存所看到的内存访问流是硬件线程调度程序所做决策的直接结果。我们的工作提出了一种硬件调度技术,它对来自内存系统的反馈做出反应,以创建一个更缓存友好的访问流。我们通过模拟评估了我们的技术,并显示了与之前提出的调度机制相比的显著性能改进。通过使用我们的调度器和LRU替换策略与使用最优缓存替换策略的其他调度技术进行缓存命中率比较,我们演示了调度作为缓存管理技术的有效性。
你有没有试过做那么多事情却什么都做不成?有一个经典的心理学原理,被称为“单一资源理论”,该理论认为,人类对同时执行的任务所能投入的注意力是有限的。16试图把注意力分散在太多的任务上,会对你的表现产生不利的影响。我们在高度多线程硬件环境中探讨了一个类似的问题,并使用人类多任务处理作为类比来帮助解释我们的发现。我们的论文研究的架构是在一个一个周期的基础上高效地在几十个任务之间切换。我们的论文提出了这样一个问题:即使大型多线程处理器可以在这些任务之间快速切换应该他们吗?
没有发现记录