acm-header
登录

ACM通信

BLOG@CACM

平滑计算之路;思考大数据的用途


BLOG@CACM标志

//www.eqigeno.com/blogs/blog-cacm/233339-broadening-participation-in-computing-is-easier-than-you-think/fulltext2018年12月11日

美国国家科学基金会(NSF)最近对计算机与信息科学与工程(CISE)理事会项目提出了新的要求,即一些受资助的项目必须包括“扩大计算机参与(BPC)计划”。为了促进这种转变,计算研究协会(CRA)推出了一个名为BPCnet的资源门户网站(https://bpcnet.org),由NSF资助,将提供BPC程序的组织与计算部门和NSF拨款申请人联系起来。这些变化反映了一种认识,即任何对该领域多样性的重大影响都将大大受益参与整个学术计算研究社区。许多大学将通过扩大参与范围来应对,包括来自计算机领域代表性不足的群体的学生,包括女性、代表性不足的少数民族和残疾学生(URMD)。下面我们列出了各部门可以采取的10个小步骤。

  1. 在你的大学组织部门的BPC工作:创建一个多元化活动的注册列表,并激励教师参与。创建一个部门战略计划,以扩大参与,教师可以支持和扩大他们资助的NSF CISE提案。考虑如何利用BPCnet提供者作为部门计划的一部分。
  2. 光学问题:包括URMD学生的照片在网站和印刷材料。艺术作品、课堂上的例子等应该吸引所有学生,而不是强化刻板印象。你在课堂上展示的例子也是如此。如果你认为他们缺乏包容性,那么他们很可能就是。
  3. 使部门基础设施无障碍、包容、国际化:提供无障碍的教室、实验室、办公室、网站、视频等。学生名字使用国际字母。问学生他们最喜欢的代词。
  4. 测量和跟踪:定期分析您的注册人数、人口统计数据等,自行或与CRA数据伙伴一起确定问题领域并跟踪变化。
  5. 为URMD学生创建一个社区:赞助学生组织,送学生去Grace Hopper, Tapia和其他庆祝计算机多样性的活动。
  6. 招聘URMD助教、教授、顾问:表示很重要。学生们希望看到和自己相似的人在自己的领域取得成功。
  7. 促进本科生研究:在本科研究项目中与女性和URMD学生合作,例如通过CRA的CREU和DREU。
  8. 改进课程以吸引不同的学生:创建不需要计算机背景的入门课程、CS+X学位课程、服务学习和辅助选修课。
  9. 开发K-12渠道:与K-12教师(CSTA)合作,改进州课程(ECEP),以推进K-12计算机教育。
  10. 参与社区以激发计算兴趣和技能:组织严格和快乐的拓展活动,把不同的K-12学生和他们的家庭带到你的校园。

回到顶部

Saurabh Bagchi:《大数据和物联网的实践》

//www.eqigeno.com/blogs/blog-cacm/233312-short-take-big-data-and-iot-in-practice/fulltext2018年12月10日

除了围绕大数据(数据科学、机器学习、数据分析……在研究圈子里,我想窥探它在处理物理事物(而不是数字对象)的行业中采用的一些用例,并得出一些推论,什么条件有助于我们在学术界所做的研究的采用。

回到顶部

是什么推动了融合?

物联网(IoT)和大数据的融合并不令人惊讶。拥有大量小资产(比如车间里的托盘)或几笔大资产(比如喷气式发动机)的行业一直在上面安装许多传感器。这些传感器产生无穷无尽的数据流,从而满足大数据的三个V中的两个:速度和容量。下次你坐飞机时,如果幸运地坐在机翼旁边,看看机翼下面,你会看到一个发动机——如果它是劳斯莱斯或通用电气,它甚至可能是在我们印第安纳州的后院设计或制造的。这样的引擎可以生成10gb /s的数据(http://bit.ly/2LTsMjy),这些信息会被实时反馈到一些机载存储设备上,或者在未来被流到供应商的私有云上。这是物联网大数据难题的一部分,即数据生成和传输。这是采用故事中比较成熟的部分(http://bit.ly/2SzWTz3).大数据故事中更进化的部分是对所有数据的分析,以做出可操作的决策,而且也是在两倍快的时间内。

回到顶部

收集大数据用例

本文的第二部分是分析所有这些数据以生成可操作的信息。与我的行业同事交谈,这种分析有五个主要用例:

  1. 预测性维护/停机时间最小化:在组件发生故障之前了解它何时会发生故障,并将其更换或修复。
  2. 库存跟踪/损失预防:许多物理模拟行业都有很多活动部件;再一次,想象托盘被移动。他们想要追踪一个移动的部分现在在哪里,以及它曾经在哪里。
  3. 资产利用率:在正确的时间将正确的组件放在正确的位置,以便更经常地使用它。
  4. 能源使用优化:不言自明,随着减少能源使用的道德和金钱需求变得越来越紧迫,这一点也越来越重要。
  5. 需求预测/产能规划:不言自明,但公司似乎在更短的时间内在这方面做得更好。早在1969年,美国联邦航空管理局(FAA)就曾预测每年的空中交通需求(http://bit.ly/2BWj5fv);现在考虑根据哪个国家的日常表现来预测世界杯球衣的需求(http://bit.ly/2R3IcHL).

回到顶部

有助于采用学术研究的因素

学术界一直对这个大数据领域很感兴趣,嗯……似乎是永远。我们学者渴望真实的用例和真实的数据,而这个领域比大多数领域都更能说明这一点。我们需要能够演示我们的算法,并且它在工作软件系统中的实例化能够为某些应用领域提供价值。我们怎么做呢?我们有很多工作要做,努力说服我们的工业同事。再次谈到一个频谱,有些因素似乎经常出现。它们不是跨应用程序域通用的,但也不是一次性的。

  1. 水平和垂直。横向算法的严格性是贯穿应用程序细节的核心,但这与特定于应用程序的设计选择非常复杂地结合在一起。我们可以刻薄地称它们为“黑客”,但它们是拼图中极其重要的一块。这意味着我们不能构建水平的并将其扔过栅栏,而是必须理解应用程序上下文和垂直的距离。
  2. 可解释性。虽然大数据神坛上的狂热信徒愿意接受像德尔菲甲骨文(Oracle of Delphi)这样的算法的输出,但我的许多从事大大小小的实物构建业务的业内同事对这种盲目的信仰持谨慎态度。因此,我们的算法必须提供一些见解或旋钮来玩“假设”场景。这有时与构建超级强大的模型和算法不一致,但这是我们在现实世界中做出明智权衡的要求。
  3. 流数据和仓库数据。我的同事们似乎希望在一个平台上有阴有阳。数据分析程序应该能够处理数据流,以及在发霉的数字仓库中保存多年的旧数据。这说明需要从丰富的历史数据中提取价值,以及对现在生成的数据流做出敏捷决策。
  4. 无监督学习。这是一个技术术语,但基本上这意味着我们需要在我们可以让任何算法在数据上松懈之前,我们必须招募大量的人来标记数据。这需要时间、精力、法律纠纷,而且我们永远无法完全确定标签的质量。因此,只要有可能,我们就会使用无监督学习,它不依赖于大量的标记数据。

回到顶部

结论

大数据和物联网领域注定是相互促进的。前者使后者显得更智能,即使物联网系统是由许多小型、愚蠢的设备构建而成的。后者为前者提供了富有成效、具有挑战性的技术问题。在这里,大数据算法必须变得小巧,以较小的足迹运行,在众多设备的土地上成为一个温和的巨人。

回到顶部

作者

玛丽大厅他是犹他大学计算学院的教授,也是计算研究协会理事会的成员。

理查德•拉他是华盛顿大学保罗·g·艾伦计算机科学与工程学院的名誉教授。

黛安·莱维特他是康奈尔理工大学K-12教育的高级主管。

曼纽尔·a·Pérez Quiñones他是北卡罗来纳大学夏洛特分校计算与信息学院副院长,软件与信息系统系教授。

巴格奇Saurabh他是普渡大学电气和计算机工程以及计算机科学的教授,在那里他领导着一个名为CRISP的大学范围内的弹性中心。

回到顶部

脚注

来自“增加计算多样性比你想象的更容易:一些小步骤可以产生很大的不同”,2018年CRA会议在雪鸟,UT。


©2019 acm 0001-0782/19/03

本论文部分或全部的电子版或硬拷贝供个人或课堂使用的许可是免费的,前提是副本不是为了盈利或商业利益而制作或分发的,并且副本的第一页上必须有本通知和完整的引用。除ACM外,本作品的其他组件的版权必须受到尊重。允许有署名的摘要。以其他方式复制,重新发布,在服务器上发布,或重新分发到列表,需要事先特定的许可和/或费用。请求发布权限permissions@acm.org或传真(212)869-0481。

数字图书馆是由计算机协会出版的。版权所有©2019 ACM, Inc.


没有找到条目

Baidu
map