acm-header
登录

ACM通信

个人信息管理

个人信息管理中的数据统一


信息碎片化是个人信息管理中普遍存在的问题。即使是一个看似简单的决定(例如是否接受晚宴邀请)通常也取决于许多来源的信息,包括日历、纸传单、网站和电子邮件。这些信息可能会因物理位置和设备而分散。在单个设备上,它可能被设计用来帮助我们管理它的工具所分割。应用程序通常将其数据存储在其他应用程序无法访问的特定位置和表示中。

考虑一下我们可能掌握的关于一个叫吉尔的朋友的信息。我们将她的地址保存在地址簿中,将她的照片保存在相册中,将她的主页保存在Web书签中,将与她一起编辑的文档保存在文件系统中,将与她的约会保存在日历中。这种碎片化导致了使用和更新信息的问题。关于她的所有信息,没有一个单一的目录可以找到;也没有办法将它的各个部分相互“连接”起来。相反,我们必须启动多个应用程序,并为相关信息执行大量重复的搜索,更不用说决定查看哪个应用程序了。我们可能会在一个地方更改数据(可能是地址簿中的一个新的已婚姓名),而在其他地方无法更改它,导致不一致,从而使查找信息更加困难;例如,我们应该使用哪个名称来搜索相册?如果计算机无意中成为信息碎片化的工具,它也可以用来帮助我们把碎片重新组合起来。在这里,我们调查了一些可以更有效地整合我们的个人信息的方法。 Some integrations follow from simple extensions to current applications; others depend on more fundamental changes in the way we represent and manipulate data.

我们首先概述PIM中几个现有的统一策略(参见表格这里)。每个应用程序都选择要统一的信息的最小公分母,忽略每个应用程序中数据的许多细节。然而,使用公共分母与每个应用程序对其内容的丰富、专门化表示的需求存在矛盾。丰富的表示允许应用程序交付强大的领域特定操作。为了弥补这一不足,共享表示可以让应用程序与来自其域之外的信息进行交互,这种方式可能会增加应用程序的效用。其折衷之处在于,简化的共享表示允许工具以统一的方式与来自多个应用程序的数据交互,而不必理解太多丰富的表示。

也许最普遍和肤浅的统一发生在展览上。在今天的GUI环境中,几乎每个应用程序都启动一个窗口来显示其信息。仅依靠这种通用表示,用户可以调整、移动、隐藏和显示不同的信息对象,而不管它们是什么或由哪个应用程序管理它们。同时打开多个应用程序窗口可以让我们同时查看多个信息对象,以查找视图项之间的模式(以及它们之间的连接)。

不幸的是,窗口也会导致显示管理的问题。我们感兴趣的项目(如文档、电子邮件消息、Web页面和地址)显示在带有附属菜单、工具栏、起始点和默认表示的大窗口中。当我们需要来自多个应用程序的信息时,每个应用程序都需要一个单独的窗口。一个常见的后果是窗户杂乱的显示充满了窗口彼此模糊,所有竞争我们的注意力。一个叫做WinCuts的工具[10)旨在缓解这种混乱,让用户“切出”应用程序窗口的一小部分,并关闭其余部分,这样就只有他们关心的部分仍然在视图中。

显示级统一,无论如何实现,也有很大的局限性。由于底层数据不统一,因此无法将数据从一个应用程序传递到另一个应用程序,也无法在来自多个应用程序的数据之间创建机器可用的链接或共享组织结构。同时显示提供的统一是短暂的,当系统关闭时就会消失。人们可以在地址簿中显示某人的信息,同时在相册中显示此人的照片,但这并不能保证人们能够使用这两种应用程序将此人的联系信息与她的照片永久关联起来。

文本是一种强大的最小公分母,因为大多数应用程序管理的数据至少部分是文本的。标准化的剪切和粘贴功能提供了一种将数据从一个应用程序移动到另一个应用程序,甚至在名义上不兼容的应用程序之间移动的简便方法。不幸的是,文本的剪切和粘贴是“有损的”,因此当我们从地址簿复制一个人的名字时,我们得到的是文本,但不一定知道它代表被复制的人的名字。这种不完美的传输导致了前面讨论过的信息重复和碎片。

许多应用程序中的文本也可以被各种桌面文本搜索引擎(例如谷歌desktop)提取和索引。这些工具允许用户执行文本查询来查找信息,而不管该信息属于哪个应用程序(参见本节中Cutrell等人的文章)。

信息管理中的一个中心活动是对相关项目进行分组。以独立于应用程序的统一方式支持分组似乎很容易,因为组是通过引用其中的项来定义的。因此,应用程序之间唯一需要的共同点是用户可能想要分组的所有项的共享命名方案。例如,操作系统为文件提供了一个通用的名称空间,这意味着我们可以将任意类型的文件分组到目录中,而不管它们是由哪个应用程序创建的。

不幸的是,尽管分组依赖于能够按名称引用项,但不同的应用程序坚持在它们自己的“内部名称空间”中管理它们自己的信息集合,文件进入文件夹,电子邮件消息进入电子邮件文件夹,Web引用进入通过Web浏览器访问的书签文件夹,而地址簿条目进入地址簿文件夹。人们抱怨他们要维持的等级制度太多是有道理的。3.59].当每个应用程序管理其自身数据的分组时,这些组不能是异构的。

元数据,即关于我们信息的信息,是管理我们信息的另一种重要手段。文件有创建者和创建日期;媒体文件有类型、作曲家和比特率;邮件消息有收件人和主题;约会有时间和地点。人们通常通过分组或根据元数据属性(如按文件类型排序文件或根据访问页面的时间定位书签)来管理信息。与集合的创建和使用一样,定义和使用元数据也没有单一的、公认的方式。因此,文件创建时间和创建者存储在文件系统中;电子邮件消息的创建时间和创建者存储在电子邮件标题中;音乐作曲家和作曲日期存储在音频文件的ID3标签头中。 While the pervasiveness of metadata representations demonstrates the value of metadata, the fragmented formats generally mean a user must launch a specific application to annotate or search for a particular type of object. Until recently, even a simple task like "finding the stuff I created yesterday" required the launching of multiple applications. The recent crop of desktop search tools (such as Google Desktop and Yahoo Desktop) all attempt to extract metadata from different file formats to support integrated searching over that metadata, though they extract only a specific set of metadata from specific applications.


用户能够从文档定向到作者之一、此人的照片、照片拍摄地点的表示、该地点的地图,等等,从而受益。


XML是一种日益流行的表示方式,它可能有助于统一元数据的使用。它提供了描述给定对象的一系列属性和每个属性的值的标准语法。传统的字处理程序将文档存储为不透明文件,而XML表示可以使用标准语法作为文件中的独立元素,以及文档的创建者、标题、主题关键字、引用和各个部分。这种元数据表示的统一语法将允许我们根据共享的元数据对任意信息对象进行分组或查找,而不考虑它们管理的应用程序,就像我们目前可能独立于它们的管理应用程序对文件进行分组一样。

除了分组和元数据,引用的第三种用法涉及直接将信息对象链接在一起。我们对一条信息的兴趣往往集中在它与另一条信息的联系上。例如,我们可能想知道某个特定的人是否确实是某个文档的作者,或者某个特定的电子邮件是否与某个特定的约会相关。研究表明,用户更喜欢通过“定向”来寻找他们的信息[11].也就是说,他们不是直接跳到需要的信息,而是从一个已知的对象开始,然后重复导航步骤到相关的对象,旨在锁定所需的信息。

Web代表了这种方法的一个成功应用,它定义了一个单一的、共享的URL名称空间,允许用户命名任意的Web对象。通过在其他Web页面中放置对这些对象的引用,作者允许用户顺利地从对象导航到相关对象。由于只需要共享名称,Web页面甚至可以引用Web浏览器无法解释的对象;只有当用户选择导航到命名对象时,这种失败才会变得明显。

与分组和注释一样,链接只需要一个用于命名链接对象的共享名称空间和描述它们之间关系的通用语法。同样,我们经常因为缺乏一个共同的方案而受阻。用户有时试图通过在不同的注释字段中记录交叉引用来实现链接;但是,这些链接只能由用户而不是应用程序解释,这意味着链接遍历将成为一项费力的任务,涉及到在其他应用程序中进行搜索,并且可能在链接的两端产生不一致。

正如XML用于元数据一样,资源描述框架(RDF)是一种新兴的Web标准,用于记录任意信息对象之间的任意关系。它提供了一个简单的模型,在该模型中,可以使用同样用URI表示的任意谓词(关系)将每对项(每个项都用URI命名)链接起来。RDF-XML标准定义了在XML中记录这些关系集合的语法。

回到顶部

展望未来

Whittaker等人在本节的文章描述了作者所称的“电子邮件帝国主义”方法,该方法试图通过扩展的电子邮件客户端应用程序统一个人信息。在这里,我们描述另外两种统一的方法。第一个尝试通过对现有应用程序(包括电子邮件客户端)的适度扩展来集成个人信息。第二种方法通过数据的底层表示寻求更基本的统一。

通用标签器(UL)是“保存已找到的东西”项目中的一个原型工作[6华盛顿大学的教授。它有助于扩展现有的应用程序以支持PIM,这是由实地观察所激发的,人们在组织他们的信息(特别是他们的文件夹)方面投入了相当大的努力[27如果他们需要使用其他方式来组织新的应用程序,或者如果他们强迫他们放弃在当前的组织方案中已经投入的工作,他们就不愿意采用新的应用程序。

UL包括作为现有应用程序(如用户的文件管理器、电子邮件客户端、Web浏览器或字处理器)的附加组件和扩展的模块。UL的一个指导原则是,信息管理和任务/项目管理代表同一枚硬币的两个方面。此外,如果对项目规划和管理提供适当的支持,在计划项目和管理其任务的努力中可能产生一个综合的信息组织。

UL的Project Planner模块允许用户通过构建一个大纲(其中主要标题(如“厨房”和“媒体室”)代表高级项目组件),自上而下地开始项目(如“房屋改造”)。或者,用户可以从自底向上开始,通过输入笔记和通过拖-链接操作从Web页面、电子邮件消息和电子文档中收集信息。通过拖拽链接,信息被超链接回源,因此用户只需拖拽较大文档(如电子邮件消息或Web页面)的一小部分关键部分,从而确保只需点击即可获得更多信息。

随着时间的推移,一个基本的计划出现了(如在图1)实质上提供了另一种视图进入用户文件夹层次结构的一部分,其中标题是文件夹,子标题是子文件夹,超链接是快捷方式。如果需要,用户可以切换到更传统的文件夹视图。然而,他们可能更喜欢停留在计划器视图中,因为它提供了富文本、类似文档的功能。除了拖-链接和输入格式化笔记的能力,他们还可以对标题和副标题进行排序,以帮助他们理解计划的意义或优先考虑重要的事情,就像他们在文字处理应用程序中所做的那样。用户还可以直接从项目计划创建新的电子邮件消息和新文档,因此电子邮件或文档链接到适当的任务标题(及其底层文件夹)。

在幕后,Planner通过将XML片段分发为隐藏文件来支持更像文档的大纲视图,每个文件夹一个隐藏文件,包含关于文件夹的注释、链接和排序的信息。这种方法也用于支持其他视图,包括表视图,其中层次结构的两个级别(如学生和作业)以单一的表格格式显示。

Haystack项目[8]旨在从头开始提供统一的数据环境,为引用所有单独的信息对象创建统一的名称空间,因此它们可以按最终用户的意愿进行分组、注释和链接。例如,人是出现在各种PIM应用程序中的数据类型,这些应用程序管理他们与电子邮件消息(作为电子邮件应用程序中的发件人)、音乐(作为点唱机应用程序中的作曲家)和约会(作为日历应用程序中要见面的人)的关系。有些用户(比如在娱乐行业)可能会发现这些人是重叠的。因此,值得将个体视为本身带有注释、组织和链接的一级信息对象。

这种方法的唯一实际前提是需要为每个信息对象提供唯一的标识名称。Haystack使用RDF,这是一种新兴的Web标准模型,用于命名信息对象并记录关于它们的关系。在Haystack数据模型中,一个典型的应用程序文件被分解成许多不同类型的独立信息对象,这些信息对象通过特定于应用程序的关系连接起来。

Haystack用户界面(参见图2)将对象组装成传统外观的信息显示(如电子邮件客户端或地址簿)。但统一的数据模型也意味着可以组装任意的数据;例如,用户的收件箱可能不仅包含电子邮件,还包含RSS新闻项目甚至人。每个项目都提供了嵌入的复选框,用户可以勾选以快速将项目放入相关集合中。由于视图中的每个信息对象本身都是数据模型中的不同实体,因此用户可以单击视图中的任何内容,并立即导航到所单击的对象,以便获得关于该对象的更多信息。此外,用户可以使用上下文菜单在对象在视图中的任何时候调用对象上的所有相关操作,而不仅仅是在对象由特定应用程序呈现时。

Haystack为用户提供了一个类似web的导航范例。比方说,通过单击消息的作者,用户可以导航到该作者的视图(通过查找与此人相关的重要对象并以地址簿的样式列出它们来构建)。用户可以从文档定向到作者之一、此人的照片、照片拍摄地点的表示、该地点的地图,等等,直到他们找到所要查找的信息。类似地,用户可能使用传统的拖放操作创建相关对象的集合,或创建注释将信息对象链接在一起。

回到顶部

结论

许多技术挑战使我们想要统一个人信息的愿望复杂化;一个很好的例子是消除引用歧义所需要的努力。同一个人可以有许多不同的引用方式,相反,同一个引用(“Jill”)可以指几个人中的任何一个[4].此外,由于有这么多有前途的方法可供探索,我们需要评估和比较它们的方法(参见本节Kelly的文章)。用户需求推动了一些重要但不完全的统一工作,这些工作基于允许信息分组、注释和链接的最小公共分母(如窗口、文本和引用)。更好的统一技术有望在未来帮助改善个人信息管理。

回到顶部

参考文献

1.V.贝洛蒂,杜cheneaut, N.霍华德,M.和史密斯,I.将电子邮件用于任务:以任务管理为中心的电子邮件工具的设计和评估。在ACM计算机系统中人为因素会议论文集(CHI 2003)(佛罗里达州劳德代尔堡,510年4月)。ACM出版社,纽约,2003,345352。

2.博德曼,R.和萨塞,M.东西进入电脑而不出来:个人信息管理的跨工具研究。在ACM计算系统中人为因素会议论文集(CHI 2004)(2429年4月,奥地利维也纳)。ACM出版社,纽约,2004年

3.博德曼,R,斯宾塞,m。每天都在为控制工作空间而斗争。在第十届人机交互国际会议论文集(克里特岛,希腊,2003),616620。

4.董晓明,李晓明,李晓明。复杂信息空间中的参考协调。在ACM SIGMOD数据管理国际会议论文集(马里兰州巴尔的摩,1316年6月)。ACM出版社,纽约,2005,8596。

5.琼斯,W,杜梅斯,S,布鲁斯,h,一旦找到,然后呢?个人使用网络信息的“保留”行为研究。在第65届美国信息科学与技术学会年会论文集(费城,PA)。美国信息科学与技术学会,2002,391402。

6.琼斯,W.,穆纳特,C.和布鲁斯,H.通用标签:计划项目,让你的信息跟随。在第68届美国信息科学与技术学会年会论文集(夏洛特,NC)。美国信息科学与技术学会,2005

7.琼斯,W., Phuwanartnurak, A.,吉尔,R .和布鲁斯,H.别拿走我的文件夹!整理个人信息来完成任务。在ACM计算机系统中人为因素会议论文集(CHI 2005)(4月27日,俄勒冈州波特兰)。ACM出版社,纽约,2005年。

8.卡格尔,D;巴克希,K。Huynh, D., Quan, D.和Sinha, V. Haystack:面向半结构化数据最终用户的通用信息管理工具。在第二届创新数据系统研究双年会议论文集(加州阿西洛玛,2005年1月47日)。

9.Ravasio, P., Schar, S.和Krueger, H.在追求桌面进化:现代桌面系统的用户问题和实践。ACM反式。第一版。嗡嗡声。交互。11日,2(2004), 156180。

10.Tan, D., Meyers, B.和Czerwinski, M. WinCuts:操纵任意窗口区域以更有效地利用屏幕空间。在ACM计算系统人为因素会议论文集计算系统人为因素扩展摘要(2429年4月,奥地利维也纳)。ACM出版社,纽约,2004,15251528。

11.Teevan, J., Alvarado, C., Ackerman, M.和Karger, D.完美的搜索引擎是不够的:定向搜索中的定向行为研究。在ACM计算系统中人为因素会议论文集(CHI 2004)(2429年4月,奥地利维也纳)。ACM出版社,纽约,2004年。

回到顶部

作者

David r . Karger(karger@theory.lcs.mit.edu)是马萨诸塞州剑桥市麻省理工学院计算机科学和人工智能实验室的教授。

威廉•琼斯(williamj@u.washington.edu)是华盛顿州西雅图市华盛顿大学信息学院的研究副教授。

回到顶部

数据

F1图1。在Project Planner中构建的计划还组织与项目相关的信息。

F2图2。Haystack将来自不同应用程序的信息组装到一个视图中。

回到顶部

UT1表格方法统一。

回到顶部


©2006 acm 0001-0782/06/0100 $5.00

允许为个人或课堂使用本作品的全部或部分制作数字或硬拷贝,但不得为盈利或商业利益而复制或分发,且副本在首页上附有本通知和完整的引用。以其他方式复制、重新发布、在服务器上发布或重新分发到列表,需要事先获得特定的许可和/或付费。

数字图书馆是由计算机协会出版的。版权所有©2006 ACM, Inc.


没有发现记录

登录为完全访问
»忘记密码? »创建ACM Web帐号
文章内容:
Baidu
map