1 简介
首先,可以根据类别将信息呈现为层次结构;
其次,除了层次结构之外,信息还可以使用实体关系或网络表示。在这些表示中,文档语料库中对象(人、地点、事物等)之间的连接表示两个项之间的关系,而不是将对象聚集成有标签的类别,这些网络表示包括知识图和概念图。
层次结构和网络是优势互补的。
层次结构为用户提供了一些对中心主题的理解,使他们能够对信息形成更全面的看法;网络使人们可以从陈述中收集具体信息,而不需要广泛的阅读单个文档。
鉴于知识图谱和层次结构的互补优势,本文的主要研究问题是能否将层次结构和网络的优点结合成一个统一的结构。
2 相关工作
2.1 Web搜索
在最简单的层次上,人们可能只想通过阅读文档来理解某个主题。然而,考虑一些任务,例如比较两种不同的饮食以了解健康益处(例如东方和地中海),比较两种不同的政治制度以了解相对的威权主义(例如俄罗斯总统与伊朗总统),或者比较两种不同的教育体系,以了解相对学生的成功(例如英国和加拿大)。
随着比较复杂性的增加(三个或更多的选择,更抽象的概念),信息搜索任务的复杂性不断增加。
搜索在识别相关文档以指导基本的探索性搜索方面是非常有效的,但要充分获取和综合知识需要浏览和重新编排。
因此,了解用户的搜索和浏览行为对于设计高效的交互式信息检索系统具有重要意义。
2.2 组织搜索结果
3 层次知识图谱
层次知识图谱背后的基本原理是层次结构和网络结构的互补优势。
层次结构提供了对信息的广度优先的探索,允许用户迭代地减少混淆,获得全面的视图,并缓慢地利用细节。因此,提供了一种结构化的方法,可以从更一般的概念导航到更细粒度的数据,并且在人们感到需要调整自己的方向时很有价值。相比之下,网络结构允许用户从表示中收集更多的信息(文档阅读时间减少),更吸引人,在较低的概念间关系层次上对探索产生更多的控制,并且更类似于一个人的心理模型
我们采用知识图作为适当的低层表示的方法,并试图将这种低层表示的语料库内容的层次视图结合起来。
要将层次视图合并到知识图中,我们需要找到以下三个设计问题(dq)的答案:
(1)我们如何将网络和分层视图集成到一个单一、无缝的数据结构中?
(2)如何将知识图的全局视图和局部视图同时可视化?
(3)如何设计视图之间的转换以最大限度地提高可视化的稳定性?
3.1 可视化设计与创造
为了简化层次结构的生成,我们为任何文档语料库创建了一个3级层次结构
生成分层知识图谱
3.1.1 文档检索
3.1.2 知识图生成
3.1.3 小地图生成
一些实体具有更高数量的边,较高的边计数意味着与图中其他实体的连接数较多,我们将这些高阶顶点称为中心概念,以中心概念为中心的多级视图简单地将信息寻求者引入到那些最常与语料库中的其他实体链接的实体或对象中。
生成层次结构将成为一个阈值任务,以适当地确定可视化的中间级别的范围。
3.2 原型开发
(a)集合视图(b)分区视图(c)文档视图(d)小地图(e)详细视图
4 实验设计
将层次知识图谱与层次,知识图谱在信息寻求任务方面进行比较。
4.1 控制接口
知识图谱和层次结构的控制接口
4.2 数据集
4.3 搜索任务
4.4 研究设计
4.5 参与者
4.6 步骤
在介绍这项研究之后,参与者被介绍了一个实验界面(用一个不相关的数据集填充),并有时间熟悉界面和数据结构。在参与者对界面的特点有了一定的适应度(3分钟)之后,参与者就完成了一份问卷,评估他们对第一个任务所用主题的熟悉程度。
然后给他们任务描述(见上文),并要求他们使用界面完成任务(每个任务15分钟)。
4.7 数据收集
(1)记录参与者与系统的交互;
(2)两名评估员独立评估参与者为每项搜索任务提供的答案的质量。简单查询被评为正确或不正确。对复杂问题进行了评分。所有查询的分数都被规范化,以反映[0,1]范围内的值。
(3)我们在参与者互动过程中捕捉笔记,录音记录会话,记录交互视图,收集问卷数据。
4.8 假设与研究问题
定量数据允许我们检验以下假设:
•与层次树相比,层次知识图导致更少的文档视图和更少的文档阅读时间。
•分层知识图在统计上表现出与知识图相似的行为。
5 结果
5.1 定量分析
定量分析
层次知识图谱(H. Graphs),层次树(H. Trees),知识图谱(K. Graphs),独立评估者的平均得分(MK),单击节点(NC),边(EC),文档视图(V),文档视图(VT)。
加粗的因变量在事后测试中表现出显著的差异。
5.1.1 假设检验
5.1.2 附加定量分析
花费在全局视图,小地图,详细视图上的时间百分比
热图显示用户浏览视图的模式,间隔长度为任务长度的1%
在任务的早期,我们经常看到全局视图的使用。小地图的使用高峰刚好在任务的中途,并没有很强的集中使用,小地图可视化,似乎在整个任务中都被使用。
5.2 定性分析
5.2.1 支持探索性的搜索任务
用户可以利用overview(概述)在更高的层次上浏览集合,然后有针对性地沉浸在详细视图中。
5.2.2 强加一个结构,而不是开放的探索
尽管大多数参与者一致认为,层次化的表示方式在信息空间上强加了一种[主观的][僵硬的]结构,但他们对这一现象的耐性各不相同。领域知识水平和搜索任务的复杂程度是影响其耐心的主要因素。
当搜索者处理一个他知识有限的领域时,他更愿意接受表示所施加的结构。层次树和层次知识图都包含强制结构。
与会者阐述了结构的各种好处:它“更容易遵循”,“包含了重要的方面”,“简化了重点”,并指导与会者“去哪里”或“遵循什么步骤”。低知识学习者在自由回忆中受益于层级结构,表现出减少的定向障碍。
5.2.3 自我定位或相对定位
6 局限性
7 结论
与层次树相比,我们的层次图显著减少了文档的读取和读取时间,并且性能与知识图相当。















网友评论