CS5346 - Task Abstraction and Task Taxonomy 任务抽象和分类
文章目录
- Domain Tasks, Abstract Tasks (领域抽象任务)
- Why, How, and What in Task Taxonomy (任务分类三要素)
- Why (High-level goal - 高层目标)
- How (Actions - 行为)
- Search
- look up
- browse
- locate
- explore
- Query
- identity
- compare
- summarize
- Analyze
- Producer
- Consumer
- Others
- What(Target - 目标数据)
- All data(所有数据)
- Attribute (属性)
- Network
- Overview and Summarize the Task Taxonomy
- Other Task Taxonomy

Domain Tasks, Abstract Tasks (领域抽象任务)
-
Domain Tasks(领域任务)
与具体应用情境相关,依赖领域知识。
示例:
“找出 ICU 暴露时间超过一个月的病人预后差异”(流行病学)
“比较 LL-37 处理与未处理的组织样本”(生物学) -
Abstract Tasks(抽象任务)
不依赖具体领域语境,可广泛应用。
示例:- 比较 两个数值
- 查找 异常值
- 过滤 符合条件的数据
Why, How, and What in Task Taxonomy (任务分类三要素)
- 通常在 human 和可视化图表进行交互的过程中存在 三个要素:
- why(高层目标) 即一个最高等级的驱动,这个目标驱动着人们进行交互和可视化探索
- 基于这个高层目标,进行具体的行动的过程中就会产生 “方式” 的问题,也就是使用 search, filter, 还是 query,这些实现途径成为 How (行动术语)
- **What (数据目标)**也就是:用户在可视化中关注的“数据的哪一部分”,可能是数据的整体,也可能是部分,或者是某些属性。
- 下图的 flow 表示了三个要素之间的关系;高层目标(goal) -> 选择合适的 actions -> 最终达到数据目标(target)
Why (High-level goal - 高层目标)
- 接下来将要讲的是 How 和 What,这两个元素通常放在一起讲,因为他们还有另外一种叫法: Action-Target Pairs (行为 - 目标对)
- Action-Target pairs 是将用户意图转化为有效可视化交互的基本单元。
How (Actions - 行为)
- 通常 actions 包含三大类:analyze, search, 和 query
Search
- 一般按照两个维度 target + location 划分了四种 search 的行为
look up
- 如果 target known (user 知道要查看什么信息) + location known (user 知道在哪里查看);这种操作就叫做 look up 的查询
browse
- 如果 target unknown (user 知道不知要查看什么信息) 但是 location known (user 知道一个大致的查看方向和范围),这个操作叫做 browse,因为 user 只能浏览一下看看,能不能找到和自己心里面契合的那种模式 / 数据呈现 (target);这个过程有点像你上网搜索,你并不知道具体的答案,但是你可以通过关键词等信息去搜索看是不是有符合你口味的那种结果
locate
- 如果 target known(user 知道要查看什么信息)但是 location unknown(user 不知道去哪里查看),这种操作叫 locate,就比如你之前看过一本书,你非常清楚某个内容是有的,但就是无法触及。
explore
- 如果 user target unknown (不知道要查看什么),同时 location unknown (也不知道在哪查看),user 只是想看看数据中是否有有趣的东西,那么这个过程范围就更加庞大,就是一个探索的过程
Query
identity
- 比如识别其中的某一种现象或者数据模式,例如上图中,每个州的颜色代表共和党还是民主党。那么 user 可以 identify 某一个州的状态
compare
- 但如果涉及到等多个 query 的对象,那就涉及到 compare 的关系
summarize
- 总结不同的样本之间的关系和规律
Analyze
Producer
Consumer
Others
What(Target - 目标数据)
- 针对 user 关注的数据部分,可以简单分成下面的几类
All data(所有数据)
- 这种情况下,通常关注的是数据整体的 趋势,模式,异常点,以及 features (例如分布情况,排序情况)
- 这里的 features 并不是 table 中常说的 “列” ,而是整体数据呈现出的某些有趣的特点。
Attribute (属性)
- 通常关心一列数据或者多列数据(这些通常只是占据数据集的一部分)
Network
- 通常我们还会关注数据的拓扑结构;“Network” 是任务分类中一个非常独特且重要的 Target 类型,它不同于传统的表格数据或空间数据,因为它强调的是**“关系(relationships)” **而不是 “个体数据点本身”。
Overview and Summarize the Task Taxonomy
Other Task Taxonomy