EagleBear2002 的博客

这里必须根绝一切犹豫,这里任何怯懦都无济于事

人机交互系统-10-人机交互基础知识

本文主要内容来自 SpriCoder 的博客,更换了更清晰的图片并根据新的课程设计做了补充和修正。

信息处理模型

作用:

  1. 研究人对外界信息的接收、存储、集成、检索和使用,可预测人执行特定任务的效率,如可推算人需要多长时间来感知和响应某个刺激(又称“反应时间”),信息过载会出现怎样的瓶颈现象等
  2. 信息处理机,Lindsay 和 Norman。
    • 局限:没有考虑到注意和记忆的重要性

扩展的信息处理机模型

Barber 对其进行了扩展,注意和记忆功能与信息处理过程的各个阶段存在交互。

人类处理机模型

最著名的信息处理模型,Card 等,1983。

包含三个交互式组件:

  1. 感知处理器:信息将被输出到声音存储和视觉存储区域
  2. 认知处理器:输入将被输出到工作记忆
  3. 动作处理器:执行动作

存在的问题

  1. 把认知过程描述为一系列处理步骤
  2. 仅关注单个人和单个任务的执行过程,忽视了复杂操作执行中人与人之间及任务与任务之间的互动
  3. 忽视了环境和其他人可能带来的影响

导致出现了:外部认知模型、分布式认知模型

认知心理学

兴起于 20 世纪 50 年代中期。关注人的高级心理过程,如记忆、思维、语言、感知和问题解决能力等。

神经元网络已经成为新一代人工智能领域最热门的研究课题之一。

对 HCI 的贡献:

  1. 有助于理解人与计算机的交互过程,同时也可对用户行为进行预测
  2. 人对于外界的感知有 80%来自于视觉获取的信息

格式塔(Gestalt)心理学

研究人是如何感知一个良好组织的模式的,而不是将其视为一系列相互独立的部分。事物的整体区别于部分的组合。

“Gestalt”

  1. 德语,“完形(configuration)”或“型式(pattern)”
  2. 格式塔心理学又称完形心理学

表明:用户在感知事物的时候总是尽可能将其视为一个“好”的型式

四大原则:相近性原则、相似性原则、连续性原则、完整性和闭合性原则。

一个讲的很清楚的视频:【设计实用小知识02】格式塔原理到底讲了啥?_bilibili

相近性原则

空间上比较靠近的物体容易被视为整体。

设计界面时,应按照相关性对组件进行分组。

如下图,你看到了什么?

应用:

  • 合理运用接近性法则,它能让界面层次清晰有序。
  • 例如列表页设计,将相关的信息组合在一起并重复排列出来,就能明显感知不同小组之间的界限,当同一小组内元素关系明确时,将其更加靠拢,用户视觉就会更聚焦。

相似性原则

人们习惯将看上去相似的物体看成一个整体。功能相近的组件应该使用相同或相近的表现形式。

这一次呢?

应用:

使用不同的大小、颜色、形状来创建对比或视觉权重,呈现出不一样的视觉效果,以达到弱化(降低视觉)或凸显(强化视觉)某些内容。

格式塔心理学与界面感知

连续性原则

共线或具有相同方向的物体会被组合在一起:将组件对齐,更有助于增强用户的主观感知效果

对称性原则

相互对称且能够组合为有意义单元的物体会被组合在一起

相近性?对称性?

完整和闭合性原则

人们倾向于忽视轮廓的间隙而将其视作一个完整的整体:页面上的空白可帮助实现分组。

前景&背景

前景和背景在某些情况下可以互换:“整体区别于局部”

屏幕格式塔


文字格式塔

标题格式塔

段落格式塔

线的长度/文本宽度

  1. 回溯 Retracing:段落太宽,不容易找到下一行的开始
  2. 扫视 Saccades:
    1. 只有注视能看到内容
    2. 每隔 15~30 个字符(依赖于文字难度、阅读技能等)就要停下来注视
  3. 不成文规定
    1. line length at most 12.5 cm (5 inches)
    2. lines at most 65 characters (average, excluding spaces)

约定

格式塔心理学反例

对比 Constract。

让重点更突出!

几种不同形式的对比

人脑中的记忆结构

三个阶段,Atkinson 和 Shiffrin

  1. 感觉记忆
  2. 短时记忆
  3. 长时记忆
  4. 三个阶段之间可以进行信息交换

感觉记忆

  1. 又称瞬时记忆
  2. 在人脑中持续约为 1 秒钟
  3. 帮助我们把相继出现的一组图片组合成一个连续的图像序列,产生动态的影像信息

短时记忆

  1. 感觉记忆经编码后形成
  2. 又称工作记忆,约保持 30 秒
  3. 储存的是当前正在使用的信息,是信息加工系统的核心,可理解为计算机的内存
  4. 短时记忆的存储能力约为 $7 \pm 2$ 个信息单元

$7 \pm 2$ 理论 vs. 交互式系统设计

影响:

  1. 菜单中最多只能有 7 个选项
  2. 工具栏上只能显示 7 个图标

事实:

  1. 浏览菜单和工具栏基于人的识别功能而非记忆功能:人们识别事物的能力要远胜于回忆事物的能力
  2. 界面设计时要尽可能减小对用户的记忆需求,同时可考虑通过将信息放置于一定的上下文中,来减少信息单元的数目

长时记忆

短时记忆 $\to$ 长时记忆

  1. 短时记忆中的信息经进一步加工后会变为长时记忆
  2. 只有与长时记忆区的信息具有某种联系的新信息才能够进入长时记忆

长时记忆的信息容量几乎是无限的

启发:

  1. 注意使用线索来引导用户完成特定任务
  2. 在追求独特的创新设计时也应注重结合优秀的交互范型

遗忘:

  1. 长时记忆中的信息有时是无法提取
  2. 不代表长时记忆区的信息丢失了

易出错:

  1. “人为错误”被定义为“人未发挥自身所具备的功能而产生的失误,它可能降低交互系统的功能”
  2. 从表面上看是由于用户的误解、误操作或一时大意
  3. 大部分交互问题都源于系统设计本身

视错觉

  1. 知觉感受的扭曲
    1. 前后景互换实际上就是视错觉的一种
    2. 白色三角的例子
  2. 视错觉是不可避免的
  3. 启示:对于物体的视觉感知与物体所处的上下文密切相关

视觉感知 & 上下文

你从下图中看到了什么?

  1. 提示:一只面向你的动物;
  2. 提示:它的头在左侧,能产奶。

上下文信息有助于增强人们的视觉感知。

期望对感知的影响:红桃和黑桃

请你任意选一张并记住数字与花色。

你记住的那张牌不见了。

字母顺序重要么?

From Cambridge University

Olny srmat poelpe can raed tihs.

I cdnuolt blveiee taht I cluod aulaclty uesdnatnrd waht I was rdanieg.

The phaonmneal pweor of the hmuan mnid, aoccdrnig to a rscheearch at Cmabrigde Uinervtisy, it deosn’t mttaer in waht oredr the ltteers in a wrod are, t he olny iprmoatnt tihng is taht the frist and lsat ltteer be in the rghit pclae. The rset can be a taotl mses and you can sitll raed it wouthit a porbelm. Tihs is bcuseae the huamn mnid deos not raed ervey lteter by istlef, but the wrod as a wlohe. Amzanig huh? yaeh and I awlyas tghuhot slpeling was ipmorantt!"

研表究明,汉字的序顺并不定一能影阅响读,比如当你看完这句话后,才发这现里的字全是都乱的。

界面类型

基于命令的界面

用户通过在屏幕某个位置上键入特定命令的方式来执行任务:“基于字符的界面(Characterbased Interface)

优点:

  1. 专家用户能够快速完成任务;
  2. 较 GUI 节约系统资源;
  3. 可动态配置可操作选项;
  4. 键盘操作较鼠标操作更加精确;
  5. 支持用户自定义命令

缺点:

  1. 命令语言的掌握对用户的记忆能力提出较高要求;
  2. 基于回忆的方式(recall memory):没有 GUI 基于识别的方式(recognition memory)容易使用
  3. 键盘操作,出错频率较高;
  4. 要求用户记忆指令的表示方式:与可用性理论所强调的“不应要求用户了解计算机底层的实现细节”相违背。

WIMP 和 GUI

WIMP 和 GUI 的全称:

  • Window, Icon, Menu, Pointing
  • Graphical User Interface

今天的 WIMP 组件已经演变成多种不同形式和类型

设计和研究问题:

  1. 如何进行窗口管理,找到内容并在不同窗口之间流畅切换
  2. 确定菜单选项的最佳术语
  3. 消除图标的歧义

多媒体界面

在单个界面中组合不同的媒体,即图形、文本、视频、声音和动画,并将他们与各种形式的交互相连接。

优点:

  1. 媒体和交互性的组合可以比其中任何一个提供更好的呈现信息的方式
  2. 增强了快速访问多种信息的能力
  3. 更易学习、更好理解、更多的参与度和乐趣

研究和设计问题:

  1. 多媒体内容设计
  2. 何时使用音频与图形、声音与动画等

虚拟现实和增强现实

Virtual Reality & Augmented Reality

VR 提供了新的身临其境的体验,用户能够与对象交互并在 3D 空间中导航,区别于物理世界或 2D 图形界面

研究和设计问题:

  1. 如何防止用户体验不好的事情
  2. 确保用户使用最有效的导航方式,如第一人称、第三人称
  3. 如何使用户与虚拟环境中的其他人协作和沟通

信息可视化和仪表盘

信息可视化:通过计算复杂数据生成的图形,通常是可交互且动态的,其目标是提高发现、决策、解释现象的能力

仪表盘:一种日益流行的可视化信息形式,往往是不可交互的,数据旨在描述系统或过程的当前状态

研究和设计问题:

  1. 设计一个易于理解和容易推理的可视化
  2. 是否使用动画或可交互
  3. 2D 或 3D?
  4. 何种隐喻?

笔式交互和触摸交互

手势界面

借助相机、传感器和计算机视觉技术,可以准确识别人的身体、手臂和手势

  • 可适用于双手不方便操作的时候:家电控制、手术室
  • 你知道哪些不同的手势识别机制?

设计和研究问题:

  1. 计算机如何识别和描绘用户的手势
  2. 如何确定手势运动的开始和结束

有时,如打球时,手持设备会体验更好

实物界面 Tangible Interface

通常基于传感器,物理对象与数字表示相结合:当操纵物理对象时,检测到物理对象中的变化从而引起数字效应。

优点:

  1. 可以创造性地操纵,使得动态信息以不同方式呈现
  2. 支持多人一起探索

研究和设计问题:

  1. 物理活动和效果之间应该如何组合
  2. 使用何种实物来使用户能够以自然的方式执行活动

可穿戴计算

研究和设计问题:舒适、卫生、续航、交互方式的选择……

脑机界面

GUI 的演化

更少的记忆、更多的识别、更少的键盘和点击、更不易出错、以及更可视的上下文

其他交互泛型(2023Fall 不涉及)

菜单驱动界面

  1. 以一组层次化菜单的方式提供用户可用的功能选项,一个或多个选项的选择可以改变界面的状态
  2. 通过鼠标、数字键、字母键或者方向键进行选择

  1. 优点
    1. 基于识别机制,对记忆的需求较低;
    2. 具有自解释性;
    3. 容易纠错;
    4. 适合新手用户。若提供了较好的快捷键功能,则对于专家用户同样适用。
  2. 缺点
    1. 导航方式不够灵活;
    2. 当菜单规模较大时,导航效率不高;
    3. 占用屏幕空间,不适合小型显示设备:为节省空间,通常组织为下拉菜单或弹出式菜单;
    4. 对专家用户而言使用效率不高
  3. (1)现代的菜单形式(2)网页上的菜单(3)手机上的菜单

基于表格的界面

  1. 显示给用户的是一个表格,里面有一些需要用户填写的空格
  2. 优点
    1. 简化数据输入;
    2. 只需识别无需学习;
    3. 特别适合于日常文书处理等需要键入大量数据的工作
  3. 缺点
    1. 占用大量屏幕空间;
    2. 导致业务流程较形式

直接操纵

Ben Shneiderman,1982

  1. 用户通过在可视化对象上面进行某些操作来达到执行任务的目的
  2. 展现了真实世界的一种扩展
  3. 对象和操作一直可见
  4. 迅速且伴有直观的显示结果的增量操作
  5. 增量操作可以方便地逆转

直接操纵的三个阶段

  1. 自由阶段——指用户执行操作前的屏幕视图;
  2. 捕获阶段——在用户动作(点击、点击拖拽等)执行过程中屏幕的显示情况;
  3. 终止阶段——用户动作执行后屏幕的显示情况。

优点

  1. 将任务概念可视化,用户可以非常方便地辨别他们;
  2. 容易学习,适合新手用户;
  3. 基于识别,对记忆的要求不高,可减少错误发生;
  4. 支持空间线索,鼓励用户对界面进行探索;
  5. 可实现对用户操作的快速反馈,具有较高的用户主观满意度。

缺点

  1. 实现起来比较困难;
  2. 对专家用户而言效率不高;
  3. 不适合小屏幕显示设备;
  4. 对图形显示性能的需求较高

直接性演化

  1. 更少的记忆、更多的识别、更少的键盘和点击、更不易出错、以及更可视的上下文

问答界面 Wizard

  1. 通过询问用户一系列问题实现人与计算机的交互
    1. Web 问卷是典型的采用问答方式进行组织的应用
    2. 应允许用户方便地取消其中一个界面的选项
  2. 优点
    1. 对记忆的要求较低;
    2. 每个界面具有自解释性;
    3. 将任务流程以简单的线性表示;
    4. 适合新手用户。
  3. 缺点
    1. 要求从用户端获得有效输入;
    2. 要求用户熟悉界面控制;
    3. 纠错过程可能比较乏味。

隐喻(Metaphor)界面

  1. 本质:在用户已有知识的基础上建立一组新的知识,实现界面视觉提示和系统功能之间的知觉联系,进而帮助用户从新手用户转变为专家用户
  2. 优点:直观生动、无需学习
  3. 局限性
    1. 不具有可扩展性
    2. 不同用户对同一事物可能产生不同的联想
    3. 紧紧地将我们的理念和物理世界束缚在一起
    4. 寻找恰当的隐喻可能存在困难

桌面隐喻(桌面演变史)

自然语言交互

  1. 自然语言的模糊性
    1. The boy hit the dog with the stick.
    2. 她说她不知道
  2. 受限于理解技术,当前只能够使用受限的语言与计算机进行交流,Q:还是自然语言吗?

其他交互形式

  1. 虚拟现实交互
  2. 增强现实/混合现实
  3. 触觉交互
  4. 手势/体感交互
  5. 笔式交互
  6. 脑机交互