人机交互技术及应用
上QQ阅读APP看书,第一时间看更新

3.5 击键层次模型

击键层次模型(Keystroke Level Model, KLM)可对用户执行情况进行量化预测,能够比较使用不同策略完成任务的时间。量化预测的主要好处是便于比较不同的系统,以确定何种方案能最有效地支持特定任务。

1.击键层次模型的内容

Card等人在KLM上施加的约束是KLM只能应用到一个给定的计算机系统和一项给定的任务。同时,与GOMS模型类似,KLM的应用要求任务执行过程中不出现差错,并且完成任务的方法事先已经确定。也就是说,KLM能够用来预计任务差错执行的时间。

KLM由操作符、编码方法和放置M操作符的启发规则组成。以下对它们进行详细介绍。

(1)操作符

操作符定义见表3-1。在开发击键层次模型的过程中,Card等人分析了许多关于用户执行情况的研究报告,提出了一组标准的估计时间,包括执行通用操作的平均时间(如按键、单击鼠标的时间)、其他交互过程的平均时间(如决策时间、系统响应时间等)。考虑到用户不同的打字技能,所列的时间为平均时间。

表3-1 KLM中各种操作符的执行时间

依据表3-1,首先列出操作序列,然后累加每一项操作的预计时间,即可对某项任务的执行时间进行预测。

(2)编码方法

Card等人描述的编码方法用来定义如何书写包含在任务中的操作符。例如,对执行DOS下的“ipconfig”命令的操作符序列,使用普通表达形式的编码如下:

此外,他们还定义了一个简略编码方式。同样针对上述命令,使用简略编码方式的编码为

对一个平均技能的打字员来说,使用两者编码计算的执行任务执行时间都是

(1.35+9×0.28)s=3.87s

又如,在Microsoft Windows 10操作系统下单击网络连接图标,然后在弹出的菜单中选择修复选项。假定当前用户的手放在键盘上,则这一任务的KLM编码为

这个任务的执行时间为(0.40+1.35+2×1.1+2×0.2)s=4.35s。

上面两个例子假设用户开始执行任务时的位置为命令行界面或者图形用户界面。这两个例子表明基于键盘的DOS命令比基于菜单的方法高效。

又如,使用字处理器(如MS Word)在英语句子“Running through the streets naked is normal.”中插入单词“not”,使之成为“Running through the streets naked is not normal.”。为了计算任务时间,需要考虑用户会怎么做。假设用户已经阅读了这个句子并准备修改。首先,用户需要考虑应选择何种方法,这是一个思维操作(M)。接着,准备使用鼠标,这是一个复位操作(H)(即伸手触及鼠标)。接下来的步骤依次是:把光标定位在单词“normal”之前(P),单击鼠标(P1),把手从鼠标移至键盘(H),考虑需要输入哪些字符(M),输入字母“n”“o”和“t”(3次K),再键入“空格”(K)。

上述操作过程使用普通表达形式的编程如下:

当时间由许多部分组成时,快捷的方法是把相同的操作组织在一起,即使用简略表达形式。在上例中,可以采用以下计算方法:

2M+2H+P+P1+4K=(2.70+0.80+1.10+0.20+0.88)s=5.68s

对在句子中插入一个单词而言,5s似乎太长,尤其是对于熟练打字员。在计算之后重新检查决策是一个好办法。人们可能会想,为什么在输入字母n、o、t之前要进行思维准备,而在执行其他操作之前不需要这个过程呢?这个思维准备是否必要?或许根本就不需要。那么如何确定是否需要在具体操作之前引入一个思维过程呢?

确定哪些操作之前需要引入一个思维过程是使用击键层次模型的主要难题。在某些情况下,思维过程是很明显的,尤其当任务涉及决策时,但在其他情况下就未必存在。另外,正如用户的打字速度可以不同,他们的思维能力同样也存在差异,这可能引起0.5s甚至超过1min的误差。先选择类似的任务进行测试,把预测时间和实际执行时间进行比较有助于克服这些问题。此外,也必须确保决策方法是一致的,即在比较两个原型时,应对每一个原型使用相同的决策方法。

(3)放置M操作符的启发规则

表3-2所列启发规则为认知操作符的管理方法,可基于此确定M操作符的使用数量。

表3-2 放置M操作符的启发规则

2.击键层次模型的局限型

正如Card等人的初衷,KLM高度关注人机交互方面,其目的是为执行标准任务的时间进行建模。但KLM没有考虑到错误、学习型、功能性、回忆、专注程度、疲劳及可接受性等问题。不过Card等人也指出,虽然KLM没有考虑用户出错的情况,但是如果知道弥补方法,KLM同样可以预测执行弥补任务的时间。

对KLM的后续研究丰富了模型,并将感知、记忆和认知加入原始的6个操作符中,从而增加了KLM作为设计工具的建模能力。Olson等总结了KLM操作符的扩展集合,见表3-3,表中所列时间为多项研究成果的平均数。

表3-3 击键层次模型操作符的扩展集合

3.击键层次模型的应用

John和Kiers提供了一些关于现实世界中KLM支持交互设计的研究案例。这些案例的范围很广,如施乐公司将KLM作为代理用户来比较系统的性能,贝尔实验室用KLM来确定数据库检索的有效方法。在鼠标驱动的文本编辑和查号工作站案例中,KLM在其交互设计的早期阶段为用户性能评估提供了有效、准确的模型。

(1)鼠标驱动的文本编辑应用

在Xerox Star研发过程中,仅有几种基于鼠标的文本选择机制,每种机制需要的鼠标按钮数也不同。设计者主要考虑减轻对鼠标的学习压力,并希望尽可能减少鼠标按钮的数目,同时希望能够为专家用户提供足够的鼠标功能。

由于当时鼠标是一种新型设备,还不存在真正的专家用户,这就增加了在多个设计方案中做决定的困难性。研究者将KLM计算得到的数据作为专家用户的使用数据,并将新用户使用鼠标过程中获得的经验数据和从KLM计算执行相同任务得到的数据进行比较,从而解决了不存在真正专家用户的困难。因此,设计者在新用户的学习能力和提供给专家用户的功能之间进行权衡。

(2)查号工作站

1982年,贝尔实验室“人因工程”(Human Factor)小组的成员使用KLM分析了操作员对贝尔系统查号工作站的使用流程,以获得对流程效率的实验数据。当时普遍的想法是使用尽可能少的输入,并从存储用户姓名和电话号码的数据库中得到尽可能多的结果。这种想法被称为“少量输入、大量结果”。但是通过分析当时数据库并提取一组标准查询,然后应用参数化的KLM计算这组标准查询的时间,最终证明当时的想法是错误的。KLM阐明了查询过程中的输入数与查询返回结果之间的折中,最终使得查号操作员的查询输入变得相对较长。