可用性研究与产品设计.ppt
可用性研究与产品设计,科技水平的快速发展实现了产品功能的日趋完善,同时,也加深了人们对产品功能的复杂化和使用的简易性需求的矛盾,这种矛盾导致了产品普遍存在可用性问题,因而针对改善这一矛盾并以用户为中心的产品可用性研究必然具有重要的应用意义和研究价值。随着设计界和社会对产品可用性概念的推广和重视,可用性研究正在不断深入并成为研究热点,并已经在国内外部分大型企业的产品设计开发中加以应用。,可用性设计最早源于二战时的美国空军,之后可用性概念在工业界迅速普及,其工业应用始于八十年代,而从九十年代开始,可用性工程在IT工业界迅速普及,广泛运用于工业产品的设计。上世纪80年代后的日本,在注重产品工业设计的同时也开始注重可用性设计,与亚洲其他国家的工业产品相比日本的产品除了质量之外,更多考虑的是人的因素,这对日本工业发展起到了不小的作用。除日本外,欧美公司对此也一直很重视。,2004年4月在中国成立了隶属于美国可用性专家协会(UPA)的“可用性专家协会中国分会”(Usability Professionals Association China Chapter,UPA),并于2004年8月8日在上海召开了第一次例会,标示着产品的可用性设计与研究已在中国开始得到重视。,1 可用性与可用性工程定义,通俗地讲,可用性是指产品可使用的程度,或者说是产品满足用户需求的程度,可用性良好的产品一定是用户可以轻松使用的产品,最大限度地满足用户使用需求的产品。可用性是产品的一个基本属性,体现在产品和用户的相互关系中,即与人有信息交流的交互式产品/系统:计算机软件,网站(信息类、事务类),消费电子和家用电器产品,仪器设备(工业、科学、军事、医疗),其它产品/系统(产品包装、说明书、日用品、表格、路标等)。可用性是交互设计的基本而且重要的指标,是对产品可用程度的总体评价。,可用性(usability),就是从用户的角度所感受到的产品是否有效、易学、高效、好记、少错和令人舒适满意的质量指标。我们大家都有这样的经验,即具有同样功能的产品并不等于同样好用,差别在于它们的可用性质量。所以,可用性是决定产品竞争力的关键因素。,1.1 可用性,对于可用性(Usability)的概念,研究者们提出了多种解释。Hartson(1998)认为可用性包含两层含义:有用性(usefulness)和易用性。有用性是指产品能实现一系列的功能。易用性是指用户与界面的交互效率、易学性以及用户的满意度。Hartson的定义比较全面,但对这一定义的可操作性缺乏进一步的分析。,Nielsen(1993)的定义弥补了这一缺陷。他认为可用性包括以下要素:,易学性,系统是否容易学习。交互效率,即用户使用具体系统完成交互任务的效率。易记性,用户搁置使用系统一段时间后是否还记得如何操作。错误率,操作错误出现频率的高低。用户满意度。Nielsen认为,高可用性的产品必须在每个要素上都达到很好的水平。,国际标准化组织在ISO 9241-11(Guide on Usability,1997)中对可用性作了如下定义:,产品在特定的使用环境下为特定用户用于特定用途时所具有的有效性(effectiveness)、效率(efficiency)和用户主观满意度(satisfaction)。其中:有效性 指的是用户完成特定任务和达到特定目标时所具有的正确和完整程度;效率 指的是用户完成任务的正确和完整程度与所使用资源(如时间)之间的比率;满意度 指的是用户在使用产品过程中具有的主观满意和接受程度。,对于可用性的定义的理解有五个方面:即 易学性、高效性、记忆性、容错性、满意性。具体地:,a.产品对于用户来讲应该易于学习,用户可以快速地开始应用某些操作而无需借助于帮助系统;b.用户使用产品是高效的;c.产品的设计应该符合用户的思维和操作习惯,用户再次使用产品的时候不需要重新学习;d.产品应该能够阻止用户的错误或者允许用户改正错误,并且绝对避免毁灭性错误的发生;e.用户在使用产品的时候得到轻松、愉悦的体验。,在某种程度上,与更大的系统可接受性(acceptability)概念相比,可用性是一个较窄的概念,前者是有关系统是否足够良好,是否可以达到满足用户及其他可能的相关方(如用户的客户和经理)的所有需要和需求的程度。计算机系统的整体可接受性,又是由社会可接受性(social acceptability)和实际可接受性(practical acceptability)组合而成的。作为社会可接受性的例子,让我们来考虑这样一个系统,它用来调查那些申请失业救济的人目前是否有支付薪酬的工作,即是否在申请上有欺诈行为。该系统可能会向用户询问一些问题,从中寻找前后矛盾之处或者说谎的迹象。有的人可能认为这种欺诈防范系统对社会很有好处,而有的人则可能认为它对申请人的盘问是一种冒犯,而且延后具有某些特征的申请人得到救济的时间对社会是不利的。在这里,后一种人可能会认为系统是不可接受的,即使它因为能识别出许多说谎者并且让申请人感到容易使用,而在实际可接受性方面得到较高评价。,如果某个系统具有社会可接受性,可以进一步分析它在各个方面的实际可接受性,这包括传统的方面,如成本、技术支持、可靠性、与已有系统的兼容性等,以及有用性。有用性(usefulness)指的是系统能否用来达到某个想要的目标。它可以被进一步分解为实用性和可用性。这里,实用性(utility)指的是系统的功能在原理上是否能够做所需要的事情,而可用性(usability)指的则是用户能否很好地使用系统的功能。,请注意,“实用性”这个概念并不一定限于工作范畴。教育软件(“课件”)的实用性在于学生能否通过使用它来达到学习目的;娱乐产品的实用性在于使用起来是否有趣。这里概要介绍的系统可接受性的简单模型如图所示。,系统可接受性的属性模型,图中清楚地表明,系统可接受性具有许多成分,而在一个开发项目中,必须权衡可用性与其他许多方面的考虑因素。可用性概念适用于人可能与之交互的系统的所有方面,包括安装和维护过程。很难找到一个没有任何用户界面成分的计算机功能。即使是在两台计算机之间传输数据的功能,也通常有一个用来在出现故障时查找原因的界面。,可用性的属性:,可学习性 从某种意义上,可学习性是最基本的可用性属性,因为大多数系统都应当做到容易学习,而且大多数人对于新系统的最初体验就是学习使用它。的确,对于某些系统可以花费大量时间和物力来培训用户去使用难学的界面,但在多数情况下,系统都应当做到容易学习。,容易学习指的是新手用户在学习曲线的开头部分的体验,如图所示。易学系统的学习曲线的开头部分比较陡峭,可以让用户在短时间内达到相当的熟练使用水平。实际上,所有用户界面的学习曲线都是从用户在一开始的时候(当他们刚开始使用的时候)不能做任何事情的状态(效率为0)开始的。,也有例外情况,这包括所谓的走来即用(walk-up-and-us。)系统,如博物馆信息系统,这种系统的使用通常是一次性的,因此所需的学习时间应当为零,让用户可以在第一次尝试使用时就能够成功。标准的学习曲线也不适用于用户把先前系统的有关技能用于新系统的情况,诸如从原先的文字处理程序版本升级到新版本。如果新系统与原系统比较一致,那么用户在新系统学习曲线上的起点就会高一些。,除了主观满意度之外,初始易学习性也许是可用性属性中最容易度量的。可以直接找一些以前没有用过系统的用户,然后度量他们达到某种熟练使用程度所用的时间。当然,测试用户应当能代表系统的目标用户,而且可能需要对没有任何计算机使用经验的纯粹的新手用户和具有一般计算机使用经验的用户分别进行度量。在早些年,关于可学习性的研究基本上都是仅侧重于没有任何计算机使用经验的用户,但由于现在许多人已经使用过计算机,所以,在关于系统可学习性的研究中包括这样的用户,变得越来越重要了。,描述特定熟练程度的常用方法,就是说明用户必须能够成功完成某个特定任务。另一种方法是说明用户需要能够在特定的最短时间内完成一组任务,此后就认为他们“学会”了使用系统。当然,如图所示,实际上学习曲线表示的是一连串持续改进的用户绩效,而没有区分为“学会”“未学会”两种状态。不过,通常的做法还是把某个特定绩效水平定义为用户已经通过了学习阶段而且达到能够使用系统的熟练水平的标志,并且度量用户达到这个水平所用的时间。,在分析可学习性时,应当意识到用户通常并不是在花时间学完了整个用户界面之后,才开始使用系统。相反,用户经常是只学习了部分界面就开始使用。例如,在一项针对那些身为有经验的个人计算机用户的商务专业人员的调查中发现,在6个得分最高的可用性特征中(总共调查了21个特征),有4个与探索性学习有关:容易理解的出错信息、在学习程序的全部功能之前就可以用它来做有用的事情、具有撤消功能以及在执行有风险的命令之前进行确认。由于用户具有这种直接上手使用系统的倾向,所以不仅要度量用户需要花多长时间掌握整个系统,还应当度量需要花多长时间可以达到能够做些有用的事情的熟练程度。,使用效率,效率指的是熟练用户在达到学习曲线上平坦阶段(参见上图)时的稳定绩效水平。当然,用户可能不一定会迅速达到最终的绩效水平。例如,某些操作系统十分复杂,以至于要经过若干年才能达到熟练用户的绩效水平,才能具有使用某些组合操作符来组合执行命令的能力。而且,某些用户也许会不停地学习,虽然大多数用户在学会“足够”的东西以后,似乎就不再学了。不过,对于用户来说,这种稳定的绩效水平可能并不是最佳的,通过学习几个额外的高级功能,有的时候在使用中给他们节省的时间,要多于他们学会这些功能所花的时间。,要想度量有经验用户的使用效率,显然需要有经验的用户。对于那些只投入使用了有限时间的系统来说,“有经验”的定义经常不那么严格,某些用户被认为是有经验的,或者是由于他们自己这样称呼自己,或者是由于他们已经做了一段特定时间(比如一年)的用户。所谓经验还可以更正规地通过使用系统的小时数来定义,而且这种定义经常用在那种没有形成成熟用户群的新系统的试验上:把测试用户招来,先让他们花特定的几小时时间来使用系统,然后再度量其效率。还可以通过学习曲线来定义有经验的用户:持续地度量用户的绩效水平(比如,完成特定任务需要用多少秒),,当发现绩效水平在一段时间内不再提高时,就可以认为用户已经达到了该用户的稳定绩效水平。因此,度量使用效率的典型方法就是,确定关于技能水平的某种定义,寻找一些具有这种技能水平的有代表性的用户样本,然后度量这些用户执行某些典型测试任务所用的时间。,可记忆性,非频繁使用用户是除了新手用户和熟练用户之外的第三种主要的用户类型。非频繁使用用户是那些间断使用系统的人,他们不像熟练用户那样比较频繁地使用系统。与新手用户不同,非频繁使用用户以前使用过系统,所以他们不必从头学起,而只需要基于以前的学习来回忆起怎样使用。非频繁使用的情况,常见于只在例外情况下使用的实用程序;辅助应用程序;或本来就具有长间隔时间使用特点的程序,如制作季度报表的程序。,让用户界面容易记忆,对于那些度假归来或因某种原因暂时停止使用系统的用户来说也是重要的。在很大程度上,可学习性的改进经常同时也会使得界面容易记忆,但从原理上说,系统对于回头用户的可用性,与对于初次接触系统的用户的可用性是不一样的。,例如,让我们来考虑一下在华盛顿特区某些地铁车站外面所见到的“亲吻与车”(Kiss and Ride)标志。在初次看到的时候,可能不太清楚这个标志的含义(在没有外界帮助的情况下,它的可学习性较差)。但是,一旦你知道了这指的是让那些搭别人开的车过来的通勤者下车的地方,这个标志就变得很容易记忆了,从而能让你在其他车站找到这样的地方(容易记忆)。,对界面可记忆性的测试,很少像对其他可用性属性那样全面。但从原理上说,有两种主要的度量方法。一种方法是对于在特定长的一段时间内没有使用系统的用户,进行标准用户测试,度量这些用户执行某些特定任务所用的时间。另一种方法是对用户进行记忆测试,在他们结束一个使用系统的过程后,让其解释各种命令的作用,或者说出完成某种功能的命令(或画出对应的图标)。最后得到的用户界面可记忆性得分,就是用户给出的正确答案的个数。,对非频繁使用用户进行绩效测试,最能说明我们想度量可记忆性的原因。记忆测试进行起来可能是容易的,但也有问题,因为许多现代用户界面设计的基本思想,就是让用户看到尽可能多的东西。这种系统的用户不需要去主动记忆有什么庆西,因为系统会在必要的时候给予提示。事实上,对这种图形界面的一项研究表明,尽管用户在离开系统后记不住菜单内容,但当他们坐在计算机前的时候,却能够毫无问题地使用这些菜单。,少出错,无灾难性错误,应当让用户在使用计算机系统的过程中尽可能少出错。通常错误被定义为不能实现预定目标的任何操作,而系统的出错率是通过用户执行某个特定任务时统计这种操作的次数来度量的。从而,可以作为度量其他可用性属性的试验的一部分来度量出错率。,把错误简单定义为任何不正确的用户操作,这并没有很好地考虑到各种出错情况的不同影响。某些出错可以被用户立刻纠正,除了使用户的事务处理速度降低之外,没有什么其他的影响。对于这类出错没有必要单独统计,因为如果按常规根据事务处理时间来度量使用效率的话,其影响会被包含在使用效率中。而某些错误从性质上来看则更具有灾难性,这或者是由于不能被用户所发现,从而造成有问题的工作结果,或者是由于它们破坏用户的工作,使之难以恢复。对于这类灾难性的错误应当与轻微错误分开统计,要采取特殊措施将其发生频度降到最低。,主观满意度,最终的可用性属性,即主观满意度指的是系统的使用令用户感到愉快的程度。对于那些在非工作环境下(诸如家用计算、游戏、交互小说或创意绘画等)以随意方式使用的系统来说,主观满意度是一个特别重要的可用性属性。对于某些这样的系统来说,其娱乐价值比起完成某些事情的速度更重要,因为人们可能想要享受长时间的乐趣。用户在使用这种系统时应当有一种愉快、受感动或得到满足的体验,因为他们除此之外没有其他目的。,这里需要注意,作为一项可用性属性的主观满意度,与公众对于计算机的总的态度并不是一回事。尽管一个人对计算机的态度,一般来说可能会影响这个人喜欢与某个特定系统交互的程度,1.2 可用性工程,可用性工程(Usability Engineering)是以提高产品可用性为目标的多学科交叉领域,综合了技术学科、心理学、工业设计、人机工程学、社会学等学科的方法,强调在产品开发过程中要紧紧围绕用户这个出发点,要有用户的积极参与,以便及时获得用户的反馈并据此反复改进设计,其核心是以人为中心的设计方法论(Humen Centered DesignHCD)。,它包括了一整套以提高和评估产品可用性质量为目的、以用户为中心的实用工程方法,分别运用于产品生命周期的不同阶段,能有效评估和提高产品可用性质量,以弥补常规开发方法无法保证可用性质量的不足。自九十年代以来在美、欧、日、印等国工业界普遍应用该工程方法。,1.3 可用性和国际标准,对于产品普遍存在可用性问题的重视,直接导致了新的国际标准ISO9241:对带有可视终端(VDTS)办公设备的人机工程学要求。这一标准提出了计算机系统以人为中心的设计思想,以及人机界面设计时应该遵循的心理学原则,提出了“可用性”的定义。这一概念后来被用于ISO/CD20282日用品的可用性。并将“可用性”定义为:产品能够被特定使用者为特定目标在特定使用环境下方便、有效、满意地使用的程度。,ISO/CD20282在ISO9241的基础上扩大了可用性概念,把这一概念扩大为消费品、日用品及计算机产品和普通公众使用的仪器设备上。其目的是指导产品设计以便使用者可以凭直觉使用。他还提供了试验方法以便产品开发者和消费者保护组织可以据此测量新产品的可用性程度。,该标准主要包括以下四部分内容:使用者特征和使用环境;试验方法;分类和标注;设计方针。,到目前为止,仅有IEC/TR61997推出了使用界面质量的评价分类:,一个星,代表被评价产品的主要功能可以容易地操作;,二个星,代表被评价产品的全部功能可以容易地操作;,三个星代表被评价产品的全部功能可以轻松,愉快地被操作。ISO/CD20282目前正在积极努力创造确保全球范围内的人们都可以方便地使用所有日用品,当然也包括残障人和老年人的条件。一项产品的良好的可用性应该使老年人也能独立地使用,并从现代技术中获益。,再简单介绍两个标准:CIF与ISO 9241。,CIF:2001年11月被正式颁布为美国国家标准(ANSI/NCITS 354),由美国主要软件产品开发商和采购商自愿发起、美国国家标准技术局(NIST)主持制定的通用工业规范(CIF)可用性测试报告标准;它规定了可用性测试结果的报告规范,为软件产品的可用性质量提供了一种客观、统一、定量的衡量标准,使之在产品采购过程中具有可见性。,ISO 9241:它是关于办公室环境下交互式计算机系统的人机工程学国际标准,它由17个部分组成,根据人机工程学和可用性原理,分别对各种硬件交互设备属性和软件用户界面设计问题作了详细的规定和建议。可以对一件产品设计符合该标准的程度进行评估和认证。,2 产品的可用性与实用性(utility),从上文不难得出,可用性是衡量使用一种产品来执行指定任务的难易程度的尺度,它与实用性和受欢迎度等相关概念是有差异的。决定产品可接受性(acceptability)的核心属性是其有用性(usefulness),它用于评价实际使用产品时,是否能达到设计人员期望产品实现的目标。有用性的概念可以进一步划分为实用性(utility)和可用性。虽然这些术语间有联系,但它们却不能相互替代。,实用性指产品执行任务的能力。根据设计,产品执行的任务越多,其实用性就越高。譬如:二十世纪八十年代末问世的典型 Microsoft MS-DOS 字处理程序。此类程序提供了多种强大的文本编辑和处理功能,但需要用户学习和记忆几十个令人费解的按键后才能执行这些功能。可以说此类应用程序具有很高的实用性(它们为用户提供了必要的功能),但其可用性却较差(用户必须花费大量的时间和精力来学习和使用它们)。与之形成对比的是,一个设计合理的简单的应用程序(如计算器)使用起来很容易,但其实用性却有欠缺。,这两种性质都是一种产品被市场接受所必需的,而且它们都是有用性概念的一部分。显然,若程序很好用,但没有什么有价值的功能,那么不会有人使用它;如果程序的功能强大但很难使用,那么用户也很可能会拒绝这个程序而转向其它的替代品。,3 可用性工程生命周期,可用性工程是在产品整个生命周期中进行的一组活动,并且是在用户界面设计开始之前的早期阶段就要开展的重要工作,而不是在产品推向市场之前进行一次性活动即可完成的。同时,可用性在广义的企业产品开发环境中,一次性的项目是很少见的,它对于整个产品族的开发都应是适用的,也应适用于那种隔一段时间后推出新版本的扩展项目。产品的可用性工程的生命周期模型中的阶段如下表。在资源限制条件下,在产品开发的各阶段选择适当的可用性方法,同样可以使可用性工程活动获得成功。,可用性工程生命周期模型中的阶段,值得强调的是,在这个生命周期模型中,进入设计活动之前,要想使可用性活动左右产品的设计,最省力的办法就是在设计开始之前开展尽可能多的可用性活动,以减少在设计中后期为满足可用性要求而更改设计,也可以避免对不必要的产品功能进行开发投入,减少成本。同时,将产品可用性属性研究作为市场研究的一部分,无疑,有利于增强用户对产品的认可度。,4 产品设计过程与可用性研究,产品的设计过程可分为产品需求设计阶段、概念设计阶段、详细设计阶段和完善阶段等四个阶段。产品生命周期的不同阶段,从拟订以人为中心设计的计划开始,对用户使用状态、使用要求进一步研究,制定出设计解决方案,反复进行可用性评估,采用不同的可用性工程方法,从而实现所开发的产品具有较高的可用性质量,如图所示。,可用性研究与产品设计,4.1 产品需求设计阶段,产品需求设计阶段的主要任务是确定产品设计的目标和需求范围。该阶段通常进行以用户研究为主的需求研究、竞争力分析等可用性研究。需求研究以用户研究为主的需求研究,是进行产品可用性活动的首要步骤。广义上的用户,指其工作以某种方式受到产品影响的所有人,包括系统最终产品或输出的用户。,要提升产品的可用性,必须在整体开发生命周期中进行各种用户研究与测试,并进行反复设计,在早期设计阶段的评估就需要研究用户与可用性评估,让用户和开发者能够根据反馈提升可用性。这主要包括是从用户的角度出发,了解目标用户的行为特点和需求分析,观察用户的使用习惯,分析市场需求,考虑可为用户做些什么以及实现的难易程度。它以寻求设计机会为目标,而不是寻求具体的产品功能。,a.开展用户研究,首先必须对用户进行分类,也就是明确产品的目标用户特征,兼顾个体用户的特征。有些产品的用户会是某个特定单位的特定部门,而有些产品的用户分布很广泛。一般地,在做用户研究的时候,只能接触少数代表性的顾客。,b.用户研究的工作内容。,主要了解用户的工作经历、教育程度、年龄、产品使用环境、阅读和语言技能水平、同类产品的使用经验等情况,从而预测他们在学习和使用产品时可能会遇到的困难,改进人机交互界面的可用性程度。,c.用户研究的途径,主要有市场研究、问卷调查、访谈、抽样调查、观察性研究等。在任何情况下,都不应当完全依赖于书面记载的信息,因为来自于实际工作环境中对真实用户的观察和交谈的信息通常能在提高产品的可用性方面提供有效的支持。,竞争力分析 通过竞争力可用性分析,为产品设置量化的可用性目标。如任务完成的进度、使用出错次数等等。竞争力分析对象分为对公司内部的产品和市场上与其相竞争的产品。对公司内部的产品,是在与优化前的产品竞争,也可能与人工过程进行竞争即产品必须比现有的更有效、更好。对市场上与其竞争的产品,则比较同类产品的性能。,4.2 概念设计阶段,此阶段将进行首次实际的产品设计。在此阶段中,有关产品的早期设想将初步成形,并着重于先前阶段未涉及的知识。原型可以是任何形式,如描述概念或产品模型的纸面原型、计算机数字建模、伪装原型等。一般来说,原型的仿真度越高,对未来真实产品进行可用性评估的准确性就越高。,a.作业情景描述,使用作业情景描述,可创建一个有关用户使用产品时的“情景故事”。这些情况可以是情节串联图板、简单的流程图或简单的叙述性文本。一种比较精致的用户情节模式是“日常生活”录像。这种录像把用户在日常活动中与模拟的系统进行交互。通过用户情节可得出在任务分析时要寻找的具体细节。,b.任务分析,在产品设计工作开展之前,要对产品的设计任务进行细致的分析,明确产品的功能目标和人机交互界面的功能分配。对任务的逼真度进行分析意味着观察用户完成一项任务或功能所必须执行的所有操作;或进行表象的观察,了解用户完成所有任务或功能所需执行的所有操作。采用观察有代表性的用户以及与他们的直接交流方式有利于任务分析的有效进行。,在对产品的正常操作情况下的进行任务分析后,还应让用户描述其正常工作过程中的例外情况,以提高产品应付意外情况的能力,并得到产品设计开发的一些启示。任务分析决定了在新产品设计中如何实现产品功能的方式,设计师可以按照层次结构进行分解,每个较大的任务和目标可以被分解为较小的子任务,逐步分解,得到设计的最小子任务。,c.启发式评估,启发式评估是一种可以发现用户界面设计中存在的可用性问题的非正式可用性检查技术。它是建立在评估者了解产品同时又具有可用性专业知识基础上的,普通用户并不参与。具体方法是,专家采取“角色扮演”的方法,以“启发式原则”为指导,模拟典型用户使用产品的情形,每个参与评估的专家独立完成产品可用性的检查后,专家之间进行交流,并将发现的问题进行归纳总结,从中找出潜在的问题。在产品设计的早期阶段,启发式评估可能是发现可用性问题的非常有效的方法。,d.认知负担度量,认知负担度量即检查产品使用过程中,用户需要执行多少步操作以及何种操作后,才能实现某项功能,其中包含用户必须经过思考才能完成的那些操作。此时,认知性任务决定学习和使用产品的难易程度。认知性负担度量可以有效地帮助产品设计人员找出潜在的可用性问题。,e.反复可用性测试,反复可用性测试是一种很有价值的方法,用于在产品周期的早期阶段确定产品使用界面是否易于用户使用。在此阶段更改易于进行,并且成本更低。在许多种情况下,严谨的可用性测试过犹不及。在建模阶段,仍可使用简化的方法进行有效的可用性测试,这些方法通常称为“打折扣的”可用性测试。反复的可用性测试主要包括:用户观察和任务分析;简化的对话式测试,一次安排一个用户完成一组任务,并要求用户发现问题就直接告知测试人员;运用启发式评估方法评价交互界面等。,f.产品族的开发和用户的演变准备,用户的演变,典型的变化就是用户经过一段时间之后成为熟练用户,从而需要快捷的交互方式,即快捷键的使用。比如,应用软件的使用。因此,在产品设计时,不应只针对初级用户的使用方式来设计产品的人机交互系统。对于产品的开发者来说,由于产品创新风险存在的客观性,在其实力允许的情况下,通常实行多个产品的开发。即核心设计和基本产品要素相同的产品族的开发。可用性在广义的企业产品开发环境中,一次性的项目是很少见的,它对于整个产品族的开发都应是适用的,也应适用于那种隔一段时间后推出新版本的扩展项目。,4.3 详细设计阶段,它是实现产品具体功能、结构和外观造型的阶段,但不是所有的功能都在该阶段同时完成。在此阶段,设计人员可以进行可用性实验室测试,该测试类似于概念设计阶段的反复可用性测试。但是,由于产品的设计已趋于完善,原型就越接近真实产品,可以测试更多的任务。但是,用接近完成的产品进行测试的问题在于,修改的余地很小,难于对发现的问题做较大的修改。,4.4 完善阶段,当详细设计结束、错误已修正后,就进入了完善阶段。在此阶段中,要完成一个面向市场的产品可用性评估与测试,主要分为可用性实验室测试和小范围用户使用产品信息反馈修正两种方法,其重点是进行不断的测试微调,完善产品设计。对可用性进行基准测试的目的是通过测试用户想要完成的所有任务,就产品的可用性提供可靠的量化数据,评估产品可用性的状态。进行基准测试,首先要研究产品的功能,并进行优先级区分,以确保具有较高优先级的产品功能的可用性。此阶段可视为对整个设计过程的回顾阶段,进行竞争性分析和市场研究,找出存在的问题,为下一轮新产品的开发做准备。,5 可用性测试方法,在测试可用性及用户对产品的接受程度方面,可用性测试已经成为最重要和被最广泛使用的方法之一。对可用性测试的最佳诠释就是把一个产品放到一个试验性的市场中。在测试中,受试者代表了该产品的目标用户群,他们被放到经过精心设计的模仿一个产品或是程序在真实使用中将出现的情境(scenarios)中去。比如,项目工程师使用一个新版的编程工具为化工厂调整参数,医生使用一个计算机断层扫描仪的原型来进行临床诊断等。由于这些情境和用户的现实环境十分相似,测试便提供了一个在项目开始的早期阶段发现产品问题以及进一步改进产品的机会。因此,通过可用性测试,项目策划人员便可以对产品的要求进行优化。,5.1 可用性测试,可用性测试是指在设计过程中被用来改善易用性的一系列方法。可用性专家为用户提供一系列操作场景和任务让他们去完成,这些场景和任务与产品或服务密切相关。通过观察,发现过程中出现了什么问题、用户喜欢或不喜欢哪些功能和操作方式,原因是什么。从而拿出改进方案。因此,对产品进行可用性测试,能够帮助尽早发现产品中可能会出现的使用问题,并在产品开发或正式投产之前给出改进建议,以较小的投入全面改善产品,节约开发成本。,其内容主要有三个方面:,a产品用户模型的研究:可用性设计范畴里的用户研究是主要针对可用性设计的用户研究,有自己独特的方法和途径。通过对用户的工作环境、产品的使用习惯等研究,使得在产品开发的前期能够把用户对于产品功能的期望、对设计和外观方面的要求融入到产品的开发过程中去,从而帮助企业完善产品设计或者探索一个新产品概念。,b交互设计的研究:在设计方面,目前大多数公司都还只是注重创意,在可用性方面却考虑甚少。如工业设计方面往往多注重造型,界面设计公司则强调平面设计,对于用户的体验设计考虑甚少,普遍缺乏交互设计和可用性的研究。,c产品设计的检测和评价:可用性测试是一个评估可用性水平的过程,它能评估用户实现任务的效率性和效力性。它是一个标准化的方法使得每个应用的各个方面都能满足用户的友好性、功能性和艺术性。,5.2 可用性测试的方法,让真正的用户来进行用户测试是最基本的可用性方法,并且从某种意义上来说是一种不可替代的方法。它告诉我们有关人们如何使用产品的直接信息,以及被测试界面的确切问题所在。同时,以下方法也都可以很好地帮助我们以更低廉的成本来收集其他方面的信息,或者得到有关可用性问题的见解。在可用性测试中,需要注意其中的可靠性和有效性问题。可靠性指的就是当重复进行测试的时候,是否还会得到与原来一样的结果;而有效性指的是所测试的结果是否能真实地反映出想要测试的可用性问题。,可用性评估的方法主要包括:可用性测试(Usability Testing)、启发式评估(Heuristic Evaluation)、认知走查法(Cognitive Walkthrough)行为分析(Action Analysis)等。这里主要介绍可用性测试方法。可用性测试是测试者邀请用户使用设计原型或产品完成操作任务,并通过观察、记录和分析用户行为和相关数据,对界面可用性进行评估的一种方法。可用性测试能够对界面的可用性进行全面的评估,是最为常用的方法之一。它适用于产品界面和界面设计中后期界面原型的评估。可用性测试通常在一个备有摄像和监视装置专门的实验室内进行。,5.2.1 参与人员和评估对象,可用性测试的参与人员包括多名测试人员和用户。测试人员中,一人为主测试者,负责引导用户完成测试,并直接观察用户操作。其它为观察者,仅通过监视装置观察和记录用户的行为反应。用户通常分别单独完成测试。参与可用性测试的用户应当具有代表性,是产品的目标用户或具有相同性质,以免影响测试的准确性和有效度。可用性测试的评估对象是产品或设计原型。,5.2.2 评估过程和评估结果,可用性测试主要包括5个步骤:确定测试计划;准备评估对象和测试设备;招募用户;正式测试;分析结果并撰写报告。测试计划需要确定测试目的和目标。测试前,测试者要准备好评估对象和测试设备并招募用户。测试过程中,主测试者负责引导用户完成测试。用户利用产品或原型完成测试任务,观察者负责观察和记录用户的行为反应数据。测试完成后,测试者们对结果进行分析并撰写报告。,测试过程中,多种方法可以用来收集用户的行为反应数据,其中包括:,直接观察法;大声思维法;访谈法;问卷法;录像记录法。,直接观察法是指测试者直接观察用户的任务执行过程,并记录感兴趣的行为和任务完成情况的一种方法。直接观察法主要包括按时间采样和按事件采样两种。直接观察法有助于测试者直接了解用户的认知操作特点和态度,但有时无法避免“霍桑效应”,即正式的测试环境会提高用户动机.从而不自觉的提高他们的测试成绩,进而影响测试的有效度。,测试过程中,除了收集用户的行为数据,了解用户的思维过程和态度也很重要,测试者常用的方法有大声思维法、访谈法和问卷法。,大声思维法是指在任务执行过程中,让用户随时大声说出操作思路的一种方法。但大声思维有时会干扰用户的任务执行过程。访谈法一般分为结构访谈和半结构访谈。结构访谈是指测试者按预先设计好的问题获取用户思路和态度的方法。半结构访谈一般也按照预先设计的问题展开访谈,但比结构访谈更灵活,允许用户适当跑题。两种访谈法都需要访谈前仔细地计划访谈内容。问卷法是指以问卷的形式量化用户的满意度,并了解用户态度的一种方法。在可用性测试中,访谈法和问卷法通常在用户完成操作任务后使用录像记录法是将用户的任务完成过程录制下来以备测试者回顾测试和作进一步分析。,一般说来,可用性测试的结果包含定量数据如任务完成时间等和定性数据如操作过程等。测试者需要综合两类结果并提出界面改进的建议。,5.3 可用性测试的内容,可用性测试主要包含以下内容:任务操作的成功率、任务操作效率、任务操作前的用户期待、任务操作后的用户评价、用户满意度、各任务出错率、二次操作成功率、二次识别率、用户操作过程中各认知纬度(视产品情况而定)等。,5.4 可用性测试花费的时间,典型的可用性测试,需要两周的前期沟通和准备,一个星期测试,两个星期提交分析报告。根据测试的内容及项目规模作调整。,5.5 可用性测试的文档,可用性测试的文档主要包括:目标用户筛选文档、日程安排文档、用户背景资料文档、用户协议、测试脚本、测试前问卷、测试后问卷、任务卡片、测试过程检查文档、过程记录文档、测试报告、影音资料(DVD)等等。,