人机交互:3C融合之路

时间:2022-10-29 11:12:27

人机交互:3C融合之路

人机交互技术是一个看上去很冷冰冰、很技术的名词,但是她无时无刻不在改变着我们的生活,她无处不在,与我们如影随形。人与机器的交互已经越来越便利,网络打破时空的界限,全世界所有人、所有事都有机会融合到了一起,当Second life(第二人生)等虚拟现实社区出现后,人们发现,虚拟网络世界与现实世界的界限越来越模糊,甚至分不清生活在虚拟世界,还是生活在现实世界里。

刚刚过去的2006年是全球的融合转折年。3C(计算机、通信和消费电子)融合、3网(广电网、通信网和公共互联网)融合、ICT(IT、通信业)融合、TMT(通信、媒体和新技术)融合,内容产业和互联网及通信业的融合……融合成为了一股潮流。

3C(计算机、通信、消费电子)融合也不是一个新词汇,不过,当我们把3C融合与人机交互二者联系起来时可以发现,人机交互的发展过程正是3C(计算机、通信、消费电子)的融合过程,也正是当今信息社会的形成过程。

如今计算机所涵盖的范围早已超越了PC,它被嵌入到各种家用电器设备、手机、甚至MP3、MP4中。

人机交互指的是计算机输入、输出设备,是以有效的方式实现人与计算机对话的技术。人机交互是计算机系统的重要组成部分,是当前计算机行业竞争的焦点,它的好坏直接影响计算机的可用性和效率,计算机处理速度和性能的迅猛提高并没有相应提高用户使用计算机交互的能力,其中一个重要原因就是缺少一个与之相适应的高效、自然的人――计算机界面。人机交互是未来IT的核心技术。回顾人机交互的历史,这是从人适应计算机到计算机不断地适应人的发展过程,它经历了几个阶段。

在早期的手工作业阶段,计算机只能由设计者本人来使用,设计者采用手工操作和二进制机器代码的方法,去适应十分笨拙的大型计算机。

进入作业控制语言及交互命令语言阶段,计算机可以由程序员操作,采用批处理操作语言或者交互命令语言的方式与计算机打交道,虽然程序员要记忆许多命令语言,并且要熟练地敲打键盘,但这时候已经可以使用比较方便的手段来调试程序,也可以随时了解计算机执行情况。

到了二十世纪六十年代,鼠标和图形用户界面 (Graphy User Interface)出现,彻底改变了计算机的历史,GUI的主要特点是桌面隐喻、WIMP(窗口、图标、菜单和指点设备,Window/Icon/Menu/Pointing Device)技术、直接操纵和所见即所得,由于GUI简明易学,减少了敲键盘,实现了事实上的标准化,使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。

1968年,世界上出现了第一只鼠标,鼠标的发明人恩格尔巴特是电脑界的一位奇才,是“人机交互”领域里的大师,他苦其一生研究计算机,出版著作30余本,并获得20多项专利,他发明了视窗、文字处理系统、在线呼叫集成系统、共享屏幕的远程会议、超媒体、新的电脑交互输入设备、群件等等,但人们提起他时,却只知道他发明了鼠标。鼠标最早的原型是一只小木头盒子,工作原理是由木盒底部的小球带动枢轴转动,并带动变阻器改变阻值,产生位移信号,信号经计算机处理,屏幕上的光标就可以移动。

二十世纪九十年代,网络用户界面的出现,超文本标记语言(HTML)及超文本传输协议(HTTP)为主要基础的网络浏览器,是网络用户界面的代表,这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、多媒体动画、聊天工具等。

以往信息贫瘠的时代一去不复返,信息变得越来越多、越来越密集,信息出现了大爆炸。搜索引擎则让人们在纷繁复杂的信息中获取需要的信息,人们可以扔掉复杂的网址,在搜索框中输入关键字,点击搜索,一切变得如此简单。

二十一世纪后,人机交互的特点是多通道、多媒体。以虚拟现实为代表的计算机系统的拟人化,以及以手持电脑、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势。通俗地讲就是,手机越来越大、电脑越来越小。鼠标和键盘为代表的GUI技术不再是主导,而是利用人的多种感觉和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,大大提高了人机交互的自然性和高效性。

语音突破文字

让计算机能听、能看、能说、能感觉是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比起其它的交互方式有更多的优势。

最早的语音技术因“自动翻译电话”计划而起,包含了语音识别、自然语言理解和语音合成三项非常重要的技术。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。

让计算机说话需要用到语音合成技术,其核心是文语转换技术(Text to Speech),语音合成甚至已经应用到汽车的信息系统上,车主可以将下载到系统电脑中的文本文件、电子邮件、网络新闻或小说转换成语音在车内收听。还可以通过特定的服务网站订阅新闻,享受个性化的网络信息服务。

2008年是语音技术重要应用的一年,“数字奥运”的目标就是研发“面向奥运多语言信息服务系统”,多语种语音合成产品是构成整个服务网络系统的重要组成部分,这套系统可以提供多语种、多方言、多发言人、多语气语调并且具备一定自学习能力的个性化语音服务。

数字墨水

有人认为,数字墨水被认为是要来取代键盘和鼠标等现有的人机交互技术的。人大商学院院长、人机交互专家毛基业说:“任何一种新技术的出现都是对现有技术的一种补充,而不可能是取代,正如电视没有取代收音机一样,数字墨水等新技术也无法取代键盘和鼠标,二者是互相补充的关系。”

事实上,数字墨水技术能为人们提供一种新的人机交互界面,并以此来扩展人们使用电脑的空间范围,数字墨水不是用来取代鼠标和键盘的。用户在使用电脑时,就像用笔在纸上写字、画图一样,将电脑的计算处理能力与人们的手写整合为一体,大大延伸了电脑为人们提供便利的时间和空间。

比如,让学生在听课时也可以享受电脑的好处,在课堂上利用数字墨水进行手写记录,得到被电脑直接“读懂”的数字文件,可后还可以继续进行编辑、共享、查找和网络传递。或者当你在厨房烹调时,想从电脑中查阅菜谱,手写的输入界面也比键盘更方便。

垂直搜索

原有的搜索技术已经无法满足人们多样化的需求,人们需要一种更智能、更精确的搜索技术。垂直的对象搜索技术随之诞生了,“垂直”是指不像原有的“包罗万象”的搜索,而是指向某一特定领域,如学术、购物、求职等,用户可以在自己感兴趣的领域内进行搜索。“对象”则指搜索的结果不再是一个个独立的页面,而是将每个页面中的相关信息按照用户的需求集合成一个个完整的项目。

例如,搜索某个商品时,垂直搜索技术可以把这个商品的图片、参数、价格、商家位置、用户评价等相关信息集合在一个页面上,用户可以在第一时间得到最需要的内容。

眼标

交互基本上都离不开用户的视觉,那么如果用户能用眼睛(直接用大脑思维来控制的“脑标”目前还太遥远)来操控图形界面岂不是更方便?由此,“眼标”应运而生。

2002年伦敦帝国学院的科研小组花费数年时间来研究人类眼睛活动与大脑感知之间的关系,最终发明出一种专门用来捕捉眼球细微动作的红外线感应装置,被他们称为“眼标”。

“眼标”能鉴别眼睛在显示屏上的移动和注视,如果电脑使用者盯住屏幕上的某个链接图标1秒钟以上,电脑就自动打开该链接;如果使用者盯住打印或者存盘的图标,电脑就会自动进行相应的操作。

不过,人们眼球运动时存在的固有抖动以及眼睛眨动所造成的数据中断,就会干扰信号。另外,如果鼠标器光标总是随着用户的视线移动,可能会引起反感,因为用户“随便”看着什么而并非总是“意味着”什么。

理想情况是用户希望发出控制时,系统及时地处理其视线输入,而在相反的情况下则忽略其视线的移动。让电脑去理解用户的这一美好愿望还不大可能。不过,科研人员仍认为人类用眼睛搜索和盯住一个目标的准确性远远超过用手移动鼠标。

手机变大 电脑变小

2007年1月,苹果公司首席执行官史蒂夫・乔布斯在2007年Macworld上宣布推出业界翘首以待的iPhone和Apple TV。除了这两项重大的产品,为了进一步表示进军消费电子市场的决心,苹果电脑公司(Apple Computer)把“电脑”这个词拿掉,更名为苹果公司。

iPhone采用3.5英寸触摸屏控制技术。它支持音乐、视频播放,提供无线网络服务,可以包括收发电子邮件在内的浏览互联网,采用Google Maps为在线地图,使用者仅需网络联机,便可输入地址找到区域地图,而透过触控屏幕,无论是缩小地图范围或寻找邻近店家都相当方便。

iPhone与众不同的地方就是多重触摸技术,除了可以同时移动两个以上的窗口以外,还可以随着手指的动作,变换图象的大小,这种技术是“人――计算机”交互技术和计算机硬件结合的操控界面。它是一种多重同步确认触摸点的触摸屏,能让双手同时比划,支持多个用户在同一个界面里操作计算机,通过直观的姿态直接操纵屏幕。它的显著特点就是,用两个手指就可以直接缩放屏幕,用鼠标和触摸笔等单点设备更直观的绘图。

iPhone将于6月问世的消息一出,Treo、摩托罗拉、Blackberry等智能手机厂商股价纷纷下跌。

2001年iPod诞生之时,“人们开始狂热和失去理智,像中了毒一样争相购买iPod”,包括布什和英国女王也宣称是iPod拥护者。据苹果公司称,去年12月份iPod已经占据了美国便携音乐播放器市场72%的市场份额。如果将iTunes等相关产品的收入也计算在内,该项业务为公司贡献了57%的收入。

苹果公司选择手机作为收入增长的下一驾马车的原因很简单,因为市场竞争越来越残酷。2006年全球45%的手机中有4~5亿台已经集成了MP3播放功能。消费者只有两只手,将通话、听音乐、上网、玩游戏、看电视、数码照相、GPS导航等各种功能融合在一个终端上,是未来最大的趋势。

手机+网络早已不是新鲜事,各大IT巨头除了在通信终端上大做文章,也不忘推出便携式移动个人电脑,即计算机+手机的模式。“UMPC”(超便携移动个人电脑)是一个介于笔记本电脑和智能手机之间的产品,一般是7英寸的显示屏,重量轻于1公斤。近来微软推出了新一代的UMPC产品“Vistagam”,这些产品将支持微软的最新系统Vista。同时微软了新版的Origami软件,可轻易通过触摸功能导览。除了触控功能之外,还加入内建键盘的设计。由此可以看出,UMPC也有着大好前景。

虽然从名字来看,UMPC仍有很重的PC痕迹。但包括三星、索尼、华硕、汉王等产品制造商,微软、威盛等核心平台供应商,都在刻意淡化PC概念,而突出UMPC在消费电子、通讯方面的应用表现。

2008年被认为是UMPC市场的转折点,与即将在北京奥运会全面商用的3G浪潮有着密切的关系。相关分析人士认为,3G将进一步丰富UMPC的应用环境,给市场带来难得的发展机遇。而UMPC相对于手机最大的优势就在于,本身具备更舒适细腻的屏幕、强大的通信及计算性能、优异的影音表现,这些都决定了其更适合成为3G环境下的主流终端。

虚实不分

台湾地震导致海外电缆断裂,几亿人无法登陆MSN、发送海外邮件、浏览国外网页,人们非常不适应没有网络的生活,因为网络与我们的生活已经密不可分。

2006年,second life(第二人生)虚拟社区出现,打破了虚拟世界与现实世界之间的界限,Second Life是一款在美国非常受欢迎的网络虚拟游戏,但它绝不仅是一款游戏。它是目前最成功的基于虚拟社区的社交化网站,在游戏中,玩家可以在游戏中做许多现实生活中的事情,比如吃饭、跳舞、购物、卡拉OK、开车、旅游等。通过各种各样的活动,全世界各地的玩家可以交互。它为人类提供了一个和现实世界并存而又开始融合的虚拟世界。

不仅如此,可口可乐、微软、英特尔、阿迪达斯等国际大牌公司都纷纷入驻Second Life社区,通过Second Life最新产品。丰田甚至在Second Life出售其虚拟汽车,IBM计划推出其3-D局域网,并为其入驻 Second Life的软件工程师支付报酬。广告公司 Leo Burnet也正在建设一个“创意港湾”,在其中全球雇员可以彼此互动交流。Sun甚至为其向新游戏战略转型在Second Life上举行了“虚拟新闻会”。这些企业一致认为Second Life的三维拟真和良好的互动性使其成为一个炙手可热的广告途径。当传统的广告载体开始失去眼球的时候,Second Life用户的月增长率达到35%,而其经济收入也呈现15% 的增长。

路透集团甚至在Second Life上建立了一个新闻机构,来自伦敦的记者Adam Pasick担任这家新闻机构第一任虚拟总编辑,他为Second Life的会员以文本、照片和视频的形式来自外面世界的新闻,而真实世界的读者也可以访问路透社新设立的网站来了解Second Life中的新闻事件。

Second Life从一年多前的16万用户到如今的200多万用户。Second Life在未来几年肯定会成为焦点话题,而它背后虚拟和现实的融合也已经开始。

以用户为中心

“人机交互技术无论发展到什么程度,都必须围绕以用户为中心的宗旨”。人民大学商学院教授、人机交互专家毛基业认为。交互设计并不是用户体验,用户体验是指产品的使用者(用户)对产品的主观感觉,是用户在使用产品的过程中所感受到的、所获得的全部内容的总和。而交互设计人员必须根据用户的实际需求来决定产品的易用性。比如把ATM的取款程序设计为先取卡,才能取钱,这表面上看给用户带来不便,实际却降低了用户因忘记取卡而带来的损失,这是为产品的安全性而做的交互设计。只有当目标用户对设计的产品赞叹不已,这时候才可以说产品获得良好的“用户体验”。

以用户为中心的设计所关注的是如何针对用户体验展开设计,是强调“体验”对设计的影响,把用户做为价值创造的主体,强调以用户为中心,需要用户亲自参与,满足用户的个性化需要。

从经济学的角度来说,“以用户为中心的设计”中最大的挑战,是如何去降低用户与界面交互过程中的成本,并刺激用户对交互的需求,从而给用户带来持续的、良好的体验,提高交互效率。

毛基业说,系统可用性有两个量化指标,一是易学性,如新用户平均培训时间,学习速度,对手册倚赖程度;二是易用性,如时间节省(任务完成的时间对比),用户平均犯错误的个数、造成的后果和所需的纠错时间。

展望

比尔盖茨曾预言,电脑毫无表情的时代即将结束,21世纪将是情感电脑大行其道的时代。虽然今天的电脑还没有喜怒哀乐,但是让电脑也有喜怒哀乐是人机交互的发展趋势。

情感计算就是要让计算机具有感知、理解、模仿人类情感特征的能力,以提高人机交互的效率和质量。具体包括情感信息获取、情感表达、参数化建模、识别和理解、生成和模拟,最终目标是让计算机在逻辑技能的基础上加上理智和平衡,从而建立一种更为和谐的人机环境。

上一篇:“软资产”争议何时休? 下一篇:反驳ASP无用论