人机交互范文

时间:2023-02-24 00:16:57

人机交互

人机交互范文第1篇

庆幸的是,在科技研发人员的努力之下,这种暴殄天物的局面正在发生变化。通过微软亚洲研究院在人机交互领域的创新技术,也许不用等上多久,我们就可以触摸到一个更加真实的三维计算世界。下面就请大家走进微软亚洲研究院,一起感受指尖上的精彩。

Haptics:用触觉感受立体世界

模拟真实触觉的Haptics

通过硬件与软件结合的触觉反馈机制,Haptics技术可以为人体模拟真实触觉体验。试想一下,如果我们将手指放在平板电脑或智能手机的屏幕上,就能感受到画面中的物品逼真的材料质地与纹理,那么这种体验该是多么的身临其境和震撼人心。

从人体感受输入的角度来看,Haptics技术大致可以分为刺激表皮和刺激肌肉中的感受器这两大类别。譬如许多用户已经非常熟悉的手机“振动”提示,就是一种表皮Haptics技术。但振动只是Haptics领域很小的一部分,并且在按键反馈等许多应用场景下的效果都不甚理想。而触觉能够感受到的东西,远比简单的振动要多得多。针对Haptics这一崭新的领域,微软亚洲研究院的研究人员认为如同红、绿、蓝是光的三原色一样,粗糙度、粘滞度、柔软度很可能是触觉的三个基本维度,并分别针对这三个维度展开了深入研究。

现有的人机交互技术大都基于视觉设计,用户可以操作触摸屏但无法获得差异性的触觉反馈。这好比人一出生就戴着一副手套,虽然手没有感觉,但只要眼睛能看到东西,也能完成许多事情。然而,如果用户的手能够在屏幕不同位置感知到差异,那么人机交互就会从此发生质的改变,甚至于完全颠覆我们现有的生活习惯和方式。当Haptics技术让屏幕变成能够让用户摸到、感受到不同反馈的时候,人们才会意识到:原来人机交互的用户体验,远可以比现在做得更好。

然而要想从事Haptics领域的研究,往往需要跨越不同领域的技术,了解多个领域的专业知识。譬如振动反馈就不但要从电子工程和机械学角度知道如何有效利用电能、设计原件结构,而且还要从心理学角度了解人体对哪些频率的振动最为敏感。不过对于兴趣广泛的研究者来说,这也是从事该项工作的乐趣之一。

在玻璃表面感受纹理

在人们的传统印象里,玻璃表面的触感大都可以用“光滑如镜”来形容。然而微软的研究员们却可以在同一块玻璃表面,让人感受到平滑和毛糙等不同的触感甚至是纹理。这样高端大气上档次的神奇“魔术”,又是通过什么样的技术来实现的呢?

这种魔术的奥妙,就在于人的手指在抚摸不同质地的物体时,能够精准感知其表面不同大小的摩擦力。因此如果能够根据需要随时改变物体表面的摩擦力,那么就会让人产生触摸不同纹理的感觉。

微软研究人员为我们展示了在智能手机和Surface平板电脑上分别运用不同原理产生变化的摩擦力。其中在手机上的超声波振动(Ultrasonic Vibration)采用了四块会使整块玻璃上下振动的压电片,其振动频率为23KHz,人既听不见也看不见,但是用手在上面移动时,手指和玻璃之间的空气厚度会产生变化,空气越厚,表面感觉越滑。当屏幕上显示不同物体图案时,用手指划过就能感受到其表面摩擦力的变化,尤其在图案交界边缘的地方更是明显。这样用户通过手指的移动,就可以实时体会到哪个地方比较毛糙、哪个地方比较平滑,由此对屏幕上的图案形成感知。

而Surface采用的则是静电原理,其玻璃与绝缘层之间有一层纳米铟锡金属氧化物涂层(ITO layer)。纳米铟锡(ITO)是一种透明但可以导电的特殊金属线,当电信号通过导电层时,手指皮肤中将产生极性相反的感应电荷。虽然其电场很弱,但是如果手指来回划动再根据手指位置改变信号,那么就能体会到手指与屏幕之间摩擦力的变化。对于用户来说,由于电场力并不受其控制,所以就会产生屏幕摩擦系数正在变化的错觉,就像是在触摸玻璃表面的不同纹理。

键盘上的触觉反馈

如果说触摸屏是通过触觉将信息传递给计算机,那么触觉反馈(Haptic Feedback)技术就是通过计算机把触觉反馈给人。为什么我们需要触觉反馈技术?因为在有触觉反馈的应用环境下,人的手指能够感觉到来自键盘等物件的反馈,甚至要比听到声音对打字更有帮助,更有利于提高用户的打字速度和正确率。

举例来说,在超薄键盘上打字时,尽管用户可以看到输入内容,但是由于手指感受不到反馈,容易导致输入速度和正确率双双降低,所以很多人都觉得这类键盘不好用,不实用。然而如果键盘能够为用户提供触觉反馈的话,那么这类问题就能迎刃而解。

微软亚洲研究院人机交互组采取的做法,是在PZT压电片材料上面放一层金属。在提供一个较大的电压之后,压电片会伸展变大,但是粘在压电片下面的金属也会对其形成约束,这样的合力作用会产生一个很小的弯曲。于是用户打字的时候,指尖就会感觉像是在敲击真实的按键。在对照实验中,拥有精确触觉反馈的键盘无论是输入速度还是正确率,都要明显高出单纯利用视觉反馈的键盘。

CHI 2014:人机交互的盛宴

跨越平台和设备的交互

可穿戴设备相信是大家都非常感兴趣的话题,如今研究可穿戴设备的学者越来越多,包括CHI 2014大会(人机交互领域首屈一指的国际年度盛会)上也出现了很多有趣的相关项目。比如通过穿戴式的设备,手表不仅能够和用户进行交互,而且还可以跨平台和不同设备进行交互。

举例来说,带有传感器的手表和手机可以检测彼此的位置,譬如检测手机目前是在用户的左手还是右手,相对位置又是怎样,从而实现交互功能,增强用户的体验式互动效果。

在移动智能终端设备高度普及的今天,每一位用户几乎都同时拥有智能手机、平板电脑或是笔记本电脑等移动平台,另外还可能有智能手表、智能眼镜等电子设备。那么如何在不同的平台和设备之间进行交互,就成为了人机交互领域研究人员密切关注的话题。因此如何实现跨平台、跨设备的交互,也是本届CHI 2014大会上非常热门的主题之一。

PPT制作演示的好帮手

“科学技术是第一生产力。”怎样通过现代科技提升用户的生产力和创造力,譬如提高艺术家的创造力等,也是当前的热门话题。在CHI 2014上,微软亚洲研究院人机交互组发表了一些与演示工具相关的论文。其中的PitchPerfect项目就是为了帮助用户更好地练习需要展示的PPT。

人们在制作PPT时常常会添加注释,以帮助演讲者更好地阐述内容。PitchPerfect也是运用了同样的原理,PitchPerfect使得用户在制作PPT的同时, 为PPT中的每一个可视化元素添加文字注释,标识每个元素的讲解顺序,并记录预期的讲解时间。这样在练习时,用户可通过细分元素更好地了解、熟悉和管理整个演讲内容,同时让练习过程变得更加简单。PitchPerfect还有录音功能,演讲者在练习时可以反复录制,对演讲进行修改和优化。

对于演讲者来说,熟悉PPT内容和练习演讲的过程往往非常痛苦。PitchPerfect可以优化这一体验。研究结果也表明,借助PitchPerfect系统,用户可以更有效、更丰富地阐述相关内容,整体演讲表现也有所提升。

微软的另一个Turning Point项目,则是练习过程中需要用到的其他工具。通常在刚开始准备PPT时,人们总是希望呈现很多图片和文字,Turning Point可以帮助用户以结构化的方式组织和管理这些材料。用户可以先添加准备好的材料和图片等多媒体内容,然后在头脑风暴环节讨论如何将图片和文字进行分类分组,再根据内容和应用场景选择预先设定的模板。在Turning Point的帮助下,用户可以对整个演讲内容和情节有一个更好的设计。

手机沉迷问题有治了

作为一位成年人,我要痛心疾首地说:现在韩国青少年过度使用手机的问题非常严峻,他们更喜欢用手机玩游戏、发信息,而不是跟朋友进行面对面的交流。什么?你说这种现象到处都是?好吧我承认,这其实是一个世界性的难题。

为了解决这一难题,微软亚洲研究院与韩国高等科技学院(Korea Advanced Institute of Science and Technology)的教授合作开展了针对青少年手机使用情况的科研项目。该项目对韩国学生进行了观察,研究学生使用手机的习惯以及对手机沉迷的程度。研究表明,沉迷手机的学生比普通人更频繁地使用手机,甚至于整天在使用手机。理由是如果不经常看手机会担心错过一些讯息,比如朋友从Facebook或其他应用上发来的通知等。该项目希望通过相关研究,能够帮助这些青少年减少使用手机的时间,并且已经取得了很好的效果。

由此我们可以看到,HCI人机交互领域的研究覆盖面非常广,包括硬件、软件、应用甚至涉及社会学和心理学等。可见HCI并不仅仅局限于IT技术,但不管其研究领域和形式有多大差异,最终目的都是为人类的工作和生活提供帮助,以及解决现有的社会问题。

有吸引力的屏幕

在没有触觉反馈的手机或平板屏幕上操作,用户有时难免会误触选项,而这有可能带来无法挽回的损失。Vacuum Touch项目正是为了解决这一问题而生。值得一提的是,该项目是由微软亚洲研究院的研究员和实习生共同完成的。

在空气泵、阀门组、微控制器、电容传感器等元件的作用下,Vacuum Touch会在屏幕下面产生一定的空气吸力,用户手指在点击屏幕相应位置时会有被吸进去的感觉,这也是一种触觉反馈。在这样的环境中,假设用户想要删除一个非常重要的文件,在弹出删除确认对话框时,选项“no”会对用户手指有更大的吸引力,以防止出现误删。

张虹

微软亚洲研究院高级研究员

人机交互组经理

我们的双手既能感受岩石的锋利坚硬,也能体会丝绸的飘逸轻柔,能分辨沙土的松散干燥,也能区别油水的湿润粘稠。敏感的触觉让我们能清楚知道书是否多翻过了一页,即使在黑暗环境,我们也能只凭触觉系好鞋带,扣好衬衣纽扣,摸到钥匙孔打开门锁;然而在寒冷的冬日,当双手不再自如灵活,你也许体会过纵使有双眼的帮助,仍无法做好这些事。

然而当我们与“玻璃下的图片”进行交互时,其实是以视觉作为反馈的唯一方式,正如同将麻醉剂注入双手,指尖对所有界面的触觉感受都别无二致――在这样的二维加视觉式的交互中,我们浪费了造物主赋予的两平米肌肤、两百个关节与六百块肌肉。而Haptics正是一门研究如何让每个人的触觉都能用于人机交互的前沿学科。

从鲜为人知的术语,到被寄予希望的未来技术,Haptics正逐渐走向我们的日常工作和生活。Amara法则说,我们常常高估科技的短期影响力,而又低估其长期影响力。在互联网世界逐渐三维化,并越来越和现实世界水融的过程里,人和机器的交互界面将不再受限于玻璃平面之下的二维世界法则,会变得跟现实世界一样细腻丰富。要让梦想更快的实现,还有赖于研究者们更多的关注和科研突破。

从某种角度来说,微软的产品应用有着很高的普及率,很多人都会去体验和使用。如果我们重新定义和设计了人机交互的界面以后,那么大家就再也不想回到没有触觉的时代了。这是我的一个理想。

Koji Yatani

微软亚洲研究院副研究员

我是微软亚洲研究院人机交互组的成员,我的研究主要致力于提升人机交互的体验和效率。人机交互强调人与计算机之间交互的关系,关注与人和计算机相关的方方面面。

人机交互范文第2篇

“以前我们说鼠标加水泥等于新经济加传统经济,现在鼠标已经不是新经济,手机的输入方式已经是手势、语音甚至图像。”百度CEO李彦宏说,去年一年语音识别的准确率提升比此前15年提升的总和还要多。智能手机的普及也使得这方面的需求大大激发。

2011年10月4日,iPhone4S对外,让用户感到新奇的是,智能语音助手Siri被成功植入iPhone4S之中。Siri的横空出世,在全球引发了语音热潮,各类语音助手几乎成为智能手机的必备应用。

相比早期的语音控制系统,Siri将iPhone变成了一个智能机器人,用户对着手机说话,不仅可以让手机读短信和拨号,甚至能够查询天气、餐厅位置、航班等以往不可想象的功能。在Siri身上,人们看到了语音成为手机实用交互方式的可能,而不像以前只能通过键盘或手写输入文字来传递信息。

除了手机内自带的语音助手,不少第三方语音助手应用也如雨后春笋般涌现,譬如讯飞语点、百度语音助手、搜狗语音助手、虫洞语音助手、智能360语音助手等。这些语音助手的功能也越来越强,不仅可以通过语音搜索内容、查询信息,还可以聊天解闷、讲故事、唱歌。

最近中关村在线手机事业部针对手机语音功能现状进行了一项调查,结果显示,67.68%的受访者表示使用过语音助手软件,这足以证明手机语音助手类应用的市场热度。

不单单是手机,语音技术也逐步应用于PC、平板电脑、家电、车载、玩具、手表、眼镜等智能终端,以及教育、电信、金融、保险、客服等领域。在2013年英特尔信息技术峰会(IDF)上,英特尔“感知计算”概念的提出,意在建立起一个新的人机交互框架,掀起“重塑PC”的革命,而语音识别就是感知计算的一部分。

实际上,“听话”的浏览器离我们并不遥远。Google Chrome浏览器已经开始尝试支持声控命令,或许要不了多久,我们就能通过声控浏览器完成浏览网页、发送邮件等。比如,你可以通过“暗一点”“亮一点”“字体大一号”等语音命令来控制浏览器。

结合地图系统和智能语音识别的打车软件一经面世便得到消费者的广泛关注。曾在北上广风靡的打车叫车软件“嘀嘀打车”,前不久正式进入武汉运营。据了解,“嘀嘀打车”软件在武汉市场试运行的14天时间里,召车成功率达88%,远远超过武汉官方叫车平台“电召”的48.5%。

4月10日~12日,第一届中国电子信息博览会在深圳举行。由工业和信息化部指导,19家单位联合发起成立的中国语音产业联盟组团参展,将神奇的智能语音体验带到了现场,全面展示了智能语音技术在移动互联网、教育、智能电视、车载终端、玩具等方面的新产品、新应用。

清华大学吴及副教授表示,通过技术上的不断优化和完善,快则一两年,慢则三五年,语音识别技术会成为人机交互的重要组成部分。未来最可能还是混合的交互方式,语音成为主流交互方式之一,因为不同的场景、用户需要和用户习惯,都会造成选择交互方式的多元化。

智能语音爆发

世界银行去年报告称,全球手机数量已经从2000年不到10亿部,增长到现在的60亿部,其中近50亿部都在发展中国家。世界银行估计,到2015年,世界上将有人口75亿,而手机将达到近90亿部。

市场调查机构策略分析公司Strategy Analytics公布的调查结果显示,自智能手机1996年面世以来,截至2012年第三季度,全球智能手机用户数量突破10亿部。也就是说,现在全球七分之一的人拥有某种智能手机。Strategy Analytics预测,全球智能手机用户数量最迟将于2015年突破20亿大关,2013年,仅仅Android用户就将超过10亿人。这是因为智能手机市场还存在着巨大的增长潜力,尤其是在中国、印度和非洲国家市场。

艾媒咨询(iiMedia Research)分析认为,随着智能手机价格平民化以及运营商、渠道商、手机厂商对智能手机市场不遗余力地推广,使得使用智能手机开始成为一种大众潮流,大批非智能手机用户转化为智能手机用户。预计到2013年年底,中国市场智能手机用户规模将突破5亿。

在智能手机市场,以智能语音技术软件应用平均收入为5元/台计算,2013年中国智能语音市场应用规模可达25亿元,2015年全球智能语音市场应用规模可达100亿元。

中国互联网络信息中心CNNIC调查显示,截至 2012 年 12 月底,我国手机网民达到 4.2 亿户,占网民比例由上年的 69.3% 升至 74.5%。目前中国已经成为继美国之后全球第二大移动应用市场,拥有 50 多家应用商店,最大的应用平台中应用数量已经达到 70 多万,下载量超过 90 亿次。

借助开放平台和应用商店模式的助推,移动互联网分布在音乐、电商、游戏、搜索等领域的产业价值趋于明显。2012年,iOS 平台上共有超过73万款应用上线,中国移动MM平台上应用接近15万。

另外,2012年微信用户数突破2亿,对传统的话音、短信业务形成强烈冲击。据估计,到2015年我国移动互联网市场规模将达到4296亿元,活跃用户将超过8亿。

近几年,移动互联网的大规模爆发,作为主要载体的智能手机在键盘输入和手写输入方面非常不方便,这为语音识别技术的应用提供了巨大空间。

一款由云知声研发的微信语音输入插件,只需对着手机说话就可以快速发短信了,每分钟可以输入100字。自今年2月推出后,以精准的识别性能和全新的交互体验,受到广大用户的追捧,一周即登顶App Store首位,使用该应用软件的用户接近100万,开启三十次以上的每天有几万人。

云知声创始人兼CEO梁家恩表示,语言是人类交流中最重要、最自然的方式,所以语音技术的普及将引起人机交互方面最深刻的革命。这是一种更高效的人机交互方式,极大地提高了效率,同时降低了用户信息获取的难度和门槛。最直接的例子是,我想跟朋友说今晚约会地点。传统的手机交互方式是,需要点击手机菜单,选择新建信息,输系人,手指输入文字内容,发送……而通过语音助手,我们只需按下Home键或者线控上的按键,然后直接说“发短信给xx,今晚我们在xxx见面”即可。

在车载环境下,用户的注意力主要集中在于驾驶,人与车的交互必须在不影响驾驶的前提条件下进行,而语音识别技术提供了安全便捷的交互方式,用户只需动口,就可以满足在行车过程中的相关需求。说出“想回家”,汽车会根据你家的位置设定好最佳路线,并开始导航。说出“加油站”,几公里范围内的加油站将逐一由车载语音系统播报出来。

2013年配备语音交互的汽车出货量将达到300万辆,技术授权30~50元/辆,技术授权年度市场容量将超过1亿,预计到2016年配备语音交互的汽车出货量将达到1500万辆,存量接近3000万辆;车载增值服务渗透率逐步提高到30%~35%,年度市场容量将达到10亿。

无论是Google已推广上市的“Google Glass”,还是百度正在研制的“Baidu Eye”,都将语音操控作为人机沟通的重要手段,拍照、打电话、录像,你只需说出你的需求,它就在你眼前展现出想要的结果。智能眼镜、智能手环、智能手表、智能项链,这些物联网时代的智能化设备,最大限度地利用了语音控制技术,它将让未来的生活变得如梦如幻。

很多小朋友想拥有一个会说话的玩具,就像喜剧电影《泰迪熊》里面的TED一样。如今,市场上已经出现了智能语音玩具,按照预定程序执行人的语音指令,如背诗、唱歌、翻跟头、跳舞等。

发端于上世纪50年代的语音技术,经历了多次潮起潮落,这次是真正的变革,还是又一轮泡沫?吴及告诉记者,“这次的兴起与过去不太一样,超过以往任何一次的高度,商业化应用的规模,普通民众的接受和认可程度,都远远超过了以往。”

对于语音产业爆发的原因,吴及有着自己的思考:一是移动互联网的发展,使手机成为重要的客户端,现在手机数量已经远远超过PC和笔记本,导致越来越多的交互行为通过手机来完成。苹果ios、安卓等智能手机操作系统推出后,手机应用和手机交互逐渐增多,但在手机上靠传统的键盘输入很不方便,手写又太慢,而使用语音输入很方便,这样用户的需求就被激发了。

二是随着移动互联网和云计算的发展,语音识别不需要在本机做了,可以在云端做。这样资源条件大为放松,对语音识别引擎不需要非常严格地限制了。此外,用户的语音数据可以存放在云端,就能有大量的真实数据用于模型训练,语音识别性能得到了迅速地提高,识别率可以达到85%~90%以上,这就达到了用户使用的最低门槛。

三是语音识别技术一直在进步,最近十年也不断有新的突破,例如声学模型的鉴别力训练和近年来非常热的深度神经网络。

争抢语音电视

引入语音识别和语音合成技术的智能语音电视不仅能听懂用户说话并作出反应,而且还能说话。用户凭借语音指令可以轻松完成音量调节、换台操作、电视节目查询、网络浏览搜索、文字输入等服务,还可以提供天气、股票、航班、热点新闻等信息,让用户“所说即所得”。

5月7日,乐视超级电视在五棵松万事达中心全球首发,吸引了众多与会者参与。与之前其他的电视类产品不同,乐视超级电视集硬件、软件和内容完美结合,是一款真正意义上的互联网电视,同时具有超高的性价比。

在电视、上网功能完美结合的同时,乐视还集成了目前最先进的智能语音交互技术,用户通过带有麦克风的遥控器,就可以轻松自然地实现操控、输入、搜索等功能。而该项技术由云知声提供。从现场的演示效果来看,语音识别准确度和识别效率方面都具有很高的水准。

在乐视网董事长兼CEO贾跃亭看来,“‘超级电视’是这个星球上有史以来最强大的硬件怪兽。”贾跃亭的底气来自于其合作伙伴,联合全球最顶尖面板供应商夏普、全球最顶尖的智能芯片商美国高通公司、全球最顶尖硬件制造商富士康和播控平台合作方CNTV;而更大的底气则是“超级电视”的高性价比,60英寸X60是超级电视的旗舰型产品,售价仅6999元,要比市场上的价格便宜一半多,同时推出的普及型产品S40售价1999元。

乐视推出的超级电视是否能如其所言“颠覆”传统电视呢?业内都在拭目以待。作为互联网企业敢于杀入目前似乎固若金汤的电视行业,这也说明智能电视已成为互联网企业觊觎的猎物。不只是乐视,阿里巴巴、PPTV、小米等也推出了机顶盒产品,而在此布局更早的谷歌、苹果早已“袭击”了电视。

为了适应智能交互方式的发展潮流,早在去年,国内六大电视厂商长虹、海信、康佳、海尔、TCL、创维等企业纷纷推出可以语音控制的智能电视。为了在智能电视市场先人一步,2012年2月16日,就在大家都还沉寂在新年余味的时候,长虹联合语音技术公司科大讯飞率先30多款Ciri语音智能电视新品,最高售价近7000元。随后,其他彩电企业也迅速跟进,推出具有语音识别功能的智能电视或云电视。

需要注意的是,国内彩电企业在半导体、智能语音等方面都缺乏技术储备,只能拉入第三方语音企业作为外援提供技术支持。业内人士认为,进行语音技术和人员储备是彩电企业的当务之急。

而科大讯飞的盈利模式也有许多尴尬。众彩电厂商和科大讯飞均是“一锤子买卖”,即一次性购买语音软件或芯片,前者推出的所有应用皆为免费,只是智能产品本身的售价有一定幅度提高。

据预测,2013年智能电视出货量将达到1500万台,2016年智能电视出货总量将超过4000万台,智能电视存量将超过1亿,年度市场规模将超过13亿。未来,在每个家庭网络上的电器设备,都可以被人们的语音控制。

语音数据金矿

智能语音技术应用非常广泛,不单单是前面提到的手机、电视、玩具、汽车等领域,也包括即将兴起的智能客服、智能订单、智能营销等智能语音服务。

随着互联网的发展,许多企业客服放到互联网上了,比如QQ、微信、旺旺,现在都是键盘交互,以后可以通过语音交互,减少人工客服成本。这些与语音工具进行实时对话的应用,属于在线应用(B2C)。

另一个非常重要的应用领域是离线应用(B2B)。离线应用是通过与大数据技术的结合,对海量语音数据进行处理、挖掘和分析,开发和利用其中的价值。

语音数据也是大数据,比如呼叫中心,每天的电话数据非常惊人,随着中国人口红利的消失,呼叫中心的智能化日益迫切。据 Ascent Group 2010年IVR研究报告,2016年电信、金融、电力等重点行业呼叫中心市场规模预计达到30万线以上。此外,中国移动的一个省级呼叫中心,一天的数据就有上万小时;还有电视、广播、互联网等媒体上大量的语音数据。

“这些数据如果不能被有效处理,就无法被应用,只能被闲置,实际上可以利用语音识别技术将这些数据转化成文字等符号性表示,然后再被挖掘、检索和利用。”吴及说。

他进一步指出,离线应用比在线应用确定性更强,由于面向海量数据,只能选择语音识别技术,使用人工转写,时间和人力成本太高了。

据了解,清华大学电子工程系多媒体信号与智能信息处理实验室已经在与科大讯飞合作,研究、开发、应用离线技术,语音识别准确率达到了80%以上。今年将在中国移动的一些分公司进行推广。

离线应用有两方面价值,一是监控客服质量,提高企业服务水平。二是语音分析,通过语音识别和数据挖掘技术,可以更全面地了解实际情况,从而帮助决策层和管理层进行科学研判和趋势预测。

此外,公共安全和政府等行业客户对信息资源的深入开发利用也有着迫切的需要,并对基于文本及语音分析处理、数据挖掘等技术的海量信息智能分析与处理软件平台的开发有着明确需求。具体应用是,从大量录音数据中自动快速找出指定关键字的语音,从而得到公安或其他政府部门需要的信息,用于做出及时正确判断和决策。据不完全统计,此项应用在政府部门的市场总量将在6亿元以上,但此项业务的门槛和公关成本很高。

谁主沉浮?

几年前,语音行业不景气,从事语音技术研究的多以学术界为主,这使得国内的语音核心技术一直掌握在清华大学、中科院声学所、中科院自动化所、中国科技大学等几家单位,同时也导致语音行业的人才很稀缺。

从2008年开始,伴随移动互联网的大发展,语音识别产业才真正兴起。谷歌于2008年在美国了英文语音搜索服务Voice Search,应用于Android、诺基亚S60、黑莓、iPhone等多个系列的手机。2009年,Google在全球范围正式了谷歌中文语音搜索。

2009年苹果收购Siri,并于2012年推出中文版Siri,大受用户欢迎,掀起智能语音热潮。

在中国,最早从事语音识别产业化应用的企业是科大讯飞(1999年成立)、捷通华声(2000年成立),这两家企业刚开始都专注于语音合成技术的研发(把文字转化成声音,比如机场、火车站听到的播报)。2008年科大讯飞成为上市公司后,开始研发语音识别技术。2010年了语音云平台,宣告移动互联网语音听写时代到来。

作为语音行业的龙头企业,短短几年时间,科大讯飞的市值从2008年刚上市的34亿,已经增长到超过200亿,让人瞠目结舌。目前,科大讯飞是中国最大的智能语音技术提供商,也是我国惟一以语音技术为产业化方向的“国家863计划成果产业化基地”。

依托于中科院声学所的捷通华声,成立时间基本和科大讯飞相当,在之前相当长一段时间内,也和科大讯飞旗鼓相当,但最终的结果是科大讯飞发展起来并成功上市,而它则相对平淡。

近年来,科大讯飞攻城略地,继牵手中移动、中联通后,5月27日公告称,已与中国电信签订三年期的战略协议,共同推进智能语音产业。科大讯飞官网显示,其智能语音技术占有中文语音技术市场70%以上份额。

有观点认为,尽管牵手三大运营商,但科大讯飞仍前景难料。在与中移动合作后,双方至今未推出“杀手级”业务。双方合作的“灵犀”语音助手将被融合到飞信中,但在微信的冲击下,飞信的前景渺茫。电信分析师付亮称,牵手科大讯飞,不会解决微信对运营商的冲击,因为科大讯飞的模式跟微信相似。

Google语音搜索和苹果Siri的成功,也让国内语音市场迅速升温,国内互联网企业纷纷涉足。例如百度、腾讯、搜狗、阿里,还涌现了许多创业公司:云知声、灵声科技、智能360、虫洞、苏州思必驰、普强信息等。

国内语音产业分为两类,一类是独立的语音公司,以科大讯飞、云知声、灵声科技为代表;一类是互联网巨头公司,以百度、腾讯、搜狗为代表。

“智能语音已经进入到产业化层面,最近5年的产业发展速度超过了过去50年,并且跟以往主要靠技术推动有很大差异。”吴及说。

众所周知,智能语音行业的技术门槛非常高,特别是语音识别技术,被成为“皇冠”。衡量一家语音公司的技术水平如何,首先要看它是否能提供高性能的语音识别产品,其次要看是否了语音云平台。

国内互联网公司里,百度做得最早也最好,2010年就成立了语音部门,并招兵买马引进国内外人才,专注于互联网模式下的语音识别技术,并号称是国内首个把深度神经网络技术(DNN)运用到语音识别产品的公司。李彦宏今年三月接受采访时说,现在语音识别的准确率能做到92%,两三年内可以做到98%。

腾讯和阿里的语音技术虽然还欠火候,但这两个公司有微信、QQ和淘宝旺旺,拥有相当大的用户群,这些用户群对语音技术需求旺盛,市场潜力很大。

独立的语音公司中,科大讯飞目前是“龙头老大”,但也面临几家新锐公司的围追堵截。特别是云知声,冲击力和竞争力极强,刚成立一年,语音技术已经可以和讯飞相媲美,语音识别准确率达到94%以上,仅用九个月就对外了语音云,并且向所有开发者提供完全开放、永久免费的语音识别服务,让业界直呼“黑马”来了,但发展平台与讯飞差距较大,商用上也不及讯飞多年的积累。

吴及表示,从国际上看,智能语音产业表现为一专多大,即一个专业公司Nuance和几个大的IT公司,Google、微软、IBM、苹果等。目前,国内的产业格局也基本相似,一个专业公司科大讯飞,其他几个互联网公司,如百度、腾讯、搜狗等。

占领制高点

随着国内手机和平板销量的爆炸式增长,国外企业开始觊觎这片市场,纷纷进驻国内。海通证券研报指出,尽管目前智能语音产业规模较小,但在未来5年内行业年复合增长率有望超过25%。

背后支撑苹果Siri语音识别技术、占据全球2/3市场份额的国际语音服务巨头Nuance,正在拓展中国语音市场。据媒体报道,日前,Nuance与开心网正在就未来的“战略级产品”进行深入探讨。作为全球语音识别技术的领军企业,Nuance触角由医疗、电信广泛延伸至汽车、手机以及互联网领域。此前,该公司在中国的合作对象为比亚迪和中兴通讯。

另一家语音识别技术公司Audience也看到了中国语音市场的机会,与国内十几家品牌手机厂商展开语音方面的合作,并且和中国移动公司建立相关的语音研究实验室。此外,谷歌、苹果、微软、IBM等巨头也开始积极布局,先后推出了各自的智能语音服务。

为了迎战国外巨头,推动民族智能语音产业发展,2012年8月1日,由科大讯飞、联想、华为、中国移动、中国联通、中国电信、清华大学等19家单位联合发起的中国语音产业联盟正式成立。

工信部副部长杨学山在会议上说,“语音产业再过若干年,一定是千亿元、万亿元的产业链。我们必须加快发展,否则很可能在五年以后,我们再一次被动追随。”

2000年之前,智能语音市场被国外厂商垄断。之后,国内厂商迎头赶上,经过10多年的发展,在技术上已经可以和国外厂商分庭抗礼。但国外厂商在产业链整合、市场推广等方面,均优于国内企业,在竞争中占有一定优势。

科大讯飞董事长刘庆峰表示,“苹果拥有结合紧密的软硬件和成熟的产业链,谷歌拥有开放的安卓系统,微软拥有几乎是垄断的操作系统。这些优势国内厂商都不具备,因此在与这些巨头竞争时,就需要国内企业联合起来,整合产业链上下游资源。”

微软把人机界面从跳动指令转变成图形界面,维持了20年的IT霸主地位。苹果和Google把键盘变成了触摸界面,称雄当今IT世界。如果有声控技术的话,我们还会用触控界面吗?

杨学山指出,再过五年,声控将可能是最主要的人机交互方式。未来产业的发展,从终端到生态环境、商业模式,都将发生重大的变化。从技术、产业和国家竞争力等各个方面来讲,语音产业的发展都是当务之急,只有努力发展,我们在下一代信息技术产业应用发展中才能拥有主导权。语音产业发展基于宽带网络,要和终端、应用和用户相结合。

“只有加快智能语音产业发展,才能避免受制于人。”吴及同样认为,国家要支持企业建立语音生态系统,但要把握好力度和分寸。如果国内企业不能建立起自己有生命力的语音生态系统,国外企业迟早会喧宾夺主抢占地盘。诺基亚的衰落就是典型案例。

吴及进一步指出,如果有越来越多的企业去做语音应用和进行二次开发,用户就会享有更多更好的语音产品和体验,这样平台企业也会做大做强,整个语音生态系统就形成了,国内语音产业抵御风险的能力就提高了。

人机交互范文第3篇

关键词 人机交互界面;创意设计;操作简洁

中图分类号TP39 文献标识码A 文章编号 1674-6708(2013)93-0086-02

1 人机界面智能操作创新设计的理念

人机界面在设计中是指人和机器在信息交换和功能上接触或互相影响的领域或称界面所说人机结合面,信息交换,功能接触或互相影响,指人和机器的硬接触和软触,此结合面不仅包括点线面的直接接触,还包括远距离的信息传递与控制的作用空间。利用人和机器的软硬接触的联系,进行一系列操作,从而达到交流传递信息的目的。

在目前人机界面交互的模式中,越来越多的消费者倾向于选择触控产品,这一自然的互动方式显然最符合人类探索外部世界的最直接需求。在婴幼儿时期,出于本能, 人类就会伸手触摸周围以理解世界。而科幻电影里,未来生活中各种简洁直观、得心应手的触控设备,则代表了对于化繁为简、回归本真的追求。对于我们来说,触控交互的方式本身就是人类最具有创造性的交互方式。触控模式的到来,使得人机交互的方式发生了革命性的变化。消费者不再只是对界面间接下达指令,而是真正实现了对话和交流。这一变革不仅仅是技术的革新,而是对消费者心理更深层次需要的解读和发掘。

放眼市场上畅销的智能手机和PC平板二合一电脑,使用者在浏览图片、或是调整文件大小时,是不是经常需要多次修正才能达到满意的效果? 以往通过对控制键的操作,需要间接地反复多次的调整,才得以实现使用者满意的效果。现在,使用者能够与显示界面直接对话,对具有触控功能界面直接操作,就能快速直观实现预想的效果,不失为人机界面创新设计的优秀理念之一。

以市场上逐渐兴起的智能手机界面设计为例,原来的按键操作发展到现今的多点触屏技术的应用。由于技术的发展,淘汰了电阻式触摸屏幕对于触摸操控精度要求较高、无法识别多点触摸操控等劣势,开发电容式触摸屏幕技术而得以改善及广泛运用。因此不难想象,硬件设计实力是将智能操作人性化创新设计发挥到极致的根本条件。

2 虚拟界面设计在产品创新设计中的诠释

就虚拟界面设计而言,传统设计的设计者是在图纸上用线条、线框勾勒出概念设计,而虚拟界面设计理念意在实现沉浸或非沉浸环境中随时交互、实时、可视化地对原型进行反复改进,并能马上看到修改结果的过程。 与此同时,一个虚拟设计系统具备三个功能:3D用户界面、选择参数、数据传送机制。

那么,怎么样利用虚拟界面的设计优势创新产品就成为工程师们要研究的课题。首先,从优势上来看,它继承了传统CAD设计的优点,除了便于利用以外,还能具备更直观地感受。在虚拟仿真技术上,突出了可视化的特点,这点无疑为做改进和修正操作做出了突破。再次,虚拟界面设计支持协同异地工作,真正意义上利于了资源共享和优势互补。

在产品创新设计中,人机界面智能化操作正在向虚拟界面操作方向迈进。在这样的大环境下,对工程技术的要求也相应提高。虚拟界面设计中涉及到的数据传输技术还未普及到日常产品涉及中。但是,数据传送机制模型修改后所生成的数据要传送到和虚拟环境协同工作的CAD/CAM系统中,有时又要将数据从CAD/CAM系统中返回到虚拟环境中,这种虚拟设计系统中包含一个独立的CAD/CAM系统,为虚拟环境提供建造模型的功能。这种技术支持对系统软硬件又提出要求。最后,在虚拟环境中所修改的模型有时还要返回到CAD/CAM系统中进行精确处理和再输出图形。因此,这种双向数据传送机制在一个虚拟设计系统中是必要的。然而,虚拟界面设计往往应用到大型设备上,日常生活产品的应用则十分罕见。不难发现,人机界面设计的创新还有待新技术,甚至新材料的利用,任重而道远。

3 人机交互界面在产品创意设计中的作用和影响

人机交互界面设计作为产品与使用者交流的语言,必须满足三个要求:1)界面对话设计;2)数据输入界面设计;3)控制界面设计。现今的人机交互界面不再是单纯的显示和控制,而成为客户体验的不可缺少的一部分,人机界面的用户界面能更好地反映出设备和流程的状态,并通过视觉和触摸的效果,带给客户更直观的感受。而产品设计的创意创新不单是对新技术的理解和应用,更确切地说是对未来消费者使用模式的引导及定位,发掘其潜在的心理诉求,营造一种方式去实现其目的的途径。

人机交互是人与机,环境作用关系的一种描述。界面是人与机,环境发生交互关系的具体表达形式。交互是实现信息传达的过程模式,而界面是实现交互的手段。再产品创新设计中,不应以界面形式的设计为主要目的,而是多融入发掘客户潜在的生活生产需求为出发点,丰富交互模式。然而在大的产品设计系统中,交互和界面,也都只是解决人机关系的一种方法,不是最终目的,它的最终目的还是为了解决和满足人们的需求。人机交互无疑推动了产品创新设计的革新,创新设计在一定程度上又对人机交互的本质即使用者的心理诉求提出了更深层次的理解和诠释。在我们高速创新发展的社会中,带给我们的不仅是物质生活的极大丰富,也折射出了人类对社会的最本质的心理需求。

参考文献

[1]董士海,王衡.人机交互.北京大学出版社.

[2]罗仕鉴,朱上上,孙守迁.人机界面设计.机械工业出版社.

人机交互范文第4篇

【关键词】人机交互;武器装备系统;多通道人机交互

1.引言

现代化战争是信息化条件下的高科技战争,计算机技术、通讯技术等高新技术被大量应用于军事领域。能否取得战争的胜利将在很大程度上取决于作战双方能否建立信息优势并进一步获取全面的指挥决策优势。

现代武器装备系统中,信息的采集、处理和利用,以及指挥决策的制定、实施,都是由指挥人员和计算机共同完成。指挥人员通过人机接口,获取战场的各种作战态势、武器系统的各种运行状态和战情评估等重要信息;根据这些信息做出决策、干预,通过人机接口发出各种指挥作战命令。人机交互的效率,直接影响指挥决策的能力和效率,进而影响战争局势。

目前我军武器装备系统中采用的人机交互技术基本停留在图形交互界面阶段,采用的交互设备主要是普通计算机显示屏、操纵杆、跟踪球等,是一种“人适应机”的交互方式,缺少交互的自然性、高效性。这严重影响了指挥决策的效率,制约了指挥人员主观能动性的发挥。因此,研究新型人机交互技术,并将其应用到武器装备系统中,实现实时、快速、简练、智能化的人机交互,提高作战中的指挥决策能力与效率,具有特别重要的意义。

2.人机交互技术概述

人机交互(Human Computer Intera-ction,HCI)是指通过计算机输入、输出设备,以有效的方式实现人与计算机对话的技术。人机交互技术致力于人与计算机的协调,旨在消融这两个智能系统间的通讯和对话界限,使得人与机器的信息交流便捷而通畅。

人机交互的发展经历了三个阶段。第一代人机交互是基于命令行界面的人机交互,人只能通过键盘输入信息,界面输出只能是静态单一字符,复杂的计算机以及难以让人理解的语言使得人与机器在交互的过程中显得极为困难,交互的自然性和效率都很低。第二代人机交互是基于图形用户界面的人机交互,人通过鼠标和键盘输入信息,界面处处为静态/动态二维图形/图像及其他多媒体信息,与第一代人机交互方式相比,交互自然性和效率都有了很大提高。第三代人机交互是基于多通道人机界面的人机交互,用户可以使用自然的交互方式,如语音、手势、眼神、表情等与计算机系统进行协同工作,可以使用一个以上的感觉通道,多个交互通道的整合可以恰当的表达交互意图。交互的自然性和高效性都得到极大的提高。

当前,采用图形交互界面的第二代人机交互仍然是应用的主流,尤其是以超文本标记语言(HTML)及超文本传输协议(HTTP)为基础的网络浏览器和搜索引擎的桌面网络用户界面最为普遍,包含了适应不同带宽、不同尺寸地各种用户界面;而采用第二种方式的语音、手写等易用而方便的界面也正逐步普及,多通道、多媒体的自然、高效、智能化用户界面正得到快速发展和应用。

3.武器装备系统中的人机交互新技术

3.1 单点触控技术

随着多媒体技术的发展,20世纪90年代初出现了一种新的人机交互设备——触摸屏。触摸屏是一种直接在显示屏幕上输入的装置,操作者利用手指或其它介质直接与屏幕接触,向计算机输入信息的一种定位输入设备。早期的触摸屏技术受硬件和技术的局限,主要是电阻式触控屏和红外式触感屏。这个时期的触摸屏,只能在小屏幕的范围内追踪一个手指,只能够识别和支持每次一个手指的触控、点击,若同时有两个以上的点被触碰,就不能做出正确的反应。因此,这个时期的触摸屏技术被称为单点触控技术。

单点触控技术在许多20世纪末国外海军典型的武器装备系统得到了应用。例如英国的ADAWS-2000作战自动化与武器系统采用了46cm平板显示器,支持触摸屏输入,该系统装备在英国“无敌”号航空母舰和42型驱逐舰上。SMCS系统指挥和武器控制系统通过一个触摸敏感的场致发光显示器可选择弹出式菜单,它提供直接交互、窗口、点击选择。该系统分别装备于英国“前卫”(Vanguard)级弹道导弹核潜艇、“快速”(Swiftsure)级核潜艇和“特拉法尔加”(Trafalgar)级潜艇上。美国的AN/BSY-2潜艇作战系统中也采用了触摸屏技术。俄罗斯“需求-M”作战情报指挥系统(БИУС)采用了带有触摸屏的彩色光栅显示器,该设备主要用于信息的输入和显示,为人机交互提供可能。该系统装备在11356 型导弹护卫舰上。

单点触控技术的出现为人们提供了一种新型的人机交互输入方式,与传统的键盘和鼠标输入方式相比,触摸屏输入更直观。武器装备系统上装备触摸屏,指挥人员可以通过触摸屏幕,直观的进行位置选择,菜单选择,按键控制等,有效的提高了人机交互的效率。而且通过装备触摸屏,可以在同一区域内同时实现屏幕显示和按钮输入等功能,有效提高空间利用率,有利于解决舰艇空间狭促等问题。

3.2 多点触控技术

多点触控(Multitouch)是指允许计算机用户同时通过多个手指或触点来控制计算机的一种技术。它是与单点触控技术相对应的,不同的是,多点触控可以通过软件识别同时发生触控行为的点并进行处理,允许用户使用一或多根手指(或其它指点方式,如光笔),通过手势,自然、高效、直观的对计算机发出操作命令。

多点触控技术由硬件和软件两部分组成,如图1所示。硬件是多点触控平台,完成信号的采集;软件部分是在硬件平台采集数据基础上进行触电的检测定位、跟踪、手势定义与识别,最后将识别出的手势映射为面向具体应用的用户指令。其中身份识别技术用于检测用户信息,区分触控来源,该技术贯穿整个软件实现过程。

根据硬件平台的不同,当前的多点触控技术主要分为下几种:电容式多点触控技术、红外式多点触控技术、受抑全反射多点触摸技术(Frustrated Total Internal Reflection,FTIR)、激光平面多点触摸技术(Laser Light Plane,LLP)、散射光照明多点触摸技术(Diffused Illumination,DI)、散射光平面照明多点触控(Diffused Surface Ill-umination,DSI)、发光二极管平面多点触摸技术(LED Light Plane,LED-LP)。而软件方面的技术,主要包括触点检测与定位技术、触点跟踪技术、手势识别技术。其中,动态手势识别技术是当前的研究热点,根据对时间轴的不同处理,可以分归三类:基于隐马尔可夫模型(Hidden Markov Models,HMM)的识别、基于动态时间规整(Dynamic Time Warping,DTW)的识别,基于压缩时间轴的识别。

多点触控在同一界面上的多点或多用户的交互操作模式,摒弃了键盘、鼠标,以及单点触控等单点操作方式。用户可以通过双手进行触摸,也可以以单击、双击、平移、按压、滚动以及旋转等不同手势触摸屏幕,实现随心所欲地操控,从而更好更全面地了解对象的相关特征(文字、录像、图片、卫片、三维模拟等信息)。可根据特定需求定制相应的触控板、触摸软件以及多媒体系统。目前多点触控技术不仅应用于平板电脑、手机,而且已经广泛应用于服务业、公用信息查询系坑、教育训练,工业控制领域。

在军事领域,多点触控技术正在逐步发展,美国发展最突出,已经应用于航天空间站、卫星测控、雷达技术、作战指挥等诸多军事技术高精尖部门。国内也正在研究多点触控技术在军事上的应用,主要包括多点触控技术在指挥控制系统和指挥空间的应用。武汉数字工程研究所将草图技术b和多点触控技术相结合,设计了一个基于草图的战场态势标绘系统。国防科技大学针对指挥空间中的指挥作业需求,正在开展指挥空间双手触摸交互的应用研究。

多点触控技术可以有效的提高人机交互效率,节约空间,将其应用于武器装备系统,可以有效的提高作战效率,减小装备体积。目前多点触控技术在武器装备系统中还未见应用,相关研究也正在起步,未来多点触控技术必将在武器装备系统中发挥重要作用。

3.3 语音交互技术

语音交互系统以其自然的对话方式,成为近几年来国内外研究的热点。语音交互技术主要包括语音识别技术和语音合成技术。语音识别是指将人类的语音中的词汇内容转换为计算机可读的输入,语音合成是利用电子计算机和一些专门装置模拟人,制造语音的技术。用语音技术建立用户界面可采用两种途径:一是利用基于语音识别和理解技术的新操作系统代替以WIMP节目技术为基础的操作系统;另一种就是利用语音技术操作WIMP界面。目前大多数语音界面本质上都是试图把语音识别作为一种精确交互技术。

将语音交互技术应用到武器装备系统,有两个直接的优点:一是语言比键盘输入快且有效;二是在多任务的情境中,提供了另一附加的反应通道,可以解放用户的双手。但目前在这方面还有许多关键性问题有待于突破。语音识别输入技术日前还仅限于大词汇量特定人这一最高程度。虽然其识别率较高、但在恶劣的作战环境下,其实用性还存在着严重挑战。目前技术条件下,可以运用语音识别技术辅助文本的录入和数据的装订,在精确度要求不高的情况下,用于接收指挥命令;同时,可以运用语音合成技术,实时通过语音方式为指挥人员提供指示、错误警告等信息,在指挥员双耳戴耳机的情况下,可以用声音合成方法产生的三维声音信息,在提供语音内容信息的同时,用声音来源方向,指示故障源或目标方向等信息。未来随着语音识别技术和语音合成技术的发展,语音交互技术必将越来越多的应用到武器装备系统中。

3.4 多通道人机交互技术

多通道人机交互界技术引入语音、手势、视线等新的交互通道,使用户利用多个通道以自然、并行的方式进行人机对话,充分利用非精确性输入捕捉用户的交互意图,大大提高了人机交互的自然性和高效性。

多通道人机交互的基础是视线跟踪、语音识别、手势输入、感觉反馈等新的交互技术。在传统的交互模式下,用户主要利用手和眼睛与鼠标、键盘、显示器等设备进行精确方式下的二维交互;而多通道人机交互则寻求新的交互手段,以充分利用人的眼、耳、嘴、手,视觉、听觉以及触觉通道,它允许用户利用多个通道以并行、非精确方式与计算机系统进行交互,其交互通道之间由串行/并行,互补/独立等多种关系,因此这种人机交互的方式更加类似于人与人之间的日常交流,其交互自然醒和效率得到了极大的提高。典型的多通道人机交互界面的概念模型如图2所示。

多通道人机交互技术具有以下优势:多通道交互可以利用各种设备、通道和交互方式的互补性;多通道界面对语音/听觉的强调,有利于弥补现有界面在这方面的不足;多通道交互可以提高交互的灵活性,提高输入/输出带宽。

目前欧洲和美国都在对多通道交互开展研究,美国集中于交互手段及其整合,欧洲重视需求多个通道间信息的共同表示。国内主要探索以视线跟踪为核心的多通道人机交互的理论和技术。国防科技大学正在开展指挥控制中的多人多通道人机交互研究,提出了应用于C2 的多人多通道人机交互模型,实现了多人多通道的交互原型系统,使用基于多点触摸的双手手势和语音两个通道实现态势和情报分析任务。

未来随着多通道人机交互技术的成熟,可以逐步将其应用到武器装备系统中。例如可以用于语音命令响应,指挥人员发出语音命令,并结合触摸屏对语音识别结果进行修改和确认;可以用于战场态势的综合显示,三维声音提示目标方位,图形显示信息,震动和声音结合用于紧急提示,头盔装配双显示器,双目分别观察左右显示屏,以得到三维广角的全景,结合指挥人员头部的移动和姿势以及眼球视线变化,得到一个模拟的或远程控制的360°视阈,这可以为潜艇指挥人员提供极大方便。

4.结论

现代武器装备系统正在向智能化方向发展,人机交互的效率将直接影响武器装备系统的作战性能。目前我军武器装备系统中的人机交互技术相对落后,必须不断发展和应用新型人机交互技术。本文总结了人机交互技术的发展情况,对单点触控技术、多点触控技术、语音交互技术和多通道人机交互技术等人机交互的新技术进行了研究,分析了各项技术的基本原理、技术特点、发展现状及其在武器装备系统中的应用前景。分析表明,新型人机交互技术的应用,能够显著提高武器装备系统的人机交互效率,进而提高其作战能力和效率。未来的武器装备系统中,新型人机交互技术必将发挥至关重要的作用。

参考文献

[1]凌云翔,张国华,李锐,等.基于多点触摸的自然手势识别方法研究[J].国防科技大学学报,2010,32(1):127-132.

[2]老松杨,黄广连,张国华,等.双手触摸交互触控平台[J].中国科技成果,2009,10(11):58-60.

[3]陈大炜.基于光学感应的大尺寸多点触摸控制技术[J].电子产品世界,2009,5(1):22-26.

[4]黄菁.基于单目视觉的触摸屏技术研究[D].杭州:浙江工商大学,2009:1-63.

[5]董士海.人机交互的进展及面临的挑战[J].计算机辅助设计与图形学学报,2004:1-8.

[6]吴振峰,赵克俭.未来指挥所发展展望[J].火力与指挥控制,2005.3(4):4-7.

[7]赵秋均,刚,黄岸仲,等.基于FTIR 的多触摸实时互动桌面系统[J].计算机工程,2011(14):291-292.

人机交互范文第5篇

【关键词】人机交互接口 输入输出设计 一致性 反馈信息

宽泛意义上说,人机交互的界面大体可分为软件界面和硬件界面俩部分。硬件界面由于存在一定的工程技术性,在这里不做讨论。就人机交互软件界面设计来说,其是目前计算机软件不可或缺的一部分。二十年来,帮助多个中小型企业成功的开发过多种计算机系统,并在企业资源计划系统的开发研究中,对外国大型的ERP软件工程的人机交互软件界面设计都均有涉及。可以这么说,一款软件是否能很好的交互用户的操作心情和感知很大程度上取决于人机交互软件界面设计的好坏。设计的思路和方向直接影响到软件的使用,会在用户的心中扎根下难以忘却的定位。再精确点分析,设计的好坏甚至会影响到硬件等其他部分的表现,关系到整个软件整合系统的结构层次问题,这是十分重要的。文章就人机交互软件界面的中的人机交互的接口设计和人机交互的输入输出设计做一些简单的探讨。

1 人机交互接口

软件与用户的交互接口是人机交互的起点,因此设计思路必须从用户和软件的接口着手分析。软件接口模式多样,且模式的选择往往代表了设计师对于这款软件想要展现在大众面前的定位。当今用户种类繁多,个性化差异也较为突出,不同的用户对于人机交互的接口的形式会有自己不同的看法和需求。如此常会造成使用习惯的差异。在此将用户做一个细分,一类是大众用户,一类是专业用户。大众用户顾名思义,指对计算机软件应用技巧较为生疏,没有较强的实践运用能力的人。相比而言,专业用户特指对计算机的使用有过多年的研究和使用实践的用户,他们往往对软件的感觉和实用性更有指向性。用户定位对于软件设计至关重要,设计师必须能区分软件的受众究竟是大众用户还是专业用户。受众方向直接影响到软件的舆论评价与成败。举例说明:针对大型公司的高管人员,其系统就必须被设计开发成简洁易操作的一键式接口以满足高管的个性化需求。因为高管与基层技术人员的区别在于,其往往缺少对于计算机软件应用的实践经验,故以问题为导向的决策系统的交互接口是行不通的。这里的高管对于计算机方面来说就是刚才提到的大众用户。因此高管的软件开发必须要以决策者的使用特性来进行接口设计。

人机交互软件接口的形式可分为以下几种:下拉型菜单、级联型菜单、弹出框式菜单、工具栏菜单、图标式菜单、链接菜单。针对某些特定的软件系统服务例如高层的支持接口还应在上述形式的基础上进行适当的简略裁剪。用图表栏来表示图标的功能按钮是较为可行的方法,也是一种较为直观的界面接口模式。为了帮助用户更好地对图标所对应的功能直观化的认知了解,设计师要尽量迎合大众口味进行表现形式的选择。例如:运用类似于Office软件系列中的图标进行图标内容意义的表示。

人机交互接口设计只能作为用户与机器进行交互的入口,要完成完整的交互流程,下一步就是要对交互的输入和输出的方式进行有效的选择和整合。

2 人机交互的输入输出设计

若将接口的设计比喻成人体的通道接口,那么人机交互软件界面的输入输出设计则是优秀设计的血管。本文就近年来项目组所研究开发的ERP软件的实践操作体会浅谈关于输入输出的设计原则与方向。从人机工程学的角度出发,用户使用软件存在的较多难以解决的地方,所以在对进行交互评估的过程中容易出现一线常见的错误。例如对用词的专业性是否能把握度,使表达既相对专业又易于用户识别。不同用户在进行操作时也会碰到各式各样的问题,这就需要对问题的解决有一套十分严谨的分析系统。

2.1 一致性原则

人机交互的一致性主要体现为输入和输出展现在用户面前的信息是否对称。具体细分是指系统内部格局是否具有相近的页面布局,类似的人机交互行为准则和类似的信息表达形式等。一致性也同样指代针对特定平台各个应用软件实体之间的一致性。例如在win系统下运行PS、PR、DW等相关应用时,很容易看得出其界面设计具有高度的一致性,用户在进行多个软件的操作时,往往只需要了解第一个软件的界面使用方法,就能对其他软件的界面操作有一个清醒的认识。一致性能很好的帮助用户快速的根据已有的软件基础掌握其他软件的界面技巧。Linux系统下的许多软件很多也保持了高度的一致性。

现今软件的设计常会忽视一致性这一重点问题,究其原因是设计者并未在各软件中寻找用户应有的平衡。其实只要能够在大局观的控制上思路稳妥清晰,朝着设计方向坚持不懈的走下去,此类错误就能够很好的避免。对于项目统筹规划的组织者来说,对项目一致性的把握必须渗入每一个设计的环节。在进行人机交互软件界面的设计过程中,相关研究项目组要对每一个概念模式,命令类别情况和显示格式等方面有一个清晰的整体观,在相似的交互情形下要求有一致的显示风格和操作元素,例如在菜单栏图标栏内嵌入相同的易于理解的属于,并贯穿一致的内容风格。

2.2 窗口风格

软件交互界面的窗口设计也是交互研究中必须要考虑的内容之一,设计师要着重实现屏幕窗口内各个区域的布局设置,根据的信息的重要层次和清晰程度进行科学的统筹规划。始终要保持界面简洁明了大气。国内众多大型企业已对此进行了较为明显的优化,其根据眼视光学的特性在眼睛不容易发生疲劳或较易集中精力对的界面区域安排摆放较为重点的交互信息。帮助信息和较次要的提示信息被放在屏幕下方。让窗口的整体感觉形成一个合理的布局观。对于个别空白区域还可适当插入类似元素进行主题的强调。当前开发者的设计大潮主要是使用一些常用的控件进行界面优化。例如在进行界面输入时,利用单行文本框,命令框等合理安排空白区域,使页面看起来整合度更高。控件之间要保持间距适当行距一致,这样才能使窗口不会因为细小控件的分布而显得杂乱无章影响信息提取。总而言之,好的界面设计能让软件看起来美观大气上档次,内容的主次分明也能帮助用户进行信息的提取。

2.3 界面效果

界面表示效果是人机交互界面效果的最好体现。单一的文字搭配形式单调的色调很容易会造成视觉审美的疲劳。而加入多彩,多媒体的界面能够很好的增加对于用户的感染力,减少用户的疲劳度增加用户的探索欲望。相比文字,图形拥有更加直观明显的特点。因此,适当插入一些多媒体来替代用文字表示较难实现的操作,能够让用户的操作更加有目的性,增加用户对软件的理解。然而,用户对于各种图像的偏好和习惯性是不同的,若稍有搭配不当,舆论的压力很容易会使贴心的设计带来相反的成效。所以,多媒体技术的应用还是要坚持适量为主,相关设计要科学合理的安排多媒体手段,进行动态与静态的融合,符合大众的口味。对大众而言,色彩的设置应较为柔和,以迎合大众的审美需求。当然,必要时候也可以通过色彩的鲜明对比来进行用户注意力的转移和延伸。以上操作还是要保持风格的统一,这是设计过程中不能忘记的。

总之,多媒体的合理搭配能大大提升可看性,减少用户读取信息时的疲劳程度,从而达到界面设置的需求。但这一准则也不是全部都适用,作为媒体还是应该注重文字效果的利用呈现。只有文字表述能够简明清晰的讲信息传达在用户面前。举一个文字表达引发的不同效果的几条要点。

(1)专业词汇超出用户的理解范围。例如进行界面文字设置时常出现诸如:数据库无法识别,文件出错错误代玛×××”等等。(2)缩写的错误使用。例如在浏览新闻网页的时候突然出现“bps超出限值,链接失败”。(3)某些BBS上在用户还未进行注册就点击登录按钮时出现的不是未注册而是密码错误提示。这显然降低的界面设计的交互性。正确的改进方式要提示未注册用户进行注册,并给出相关注册链接。此举可提高界面设置的友好性。(4)排版混乱,文笔繁杂。例如在某bbs网站上进行用户注册时,在用户名填写的登录框后有一段常常的括号,内写:3-20个字符,不包括3,20。英文小写、特殊符号,下划线,不支持纯数字,不能用生僻字。(5)软件系统对不同的位置要进行文字相同意义的同意。大部分软件应用商仍未做到此要求。例如某即时通讯软件,先呈现在面前的是“添加好友选项”,之后显示出“好友列表”,再显示出“不在线的用户”。(6)慎用自认为幽默或者超出大众思维能力的用词,否则会给客户留下十分差的印象。(7)善于借助文笔来进行对用户的吸引。恰如其分的文字描述能像其他媒体技术一样达到吸引用户注意力的效果。例如在注册界面时,将原本“注册”改为更具有人情绪化感觉的“立即注册”,意在以文字的形式让用户尽快加快注册的步伐。又如百度页面目前存在的“试试看”选项以前是“推荐使用”,通过这些细小词汇的改善和提升能大大改善用户的感知欲和尝试欲。又例如,对于注册步骤繁杂的电商机构网站时,在注册即将结束时会出现一行提示:别心急,在一步你就注册成功了,加油啊!用户看到这一行提示后会从当初的浮躁很快的静下心来,从而更加坚定注册完成的决心。除了文字内容外,文字的字体,字号,文字颜色都会成为影响用户体验的重要因素。例如对于某些重要的信息应用较为正式的字体,较大的字号进行一个居中或明显位置的呈现,帮助用户很好的了解重点。而对于不太重要的信息,进行字体颜色的浅化和字号的缩小化,让用户有选择的进行阅读。

总而言之,为了解决以上诸多的界面交互问题,设计师必须要很好的洞察用户在每个操作环节的心理状态和操作习惯,从而对任务的执行力有一个很好的把控。让用户真正走进界面设计,善于聆听用户的声音,进行更进一步的交互改进。

2.4 反馈信息

人机交互的反馈信息主要指代的是用户在进行互动操作的过程中从软件系统所获得的信息。反馈信息从某个方向反映出人机交互所作出的相互反馈,让用户能够更好的判断此前的操作的实际效果。若系统处理跨度较长,应给予用户贴心提示告知还需要耐心等待。防止用户出现厌烦心理。数据录入以后,要讲用户输入的正确与否与用户做一个反馈。在每一步操作的末尾,系统都要进行对这一步操作的成功与否做出反馈。若信息出现录入错误,而用户仍未更正过来,则系统不能继续推进。有了理论知识,就要将其运用到输入和输出中去,上文提到的输出都是实现系统目标的具体体现,其旨在提高用户设计的质量,满足用户的交互要求。反馈信息与窗口界面一样力求简洁明了,易于阅读理解。为此设计时要先明确软件系统的输出内容对内容有一个宏观上的概念把握,并对物理的输出要求有一个明确的认知,确定,设计、验证和测试输出效果,观察和聆听用户的意见,并叠代地对输出的反馈界面进行反复修改。

结语

人机交互软件的设计横跨众多领域,如此多的领域在一定方向上具有理论的一致性,因此可以相互借鉴融合。文章提到了很多的技术手段都具有很强的实用价值,且已在软件界面交互领域得到了很大的技术基础作为支撑。要设计出一个良好的交互界面,设计师还是应该从用户出发,充分洞察需要什么,习惯什么,根据用户的习惯进行界面设置、窗口设置、语言文字和排版设置,让界面变得更加智能,让给人机交互变得更加科学。

参考文献

[1]王红凯,张森林.基于Linux嵌入式全自动横机软件系统设计[J].纺织学报,2008,29(2):101-105.

[2]中国纺织机械器材工业协会.201 0中国国际纺织机械展览会暨ITMA亚洲展览会展品评估报告[R].北京:中国纺织机械器材工业协会,2010:142-144.

人机交互范文第6篇

【关键词】 人机交互技术;教学改革;实践

【Abstract】The discussion of the teaching reform of human-computer interaction is proposed in this paper. The paper started from the problems existing in the current teaching, focus on the teaching objectives, curriculum content and teaching methods, on how to improve the teaching quality and stimulate students’ enthusiasm to cultivate students’ practice ability were discussed, and new ideas are provided for the teaching reform of the information course.

【Key Words】human-computer interaction; teaching reform; practice

【中图分类号】G642.0 【文献标识码】A 【文章编号】2095-3089(2015)15-00-02

人类社会已经进入信息时代,以计算机为代表的各种电子产品与人类的工作、学习和生活息息相关。随着计算机技术的发展,新的产品层出不穷,用户对计算机的要求已不仅仅局限于“更快、更强、更安全”,使用者希望寻求更为“好用、易用、适用”的计算机,优化用户使用计算机时的整个交互过程。[1]而人机交互技术作为一门研究系统与用户之间的交互关系的独立学科,也迎来一个全新的发展阶段。[2]从工业电子设计、移动终端产品到网络多媒体等各种应用,都可以看到它的身影。了解和掌握人机交互技术,对电子信息类学生而言,显得越来越重要和迫切。“人机交互技术”正是顺应这一发展方向而为信息技术方向学生开设的专业选修课,主要教授学生人机交互的基本原理,交互模型的表达和实现。

然而,计算机技术相关的各个领域,无论是数字信号处理,人工智能,或是用户界面的设计理念,其发展速度都超出了原先的预料。[3]因此,人机交互技术的研究也需要跟上业界的先进技术发展方向,研究与应用相结合,提高该技术的实际应用价值。但是就目前的课程内容和教学体系来看,本课程虽然介绍了一些人机交互技术的背景知识、表示模型、以及界面设计的原则,使学生基本掌握人机交互技术研究内容、指导思想和一些简单的界面设计方面的知识,但当前的教材和教学体系还处于2010年的认知水平,已经跟不上日新月异的计算机技术发展水平,而且与其他引入最新技术的课程如Flash游戏开发,游戏人工智能,动态网站设计与开发等方面联系不是很紧密,并且也不符合目前IT企业对界面设计工程师等岗位的技术需求。因此,如何利用“人机交互技术”课程平台,使学生能对基于用户需求的设计思想、交互界面设计、先进的多媒体技术综合运用等方面有一个更为深入的认识,培养界面开发的实践能力,提高信息技术类毕业生的就业竞争力,是目前亟需解决的重要问题。

1 人机交互技术教学现状与存在的问题

1.1教学目标模糊

人机交互技术是关于设计、评价和实现供人们使用的交互式计算机系统,并围绕相关的主要现象进行研究的科学。它主要研究人与计算机之间的信息交互理论与方法,涉及计算机科学、心理学、认知科学和社会学以及人类学等诸多学科,是信息技术的一个重要组成部分,是一门交叉学科。[4]它与其他的计算机类课程都有一定联系,但是它本身并不研究某一门具体的技术或程序设计语言,因此在课程定位和教学目标制定时,往往会陷入多而不精,杂而不专的境地。教师在教学时,由于课程内容涉及面广,既要教人机交互的理论知识,用户心理模型,又要教实际应用设计,遇到学生基础不扎实,还要复习程序设计基础。在这种教学模式下,学生往往感觉学得很累,花了很多时间,但不知学到了什么。课程内容宽泛,目标不明确,学习效果较差,这是该课程目前面临的首要问题。

1.2课程内容落后

人机交互技术随着计算机技术的进步而发展,由于新技术的不断涌现,人机交互技术的内容也在不断更新。但是,目前大多数讲授人机交互技术的教材,其内容还停留在2010年前后的发展水平。以移动界面设计为例,许多教材都以诺基亚的Symbian操作系统为平台,讲解移动端界面设计的实例,包括键盘布局设计,按钮和屏幕分布等。但就目前消费类电子市场的实际情况来看,诺基亚手机已经退出了主流市场,Symbian操作系统也早已无人问津。目前手机市场以Android和iOS操作系统为主流,都已用触摸屏代替传统的实体按键。[5]同样的情况还存在Windows程序和Web界面设计工具,大部分教材还在使用MFC和Html,而目前业界主流的工具已经换成Winform和Html5。IT技术发展日新月异,新技术和新产品的更新换代速度非常快,固定的教材很难跟上新技术发展的脚步。陈旧的内容,导致知识刚学到就落伍,学而无用,会削弱学生的学习积极性,严重影响学习效果。

1.3重理论,轻实践

目前许多高等院校在开设人机交互技术课程时,大都以理论教学为主,实践环节所占比例非常小。教材中讲授人机交互原理,交互模型,设计原则等理论知识的部分,一般占到总内容的70%以上。而实际与应用相关的部分,如Web和移动界面设计,所占的比例相对较小。而且,这部分内容缺少合适的实践项目支撑,书本上的例程大都停留在入门阶段,很难引起学生兴趣,无法进行后续的深入研究。同时,学生最后的成绩评定一般以书面考试的形式进行。信息学科属于工科行列,最注重培养学生的实际动手能力。而且从目前IT公司招聘要求来看,比较重视应聘者的工作经验。对于高校毕业生来说,在学习期间自主动手创作的作品,参加比赛的经历,比学习成绩更具竞争力。目前的教学方式显然无法满足学生这方面的需求,如何将学到的知识转化为实际解决问题的能力,达到学以致用的效果,是该课程目前面临的重要挑战。

2 人机交互技术教学改革措施

2.1明确教学目标

教学目标为该门课程教学结束后学生掌握的知识和技能。制定合理的教学目标,需要了解业界目前的需求和学生前期掌握的技能。学习的最终目标是为了将来在工作中创造价值,所以首先要了解业界目前对该技术的需求。根据目前业界常规的产品开发流程,人机交互技术主要应用于用户界面(UserInterface,UI)设计这一环节。IT业界大多数公司都有独立的UI设计部门,对这方面的人才需求量相当大,对于信息学科的毕业生来说,有很好的就业前景。因此,可以将人机交互技术课程的教学目标定为:培养学生的UI设计能力。UI设计是指对软件的人机交互、操作逻辑、界面美观的整体设计,在实际操作中,主要分为交互设计和图形设计。交互设计关注交互界面的使用便捷性,侧重于“好用”。而图形设计关注界面的美观,侧重于“好看”。这两者都是UI设计中不可或缺的元素。[6]据此可以将教学目标细化为相应的两个方面:界面设计和交互逻辑设计。界面设计不是单纯的美术绘画,它需要定位使用者、使用环境、使用方式并且为最终用户而设计,是纯粹的科学性的艺术设计。在教学过程中,要注意引导学生认识艺术元素在界面设计中的重要性,培养学生的审美观。交互逻辑设计通过分析用户的心理模型,设计任务流程,把业务逻辑以用户能理解的方式表达给用户的过程。在设计交互逻辑时,要改变学生在其他课程设计时以我为主的观点,从用户的角度出发,去体会用户在使用场景中的需求和痛点。然后,以解决用户痛点为目标,理性地分析如何利用手中的资源、借鉴类似场景的经验,去解决用户的需求。

2.2丰富课程内容

传统的教学方式一般以课本为主,实践性的例程也局限于书本之内,因此内容比较匮乏,吸引力不够。为了改善教学效果,应该引入能够引起学生兴趣的内容,以实践内容为主,提高学生的动手能力。比如,设计一个加法器。以学生已有的编程能力,可以用C语言实现,但是其操作界面是Windows的命令行,如图1所示。虽然实现了计算功能,但是作品的操作界面简陋,对用户毫无吸引力可言,同时也无法激发学生的学习兴趣。但是换一种开发模式,用面向对象编程语言,如VB,也可以实现相同的功能,同时开发一个简单的用户操作界面,如图2所示。学生对图形化界面的兴趣明显高于抽象的算法设计,将界面设计与算法设计结合,将程序运行结果显式的展示出来,有助于提高学生的积极性。

在具体的例程选择时,要遵循从简单到复杂的原则。首先,可以选取一些学生在低年级学习编程时实践过的程序,在原有基础上为它们添加操作界面,如前面的加法器。以此来激发学生对UI设计的兴趣,引领学生入门。然后,向学生介绍一些较为经典的例程,讲授UI设计的基本原则和方法。同时,向学生提供一些半成品作品,让学生在原有基础上进行改进,逐步提高学生的设计能力。最后,让学生各自选择一个感兴趣的课题,独自完成一个完整的作品。整个课程讲授过程中,例程选择要涵盖不同的难度,结合最新热点技术,抓住学生的兴趣点。

2.3改进教学方法

培养信息类学生的最终目标是提高他们实际动手解决问题的能力,而实践是提高动手能力的唯一途径。因此,在施教过程中,应该加大学生动手实践的时间比例。在对往届学习的人机交互技术课程的学生调查中发现,学生对理论知识的掌握,并不与投入时间成正比。学生反映理论知识比较枯燥,难以理解,容易忘记。针对这一问题,本次教改的实践中,将上课地点安排在机房,增加了学生自主实践的课内时间。实践与例程讲解结合,在入门阶段,一般时间分配上偏重于教师授课,留小部分时间给学生进行一些较为简单的实践。随着课程的深入,讲课时间逐步减少,增加学生自由发挥的时间,在期末前,可以安排连续几节课的实践,让学生完成一个完整的作品,作为期末考核。而对学生作品的评价,从人机交互技术课程的特殊性出发,转变以往教师单独评分的做法,组织学生互相评分,以强化“用户的体验是评价UI设计的唯一标准”这一理念。

3 人机交互技术教学改革预期成果

人机交互技术教改预期达到以下目标:

(1)教授学生人机交互技术的基本知识,培养学生初步掌握UI设计能力,为进入相关行业做技术储备。

(2)培养学生的兴趣,激发学生动手的意愿,提高学生实际动手能力。在有限的时间内,最大化的提高教学效果。

(3)以本课程为切入点,建立以实践为主的教学体系。加大投入,配置必须的软硬件设备,为信息学科的师生搭建一个教学、科研平台,以利于后续其他课程的教学实践。

(4)转变传统的教学观念,结合信息学科的实际情况,加强教师的实践能力,提高师资队伍的综合素质和业务水平。

4 结语

目前IT业的竞争日趋激烈,同时对人才的需求也不断扩大。如何培养合格的毕业生,并且让毕业生找到理想的工作岗位,是高等院校的信息学科的首要任务。因此在相关的课程实施上,必须与业界的需求结合,同时根据课程的特点,制定相应的教学目标、内容和方法,优化教学效果。人机交互技术教学改革正是在这样的背景下,一次非常有意义的实践。总结在此过程中得到的经验和遇到的问题,为提高信息学科的教学质量贡献力量。

参考文献

[1]宋鸣侨.浅析人机交互技术的发展趋势[J].现代装饰・理论,2012(2).

[2]袁保宗.新一代(第四代)人机交互的概念框架

特征及关键技术[J].电子学报,2003(31).

[3]董士海.人机交互的进展及面临的挑战[J].计算机辅助设计与图形学学报,2004(16).

[4]杨明朗.人机交互界面设计中的感性分析[J].包装工程,2007(21).

[5]丁峰.移动设备中的人机交互设计研究[J].包装工程,2014(35).

人机交互范文第7篇

关键词:DSP 人机交互 HMM MFCC Baum-Welch

中图分类号:TN912.34 文献标识码:A 文章编号:1007-9416(2013)04-0197-02

1 引言

随着计算机技术的快速发展,人机之间的交互方式越来越多元化,从传统的键盘、鼠标,到触摸时代。但是,这些人机交互方式对于一些身体有障碍的人士,或者在人机之间具有障碍的场合都显得力不从心,而基于语音识别的交互方式以其操作方便且人性化的优势,得到了广泛的应用。本文设计了一种基于DSP的人机交互系统,该系统电路少,成本较低,语音识别正确率较高。

2 系统硬件设计

5509 DSP与AIC23之间有两种接口:控制接口和数字音频接口。前者用于设置CODEC芯片的工作参数;后者用于传输音频数据。

AIC23的控制接口有两种工作方式:SPI和IIC,由引脚MODE来决定。当MODE为低电平时,CODEC选择IIC工作方式,相反选择SPI工作方式。由于5509 DSP内部集成了IIC总线,因此,使用IIC方式来控制CODEC比较方便。5509 DSP作为IIC总线的主设备,AIC23作为从设备。5509 DSP通过设置其内部的控制寄存器对AIC23进行各种控制操作,例如设置采样率、左右输入声道的音量等。

AIC23的数字音频接口用于传输A/D和D/A数据,可配置成DSP模式,可以方便地与DSP的串口MCBSP相连接进行通信。

5509 DSP与AIC23的I/O电压兼容,使得它们可以无缝连接,其接口原理如图2所示。

3 语音识别算法

系统实现人机交互的主要条件就是语音识别。通常,语音识别主要由预处理、特征提取、语音模板库及模式识别几部分组成,其原理如图3所示。

3.1 预处理

预处理阶段主要包括预加重、加窗与分帧等操作。

(1)预加重。

(2)分帧与加窗。

3.2 端点检测

一般在预处理后都需要进行端点检测。端点检测是指从一段语音信号中检测出说话的起始点和终止点,剔除非语音段数据,以降低特征提取的计算量,提高准确度。

3.3 特征提取

特征提取是是语音识别的关键步骤,它是为了去除语音信号中所包含的冗余信息而提取的用以表示语音信号的一系列参数。特征参数的选择对语音识别的效果至关重要。常用的特征参数有线性预测参数(LPC)、线性预测倒谱系数(LPCC)和美尔倒谱系数(MFCC)。由于MFCC参数具有较好的抗干扰能力,本系统中的特征均为MFCC,其提取过程如图4所示。

3.4 HMM的训练与识别

训练即通过说话者多次重复语音,将所获取的语音特征参数按照一定规则对其加以聚类,形成待识别语音的模板库。识别过程与训练过程类似,先对待识别的语音信号提取特征参数,然后根据一定的准则计算其与训练所形成的模板库之间的相似度来判断输入语音的语意信息。

本系统基于HMM实现语音识别,HMM是一种能很好地描述语音信号的时变性和平稳性的统计模型,被广泛地应用于语音信号处理的各个领域。一个HMM模型由若干个状态组成,随着时间的变化,各个状态之间可以发生转移。每个观测值对不同的状态都有相应的输出概率。HMM结构如图5所示。

图中,表示状态序列;是初始状态概率的集合;A为状态转移概率的集合(矩阵);B表示输出观测值概率集合;表示观测序列,则HMM参数可以表示为:,参数估计的流程图如图6所示。

4 结语

本文研究了基于HMM的语音识别技术,选用MFCC作为语音特征参数,采用Baum-Welch算法训练得到语音模型参数。据此设计了一种基于DSP的人机交互系统,利用语音实现了人机交互功能,克服了鼠标、键盘等受限的缺点。该系统成本低、语音识别率较高,具有一定的实用价值。

参考文献

[1]王璟珣,滕召胜,高云鹏,王一,李聪聪.嵌入式盲人手机语音识别与控制系统设计[J].计算机测量与控制,2009,17(10).

[2]吕钊.噪声环境下的语音识别算法研究[D].安徽:安徽大学计算机应用技术,2011.

人机交互范文第8篇

刚刚过去的2006年是全球的融合转折年。3C(计算机、通信和消费电子)融合、3网(广电网、通信网和公共互联网)融合、ICT(IT、通信业)融合、TMT(通信、媒体和新技术)融合,内容产业和互联网及通信业的融合……融合成为了一股潮流。

3C(计算机、通信、消费电子)融合也不是一个新词汇,不过,当我们把3C融合与人机交互二者联系起来时可以发现,人机交互的发展过程正是3C(计算机、通信、消费电子)的融合过程,也正是当今信息社会的形成过程。

如今计算机所涵盖的范围早已超越了PC,它被嵌入到各种家用电器设备、手机、甚至MP3、MP4中。

人机交互指的是计算机输入、输出设备,是以有效的方式实现人与计算机对话的技术。人机交互是计算机系统的重要组成部分,是当前计算机行业竞争的焦点,它的好坏直接影响计算机的可用性和效率,计算机处理速度和性能的迅猛提高并没有相应提高用户使用计算机交互的能力,其中一个重要原因就是缺少一个与之相适应的高效、自然的人――计算机界面。人机交互是未来IT的核心技术。回顾人机交互的历史,这是从人适应计算机到计算机不断地适应人的发展过程,它经历了几个阶段。

在早期的手工作业阶段,计算机只能由设计者本人来使用,设计者采用手工操作和二进制机器代码的方法,去适应十分笨拙的大型计算机。

进入作业控制语言及交互命令语言阶段,计算机可以由程序员操作,采用批处理操作语言或者交互命令语言的方式与计算机打交道,虽然程序员要记忆许多命令语言,并且要熟练地敲打键盘,但这时候已经可以使用比较方便的手段来调试程序,也可以随时了解计算机执行情况。

到了二十世纪六十年代,鼠标和图形用户界面 (Graphy User Interface)出现,彻底改变了计算机的历史,GUI的主要特点是桌面隐喻、WIMP(窗口、图标、菜单和指点设备,Window/Icon/Menu/Pointing Device)技术、直接操纵和所见即所得,由于GUI简明易学,减少了敲键盘,实现了事实上的标准化,使不懂计算机的普通用户也可以熟练地使用,开拓了用户人群。

1968年,世界上出现了第一只鼠标,鼠标的发明人恩格尔巴特是电脑界的一位奇才,是“人机交互”领域里的大师,他苦其一生研究计算机,出版著作30余本,并获得20多项专利,他发明了视窗、文字处理系统、在线呼叫集成系统、共享屏幕的远程会议、超媒体、新的电脑交互输入设备、群件等等,但人们提起他时,却只知道他发明了鼠标。鼠标最早的原型是一只小木头盒子,工作原理是由木盒底部的小球带动枢轴转动,并带动变阻器改变阻值,产生位移信号,信号经计算机处理,屏幕上的光标就可以移动。

二十世纪九十年代,网络用户界面的出现,超文本标记语言(HTML)及超文本传输协议(HTTP)为主要基础的网络浏览器,是网络用户界面的代表,这类人机交互技术的特点是发展快,新的技术不断出现,如搜索引擎、多媒体动画、聊天工具等。

以往信息贫瘠的时代一去不复返,信息变得越来越多、越来越密集,信息出现了大爆炸。搜索引擎则让人们在纷繁复杂的信息中获取需要的信息,人们可以扔掉复杂的网址,在搜索框中输入关键字,点击搜索,一切变得如此简单。

二十一世纪后,人机交互的特点是多通道、多媒体。以虚拟现实为代表的计算机系统的拟人化,以及以手持电脑、智能手机为代表的计算机的微型化、随身化、嵌入化,是当前计算机的两个重要的发展趋势。通俗地讲就是,手机越来越大、电脑越来越小。鼠标和键盘为代表的GUI技术不再是主导,而是利用人的多种感觉和动作通道(如语音、手写、姿势、视线、表情等输入),以并行、非精确的方式与(可见或不可见的)计算机环境进行交互,大大提高了人机交互的自然性和高效性。

语音突破文字

让计算机能听、能看、能说、能感觉是未来人机交互的发展方向,其中语音成为未来最被看好的人机交互方式,语音比起其它的交互方式有更多的优势。

最早的语音技术因“自动翻译电话”计划而起,包含了语音识别、自然语言理解和语音合成三项非常重要的技术。语音识别的研究工作可以追溯到20世纪50年代AT&T贝尔实验室的Audry系统,此后研究者们逐步突破了大词汇量、连续语音和非特定人这三大障碍。20世纪90年代前期,许多著名的大公司如IBM、苹果、AT&T和NTT都对语音识别系统的实用化研究投以巨资。

让计算机说话需要用到语音合成技术,其核心是文语转换技术(Text to Speech),语音合成甚至已经应用到汽车的信息系统上,车主可以将下载到系统电脑中的文本文件、电子邮件、网络新闻或小说转换成语音在车内收听。还可以通过特定的服务网站订阅新闻,享受个性化的网络信息服务。

2008年是语音技术重要应用的一年,“数字奥运”的目标就是研发“面向奥运多语言信息服务系统”,多语种语音合成产品是构成整个服务网络系统的重要组成部分,这套系统可以提供多语种、多方言、多发言人、多语气语调并且具备一定自学习能力的个性化语音服务。

数字墨水

有人认为,数字墨水被认为是要来取代键盘和鼠标等现有的人机交互技术的。人大商学院院长、人机交互专家毛基业说:“任何一种新技术的出现都是对现有技术的一种补充,而不可能是取代,正如电视没有取代收音机一样,数字墨水等新技术也无法取代键盘和鼠标,二者是互相补充的关系。”

事实上,数字墨水技术能为人们提供一种新的人机交互界面,并以此来扩展人们使用电脑的空间范围,数字墨水不是用来取代鼠标和键盘的。用户在使用电脑时,就像用笔在纸上写字、画图一样,将电脑的计算处理能力与人们的手写整合为一体,大大延伸了电脑为人们提供便利的时间和空间。

比如,让学生在听课时也可以享受电脑的好处,在课堂上利用数字墨水进行手写记录,得到被电脑直接“读懂”的数字文件,可后还可以继续进行编辑、共享、查找和网络传递。或者当你在厨房烹调时,想从电脑中查阅菜谱,手写的输入界面也比键盘更方便。

垂直搜索

原有的搜索技术已经无法满足人们多样化的需求,人们需要一种更智能、更精确的搜索技术。垂直的对象搜索技术随之诞生了,“垂直”是指不像原有的“包罗万象”的搜索,而是指向某一特定领域,如学术、购物、求职等,用户可以在自己感兴趣的领域内进行搜索。“对象”则指搜索的结果不再是一个个独立的页面,而是将每个页面中的相关信息按照用户的需求集合成一个个完整的项目。

例如,搜索某个商品时,垂直搜索技术可以把这个商品的图片、参数、价格、商家位置、用户评价等相关信息集合在一个页面上,用户可以在第一时间得到最需要的内容。

眼标

交互基本上都离不开用户的视觉,那么如果用户能用眼睛(直接用大脑思维来控制的“脑标”目前还太遥远)来操控图形界面岂不是更方便?由此,“眼标”应运而生。

2002年伦敦帝国学院的科研小组花费数年时间来研究人类眼睛活动与大脑感知之间的关系,最终发明出一种专门用来捕捉眼球细微动作的红外线感应装置,被他们称为“眼标”。

“眼标”能鉴别眼睛在显示屏上的移动和注视,如果电脑使用者盯住屏幕上的某个链接图标1秒钟以上,电脑就自动打开该链接;如果使用者盯住打印或者存盘的图标,电脑就会自动进行相应的操作。

不过,人们眼球运动时存在的固有抖动以及眼睛眨动所造成的数据中断,就会干扰信号。另外,如果鼠标器光标总是随着用户的视线移动,可能会引起反感,因为用户“随便”看着什么而并非总是“意味着”什么。

理想情况是用户希望发出控制时,系统及时地处理其视线输入,而在相反的情况下则忽略其视线的移动。让电脑去理解用户的这一美好愿望还不大可能。不过,科研人员仍认为人类用眼睛搜索和盯住一个目标的准确性远远超过用手移动鼠标。

手机变大 电脑变小

2007年1月,苹果公司首席执行官史蒂夫・乔布斯在2007年Macworld上宣布推出业界翘首以待的iPhone和Apple TV。除了这两项重大的产品,为了进一步表示进军消费电子市场的决心,苹果电脑公司(Apple Computer)把“电脑”这个词拿掉,更名为苹果公司。

iPhone采用3.5英寸触摸屏控制技术。它支持音乐、视频播放,提供无线网络服务,可以包括收发电子邮件在内的浏览互联网,采用Google Maps为在线地图,使用者仅需网络联机,便可输入地址找到区域地图,而透过触控屏幕,无论是缩小地图范围或寻找邻近店家都相当方便。

iPhone与众不同的地方就是多重触摸技术,除了可以同时移动两个以上的窗口以外,还可以随着手指的动作,变换图象的大小,这种技术是“人――计算机”交互技术和计算机硬件结合的操控界面。它是一种多重同步确认触摸点的触摸屏,能让双手同时比划,支持多个用户在同一个界面里操作计算机,通过直观的姿态直接操纵屏幕。它的显著特点就是,用两个手指就可以直接缩放屏幕,用鼠标和触摸笔等单点设备更直观的绘图。

iPhone将于6月问世的消息一出,Treo、摩托罗拉、Blackberry等智能手机厂商股价纷纷下跌。

2001年iPod诞生之时,“人们开始狂热和失去理智,像中了毒一样争相购买iPod”,包括布什和英国女王也宣称是iPod拥护者。据苹果公司称,去年12月份iPod已经占据了美国便携音乐播放器市场72%的市场份额。如果将iTunes等相关产品的收入也计算在内,该项业务为公司贡献了57%的收入。

苹果公司选择手机作为收入增长的下一驾马车的原因很简单,因为市场竞争越来越残酷。2006年全球45%的手机中有4~5亿台已经集成了MP3播放功能。消费者只有两只手,将通话、听音乐、上网、玩游戏、看电视、数码照相、GPS导航等各种功能融合在一个终端上,是未来最大的趋势。

手机+网络早已不是新鲜事,各大IT巨头除了在通信终端上大做文章,也不忘推出便携式移动个人电脑,即计算机+手机的模式。“UMPC”(超便携移动个人电脑)是一个介于笔记本电脑和智能手机之间的产品,一般是7英寸的显示屏,重量轻于1公斤。近来微软推出了新一代的UMPC产品“Vistagam”,这些产品将支持微软的最新系统Vista。同时微软了新版的Origami软件,可轻易通过触摸功能导览。除了触控功能之外,还加入内建键盘的设计。由此可以看出,UMPC也有着大好前景。

虽然从名字来看,UMPC仍有很重的PC痕迹。但包括三星、索尼、华硕、汉王等产品制造商,微软、威盛等核心平台供应商,都在刻意淡化PC概念,而突出UMPC在消费电子、通讯方面的应用表现。

2008年被认为是UMPC市场的转折点,与即将在北京奥运会全面商用的3G浪潮有着密切的关系。相关分析人士认为,3G将进一步丰富UMPC的应用环境,给市场带来难得的发展机遇。而UMPC相对于手机最大的优势就在于,本身具备更舒适细腻的屏幕、强大的通信及计算性能、优异的影音表现,这些都决定了其更适合成为3G环境下的主流终端。

虚实不分

台湾地震导致海外电缆断裂,几亿人无法登陆MSN、发送海外邮件、浏览国外网页,人们非常不适应没有网络的生活,因为网络与我们的生活已经密不可分。

2006年,second life(第二人生)虚拟社区出现,打破了虚拟世界与现实世界之间的界限,Second Life是一款在美国非常受欢迎的网络虚拟游戏,但它绝不仅是一款游戏。它是目前最成功的基于虚拟社区的社交化网站,在游戏中,玩家可以在游戏中做许多现实生活中的事情,比如吃饭、跳舞、购物、卡拉OK、开车、旅游等。通过各种各样的活动,全世界各地的玩家可以交互。它为人类提供了一个和现实世界并存而又开始融合的虚拟世界。

不仅如此,可口可乐、微软、英特尔、阿迪达斯等国际大牌公司都纷纷入驻Second Life社区,通过Second Life最新产品。丰田甚至在Second Life出售其虚拟汽车,IBM计划推出其3-D局域网,并为其入驻 Second Life的软件工程师支付报酬。广告公司 Leo Burnet也正在建设一个“创意港湾”,在其中全球雇员可以彼此互动交流。Sun甚至为其向新游戏战略转型在Second Life上举行了“虚拟新闻会”。这些企业一致认为Second Life的三维拟真和良好的互动性使其成为一个炙手可热的广告途径。当传统的广告载体开始失去眼球的时候,Second Life用户的月增长率达到35%,而其经济收入也呈现15% 的增长。

路透集团甚至在Second Life上建立了一个新闻机构,来自伦敦的记者Adam Pasick担任这家新闻机构第一任虚拟总编辑,他为Second Life的会员以文本、照片和视频的形式来自外面世界的新闻,而真实世界的读者也可以访问路透社新设立的网站来了解Second Life中的新闻事件。

Second Life从一年多前的16万用户到如今的200多万用户。Second Life在未来几年肯定会成为焦点话题,而它背后虚拟和现实的融合也已经开始。

以用户为中心

“人机交互技术无论发展到什么程度,都必须围绕以用户为中心的宗旨”。人民大学商学院教授、人机交互专家毛基业认为。交互设计并不是用户体验,用户体验是指产品的使用者(用户)对产品的主观感觉,是用户在使用产品的过程中所感受到的、所获得的全部内容的总和。而交互设计人员必须根据用户的实际需求来决定产品的易用性。比如把ATM的取款程序设计为先取卡,才能取钱,这表面上看给用户带来不便,实际却降低了用户因忘记取卡而带来的损失,这是为产品的安全性而做的交互设计。只有当目标用户对设计的产品赞叹不已,这时候才可以说产品获得良好的“用户体验”。

以用户为中心的设计所关注的是如何针对用户体验展开设计,是强调“体验”对设计的影响,把用户做为价值创造的主体,强调以用户为中心,需要用户亲自参与,满足用户的个性化需要。

从经济学的角度来说,“以用户为中心的设计”中最大的挑战,是如何去降低用户与界面交互过程中的成本,并刺激用户对交互的需求,从而给用户带来持续的、良好的体验,提高交互效率。

毛基业说,系统可用性有两个量化指标,一是易学性,如新用户平均培训时间,学习速度,对手册倚赖程度;二是易用性,如时间节省(任务完成的时间对比),用户平均犯错误的个数、造成的后果和所需的纠错时间。

展望

比尔盖茨曾预言,电脑毫无表情的时代即将结束,21世纪将是情感电脑大行其道的时代。虽然今天的电脑还没有喜怒哀乐,但是让电脑也有喜怒哀乐是人机交互的发展趋势。

人机交互范文第9篇

关键词:隐马尔科夫算法;人机交互设计;评估;计算机作曲

中图分类号:TP311文献标识码:A文章编号:1009-3044(2011)12-2748-03

Research about the Human-computer Interaction for the Auto-Harmonizing System

LIU Xiang-bin, FENG Yin

(Cognitive Science Department,Xiamen University, Xiamen 361005, China)

Abstract: Most of the existed composing Systems need the help of professional composing knowledge in the composing progress. While this paper proposed a new method, which is mainly to design a human-computer interaction between the ordinary people who command little knowledge about composing and the HMM based harmonizing system. With the improved harmonizing system, one ordinary people can compose a brilliant accompaniment for the given melody. Experiment shows that the proposed method is feasible to harmonize a melody.In the end, three professional composers are invited to evaluate the harmonizing results generated by the improved system. The evaluation shows that the improved system is able to generate favorable music for the common people.

Key words: hidden markov; human-computer interaction; evaluation; computer composing

自动钢琴伴奏系统的研究属于“为旋律自动配和声”领域的研究内容。它是算法作曲[1-3]研究领域中的一个研究分支, 即多声部算法作曲系统的研究。我们可以把现有的基于各种技术所研发的自动伴奏系统按系统的人机交互性分成二类。第一类是常见的有关自动伴奏系统的产品。如Band in a Box系统以及TT作曲家系统等。不过,使用这些系统来生成多声部音乐时,人需要相当程度的介入。例如,它们可以为一首歌的旋律(单旋律)自动生成一个和弦序列(或者直接由人指出这个和弦序列)。但是在生成和弦序列之前,需人工指定是一小节配一个和弦还是一拍子配一个和弦。最后,再由人在一个系统提供的音型库中,为每小节旋律选择适当的伴奏音型(节奏)。第二类是为旋律自动配和声系统,此类系统在介绍各种多声部算法作曲系统的技术文献中有所涉及。例如,Ebcioglu的基于规则的系统CHORAL[4]及Allan 和Williams的基于HMM模型的四声部合唱曲自动生成系统[5]。在这类系统中,人仅需给系统输入一单旋律,之后的整个“自动配和声”的过程基本完全由系统控制[6]。

第一类系统要求使用者具有相当的和声配置及多声部音乐的创作经验,这样,可以获得在质量上满足使用者预期的音乐作品。可是,系统的智能程度及自动化程度不高。而第二类系统因几乎没有人机交互,属于模拟作曲家创作行为的全自动多声部作曲系统。但是,所生成的作品创作风格受限、单一。作品在质量上,不容易达到使用者(尤其是专业作曲家)所期望的目标。系统基本上没有太大的实用性。

1 人机交互的系统的理论依据

一个“音乐作品”质量的好坏最终是由人来评估的。不同人的音乐喜好、素养及其美学标准都不尽相同。这和评估一道数学难题的解不同。不同人为同一道数学难题的最终解答作评估时,通常会有比较统一、确定的标准。而音乐作品的创作者本人实际上就是他所创作的音乐作品的最先评估人。创作者对自己音乐作品的听觉评估是音乐创作的一个不可缺少的步骤并影响最终的结果。这对创作复杂的多声部音乐来说尤其如此。我们知道,为一首歌曲配置和声或钢琴伴奏可以有许多种不同的“解”。这包括不同的和声序进策略[7],不同风格化和弦的使用以及多声部织体的不同组织方法等。通过听觉评估,创作者可以随时对他的作品中所使用的各种创作技术做适当的调整以便最终形成的作品满足创作者的期望目标。因此,一个旋律配和声系统(如自动钢琴伴奏系统),应设计成一种既简洁又灵活的“人机交互”系统。它不能像前述第一类的自动伴奏产品那样需要用户涉及太细致的和声进行及不同声部间音乐织体的设计,但却能够凭借用户自身的听觉判断为某一旋律片段替换合适的伴奏音型,以便所使用的音型满足上下文的环境。这种涉及人的听觉评估的人机交互过程就会不同程度地修正甚至引导最终的伴奏结果。因为由不同人使用本系统为同一首歌曲编配钢琴伴奏,其结果可能会有差别。而这种差别却是前述的第二类自动伴奏系统中无法获得的。即,“人机交互”可使最终作品尽可能接近用户期望的结果。

2 人机交互式作曲系统设计

2.1 训练谱例的初步确定

自动伴奏系统的训练谱例是通过调式、节拍以及速度的筛选而初步确定的(如图1所示)。通过对筛选谱例的训练,我们可以为一行主旋律配伴奏,得到具有高音声部和低音声部的钢琴伴奏结果。

2.2 伴奏结果生成

通过对样板谱例的训练,生成伴奏结果如图2所示。

2.3 听觉判断以及音型更换

系统使用者对伴奏结果做出听觉判断,指定伴奏结果的某一小节为不和谐小节,可以通过谱例再训练界面(如图3所示)做出更改,直到得到操作者满意的伴奏结果为止。

图3 用以选择再训练样板谱例的人机交互界面

3 实验结果以及专家评估

3.1 音型转换结果

我们随机选择待配伴奏歌曲《走四方》,系统改进前的伴奏结果片段和系统改进前后的伴奏结果片段如图4、图5所示。

对于《走四方》的结尾来说,改进后比改进前有明显效果。

我们又重新选择另一首待配伴奏歌曲《小城故事》,系统改进前的伴奏结果片段和系统改进前后的伴奏结果片段如图5、图6所示。

明显的,改进后的伴奏片段更加适合《小城故事》舒缓的主题。

3.2 专家评估

3.2.1 评估结果

我们将22首系统生成结果提交给了3位专业的作曲家进行评估,评估结果如表1所示。

3.2.2 评估意见及结论

钢琴自动伴奏系统的开发研究是一个非常实用、非常有价值的工程。通过人类电子技术和艺术的完美结合,将歌曲分析、钢琴技巧、和声基础、伴奏音型、综合应用能力集一体,较好地塑造乐曲所需要的音乐形象。

对钢琴自动伴奏系统在以下三个方面的看法:

1) 歌曲分析:要为一首歌曲配伴奏,首先要对歌曲进行分析,确定它的调式调性,选择和弦,根据乐曲的音乐形象、速度要求来确定钢琴伴奏音型等等。钢琴自动伴奏系统在这方面的表现良好,为钢琴伴奏的编配工作打下了良好的基础。

2) 和声基础:和声水平的高低直接关系到伴奏的音响效果和表现力,因此和弦的选择非常重要。钢琴自动伴奏系统在和弦的选择上,虽然大部分和声的选择属于正确范围,但只要有一些和声用得不是很到位,就会影响整体。因此我们认为此伴奏系统还是有些欠缺,和声效果不是太丰富,有些和声感觉与旋律不太般配。

3) 钢琴技巧与伴奏音型:伴奏效果的好坏,除了和声效果以外,主要就是伴奏音型的应用。因为它关系到对乐曲音乐形象的表达准确与否。而伴奏音型的应用需要以钢琴技巧来体现。钢琴自动伴奏系统有几首的伴奏音型与钢琴技巧应用不错,但有一些乐曲的编配较为单一,没有太多的变化。

总的来说,钢琴自动伴奏系统综合应用能力与整体效果良好,如果把和弦库的和弦再丰富一些,各种编配音型再丰富一些,对音色、音质要再进行美化,相信一定能够取得很好的令人满意的效果。

参考文献:

[1] 陈魁.基于音型数据库的钢琴自动伴奏系统的研究与设计[D].厦门:厦门大学,2009.

[2] David Cope.Virtual Music:Computer Synthesis of Musical Style[R].Cambridge,MA,MIT Press,2001.

[3] 张英利,刘弘,李少辉.遗传算法在作曲中的应用[J].计算机应用研究,2005(11):143-145.

[4] Paiement J F.Probabilistic Melodic Harmonization[Z].www.idiap.ch/~paiement/articles/chords.pdf.

[5] Allan M,Williams CKI.Harmonising chorales by probabilistic inference[C]//Lawrence K, Saul.Advances in Neural Information Processing Systems.Cambridge: MIT Press,2004,17:25-32.

[6] Ebcioglu K.An expert system for harmonizing chorales in style of J. S. Bach[C]//Balabab M,Ebcioglu K,Laske O.Understanding Music with AI,Cambridge: AAAI Press,1992:294-334

[7] 黄钟.算法作曲及分层结构控制[J].武汉音乐学院学报,2003.

人机交互范文第10篇

如今,触控、语音识别、体感交互这3个最流行的前沿人机交互技术,让我们重新认识了科技的力量。 娱乐需求刺激技术推进

时间拉回到20世纪90年代初中期,小霸王游戏机是我接触的第一个电子产品,它是我们那个时代的Kinect。不足十几MB的卡带就是今天的App Store,主机显示屏就是当时时髦的低彩色分辨率电视机,连上线后,还得自己动手调频对接到游戏信号后才算告成。这对于出生在今天的小孩,无法想象消遣一款游戏要如此大费周折。而电子娱乐产品最打动用户的不是它能否提供“正能量”,而是它可以让我们沉浸于设计好的虚拟角色,让人瞬间忘掉现实的压力。正是这种像“”一样容易让人上瘾的娱乐产品,相继催生出了一个长盛不衰的庞大的娱乐消费产业链。

在这条产业链中,技术的成熟使得娱乐的方式呈现出多元的发展,也就是以往人跟机器的互动,不再受限于一个固定的场景和操作方式,而这种蓬勃的发展方式,离不开用户对于娱乐的孜孜需求。如:初期的电子游戏领域,从最原始粗糙的家用小霸王机到大型公共场所的电视摇杆机,再到后来具有同等高质量内容画面的CD-ROM光盘机等,用户的娱乐需求刺激着技术的推进,而技术的推进促使人与机器的互动不断被升华改变。

在小霸王游戏机上,由于硬件无法达到大型摇杆机的技术参数,所以你无法在家里的电视机上玩上20世纪90年代日本最风靡的动漫游戏《拳皇》,而只能去公共娱乐场所。当后来有了CD-ROM 游戏机,它浓缩了大型摇杆机和小霸王机两者间的精华,一张4.7 英寸的光盘体积和精致的画面,但由于制造的高成本它在当时多数普通玩家手里普及度远远没有前两者高。

从小霸王到摇杆、CD-ROM机等3个不同形式的娱乐载体,它们的技术本质都没变,都通过外在的一个物理按键来操控虚拟的角色。而且各自存在的弊端始终无法得到用户的青睐,家用低廉的小霸王机硬件的天生缺陷无法提供优质的第三方游戏、大型的摇杆机不够方便携带,而优质的CD-ROM机造价过高,一般用户难以承受。

所有这些初期的电子娱乐产品暴露出来的弊端,进入到20世纪90年代后期逐渐在Windows图形用户界面的崛起而慢慢被取代,虽然那时一台PC的价格一般家庭还是很难用得起,但用户的娱乐欲望正被一种新型的高级 “玩具”所吸引,因为在PC上玩游戏的体验跟之前相比有着天壤之别。因为你无需在不同游戏之间来回切换,游戏界面比以前更加真实和细腻,所有的操作不再是拙劣的几排物理按钮,而是在一个圆滑的椭圆球上的“正负”两极开关按键,这就是后来我们所熟悉的鼠标。今天它依然是我们跟PC互动的工具之一,虽然鼠标的重要性每年都在降低。

一个产品的重要特质往往反应在自身娱乐性的高与低,当Windows在20世纪90年代中后期开始走进人们的视野普及起,一种新型的娱乐玩法首先得到老玩家的探索和青睐。原先在之前三种娱乐载体上体验的游戏,跟在PC上那些更细腻宏大的题材游戏相比,后者的感触可以用震惊来形容:这玩意早出来该多好。你无法在当时的硬件条件下通过小霸王机玩《帝国时代》是什么样的场景,娱乐的升级幕后都伴随着技术的更新换代。

以图形界面直观易操作的Windows开始风靡全球后,老一代的单机“游戏机”逐渐被赶下娱乐的舞台。从此占据人们视线的便是个人台式电脑,这一时期由美国艺电游戏(EA)开发的一系列战略游戏,如:红色警戒,就是我们那时候的“网游”。

这个游戏的背景改编自二战,这种指挥“千军万马”的战争游戏场面,是之前所有玩过的街机游戏所没有的体验,游戏设计本身与用户有了直接的情感联系,也就是整个作战过程由你把控。

进入到21世纪初,便携式笔记本电脑开始流行于市场,虽然20年前它已被各大厂商研发出来,但价格不菲。跟所有起初以颠覆性技术出现在市场的产品一样,高昂的成本让它无法立刻在大众中普及开来,10年后它依然不是工薪阶层的随身必备品,但它已具备所有台式机的性能,也就是一般的大型单机游戏能够顺畅在上面跑动。

这时候由索尼开发的PSP掌上游戏机在2004年底上市,它离iPhone的杀手锏触控+App还有3年。娱乐的多元化走向开始在个人电脑、笔记本电脑和PSP中全面爆发,这三架马车分别代表着人与机的互动进入到全新的便携式高性能时代。

高性能的便携式PC开始普及满足于人们的娱乐时,iPhone的就是一个转折点,它的多点触摸和App Store这种经典组合,将过去十几年的娱乐模式狠狠地甩在身后,当这两种全新的组合一种掌控硬体、一种掌控软体的技术被全面应用在移动智能设备之后,以PC为主的那套娱乐交互模式,是这种更流畅直观的操作方式所无法企及的。 自然人机交互时代

如果说以PC为主的互动方式代表着高性能,那么以触控为首的自然互动方式则代表着人机交互的新起点,这令所有的移动智能设备终端拉近了与人 “交流” 的感情。与之相随的App Store在线销售模式则兼顾了软硬件的两头,对于娱乐消费的方式带来了意想不到的空前繁华,现在没有谁会为一款游戏或者软件,专门跑到线上线下去买一堆光盘或者安装解压文件在PC上。

多点触控掌握着交互行为,而App Store掌握着娱乐内容,这两种左右脑兼顾内容和用户的行为习惯,在基于前20年人机互动的几个时期上,如:借助周边硬件设施的手柄、鼠标等到后来更“亲近”的手势,人机交互的外在演变被带到了全新的“人体”触控时代。把这种人体触控发挥到极致的,要属另一个交互技术的实现,Kinect的体感识别。

Kinect作为娱乐消费产品一类,虽然不属于PC范畴但其核心在于它的技术价值,它无需任何设备的情况下,人体本身就是一个“鼠标”。这种一切基于人体来与机器进行对话的行为首先被应用到娱乐中,也就是后来在网络视频上看到的很多竞技类的App游戏均搬到 Kinect来体验。

伴随着触控、体感这两种最流行普及的交互技术的成熟,语音识别的进化也令人瞠目结舌,这就是众人皆知的Siri。当Apple 3年前第一次Siri以来,你会发现很有趣的一个现象就是,用户的第一个举动不是怎么询问它获得帮助而是拿来调戏,看看这个乔布斯留给世界最后的“遗产”到底有多理解自己的意思。从这些年的各种爆笑问答趣闻中,不难看出Siri在慢慢培养人们与机器更自然友好的交流。当一个新型的技术推向市场时,往往首先它的“娱乐”性是否具备趣味有用决定着产品的前途。

上一篇:人机料法环范文 下一篇:人机界面范文