人机交互过程实际上是一个输入和输出的过程,人通过人机界面向计算机输入指令,计算机经过处理后把输出结果呈现给用户。人和计算机之间的输入和输出的形式是多种多样的,因此交互的形式也是多样化的。 数据交互 数据交互主要有以下交互形式: 常用的数据交互设备 图像交互 科学研究表明,人类信息传递主要通过语言,文字和图象三个渠道。而且,人类从外界获得的信息有70%以上来自视觉系统,也就是从图像中获得。所以,对图像交互的研究和探讨将意义重大,对产品设计的创新也有引导作用。图像交互的应用领域空前广泛,如人脸图像的识别,手写交互界面,数字墨水等。 图像交互,简单说,就是计算机根据人的行为,去理解图像,然后作出反映。这里面,让计算机具备视觉感知能力是首要解决的问题。目前人们研究的机器视觉系统可以分为三个层次:图像处理({zdj0}层次)-->图像识别(较高级层次)-->图像感知({zg}层次)。所谓图像处理,主要是对图像进行各种加工以改善视觉效果,就是把输入图像转换成具有所希望特性的另一幅图像的过程,是一个从图像(输入)到图像(输出)的过程。所谓图像识别,主要是对图像中感兴趣的目标进行检测和测量,以获得它们的客观信息从而建立对图像的描述。本质上是一个从图像到数据的过程。所谓图像感知,重点是在爱图像识别的基础上,进一步研究图像中个目标的性质和它们的相互关系,并得出对图像内容含义的理解以及对原来客观场景的解释,从而直到和规划行动。图像感知,输入的是一幅图像,输出的则是对该图像的解释。 语音交互 语言一直被公认为是最自然的流畅,方便快捷的信息交流方式。在日常生活中人类的沟通大约有75%是通过语音来完成的。研究表明,听觉通道存在许多优越性,如,听觉信号检测速度快于视觉信号检测速度;人对声音随时间的变化极其敏感;听觉信息与视觉信息同时提供可使人获得更为强烈的存在感和真实感等。因此,听觉通道是人与计算机等信息设备进行交互的最重要的信息通道。 语音交互就是研究人们如何通过自然的语音或机器合成的语音同计算机进行交互的技术。它涉及多学科的交叉,如语言学,心理学,人机工学和计算机技术等;同时对未来语音交互产品的开发和设计也有前瞻式的引导作用。语音交互不仅要对语音识别和语音合成技术进行研究,还要对人在语音通道下的交互机理,行为方式等进行深入研究。语音识别和语音合成的相结合,即构成了一个"人机通信系统"。 语音交互系统一般采取两种途径:一种是用基于语音识别和理解技术的,主要依靠音频进行交互的系统;另一种是利用语音技术与系统的其他交互方式结合在一起来进行交互的系统。在这种方式中语音不再占主导地位,它只是交互系统的一部分。 行为交互 行为交互将带来全新的交互方式。计算机通过用户行为能够预测用户想要做什么来满足用户的需求。如:计算机跟踪人们的视线,就能决定用户的意图,是想要浏览什么网站还是需要打电话等;当用户走进房间时,带有"蓝眼"的计算机即做出反应,如提示新收到的电子邮件,如果用户摇摇头,计算机就认为用户不希望阅读邮件,因此转而列出当天的日程安排等。 |