首页 > 技术文章 > 从 UI 交互角度说语音识别产品

yseeksky 2018-12-24 16:18 原文

  语言是人类进化的主要特征,而人工智能拥有了说话的能力也是科技进步的一个特征。在很多科幻的电影里面,我们可以看到人工智能的身影。在电影 her 里面见到的人工智能,真的让人叹为观止,他可以随意的和你聊天,像一个朋友一样,像一个人一样,拥有人性,他们有自己的思维,可以理解你的情绪,知道你想表达的意思,知道你的目标。但是我们现在体验的人工智能却不是这样的,大部分人对现在的人工智能的评价只有:很笨。现在人工智能的技术,解决的只是语音识别的问题。语音识别的技术是越来越强大了,甚至能听懂方言了。但是用户依旧觉得现在的人工智能很笨,因为这只是一个可以听懂话的“傻子”,他虽然听懂了你的话,识别出你说的东西,转换成了文字,他们也可以“说话”,但是他“不会说话",我们经常可以听到“这个问题我还理解不了,如果你想……,可以这样对我说……”。

  如果用户不能从科学和哲学的角度去分析用户为什么会认为这些产品笨,那么我们对语音交互的认知会掉进一个死胡同中。

  我刚开始接触智能语音应该是从中国移动开始。打他们的服务电话,电话那头传来 “查询话费请按 1 ”,“查询流量请按 2”这种语音交互用户是不会觉得笨的。为什么呢?因为用户知道,这种语音交互就是这样的,是个选择题,而且用户只能做选择题。他们的功能很清晰,用户也知道交互的边界很清晰,运作良好。所以用户不会觉得这种语音交互是笨的。

  我们现在用的语音交互的产品是没有产品界限的。用户说出来的每句话,都是有创造性的,因为人与人之间的语音交互是边界模糊的,才使得语音沟通的时候才显得语音交互很笨。当你不知道机器能听懂什么的时候,你只能假象对方像一个人样,什么都能听得懂。于是,语音交互一旦突破了传统的边界,就会一发不可收拾地朝着的方向发展。当你听到电话语音给你选项边界的时候,你不会假想对方是人;但是对于Siri这种没有提供边界的交互,你很自然的就把对方假象成为一个有智能、有情感的生物。

很多人喜欢调戏Siri,正是因为你已经把他假象成了一个人,而当它远远没有达到一个正常人应该具备的决策和判断能力时,你就会形容它很笨。语音交互在刚刚开始的时候,他对标的对象就已经是真实的人。只存在“像人”“不像人”两种状态,而不像视觉界面,人们或许还愿意去学习它的交互。

 

推荐阅读