admin管理员组

文章数量:1530884

2024年7月15日发(作者:)

概述智能助理的完整交互过程

本文从智能助理的基本逻辑出发,详细分析了国内外主要智能助

理亚马逊ALEXA、Google Assistant、苹果Siri、微软Cortana的发

展历史和主要功能,并给出自己对其体验和分析预测。

随着人工智能行业的发展,智能个人助理作为人工智能系统应用

相对成熟的领域也慢慢被大众熟知。

智能助理可以理解为利用AI技术通过统一的对话交互界面来一

站式给用户提供需要的信息和服务。

一、智能助理基本逻辑

智能助理也可以看作是任务导向的chatbot,实现逻辑与

chatbot相似,但是多了业务处理的流程,智能助理会根据对话管理

返回的结果进行相关业务的处理。

通常智能助理一个完整的交互流程是这样的:

首先:音频被记录在设备上,经过压缩传输到云端。通常会采用

降噪算法来记录音频,以便云端“大脑”更容易理解用户的命令。然

后使用“语音到文本”平台将音频转换成文本命令。通过指定的频率

对模拟信号进行采样,将模拟声波转换为数字数据,分析数字数据以

确定音素的出现位置。一旦识别出音素,就使用算法来确定对应的文

本。

然后:使用自然语言理解技术来处理文本,首先使用词性标注来

确定哪些词是形容词、动词和名词等,然后将这种标记与统计机器学

习模型相结合起来,推断句子的含义。

最后:进入对话管理模块,确认用户提供的信息是否完整,否则

进行多轮对话直至得到所需全部信息。根据得到的信息进行相应的业

务处理,执行命令。同时将结果生成自然语言文本,并由语音合成模

块将生成文本转换为语音。在这些模块中,对话管理(DM)模块的首

要任务是要负责管理整个对话的流程。

二、亚马逊ALEXA

亚马逊于2014年推出智能音箱Echo,主要功能集中在语音购物

和对智能家居的控制上。随着Echo成为家庭的交互入口,其搭载的

“大脑”Alexa智能语音助手也开始遍地开花。

通过亚马逊Alexa与智能家居设备的连接,用户可以轻松控制智

能家居设备,如开关灯、开关窗帘、开关电视等。Alexa还可以通过

多个信息源播放流媒体音乐和阅读新闻,提供天气、交通等信息,以

及通过语音在Amazon Prime会员服务上购物,甚至还可以预订比萨。

三、Google Assistant

2016年5月,谷歌重磅发布了全新语音智能助手Google

Assistant。

背靠Google十余年的努力,GoogleAssistant利用了大数据、

机器学习、自然语义分析等一系列技术,能够在不断对话之中为用户

解决问题,而不像之前那样只能用简单的提问和回答。

在技术强化之外,GoogleAssistant的产品逻辑也在不断进化。

通过让视觉、语音、文字等多个人机交互方式的无缝组合,实现更积

极地对话,以及更个性化的推荐。

Google Assistant从某种角度可以说是Google Now的进化版,

比Google Now增加了双向对话,且对一些功能进行了优化。

作为Google在AI方面的核心之一,目前Google已经几乎把所

有资源和能力都倾向Google Assistant,力图用Google Assistant

来把整个市场格局铺开。

今年5月份举办的谷歌I/O大会谷歌CEO Sundar Pichai宣布谷

歌助手已经登陆5亿台设备,将于今年底支持30种语言,80多个国

家可用。

此外,Google Assistant还在积极向外部合作进行拓展,还与

70多家智能家居厂商达成了合作,呈现出更加包容的开放性。Google

Assistant今年在人机交互的智能性上做出了非常大的突破。

四、苹果Siri

2011年,在iPhone 4s面世的当天,苹果Siri也以智能语音助

手的身份初次正式亮相,并成为当时发布会上最大的亮点。

它是苹果在iPhone、iPad等产品中使用的一项智能语音控制系

统,目前已经可以支持Apple TV和Apple Watch。

通过Siri,用户可以轻松地实现设置闹钟、推荐本地商户、进

行路线规划、播放音乐、读发短信、安排日程、定时提醒、获取资讯、

搜索资料、实时翻译等功能,Siri还通过用户的行为习惯,前瞻性

地向用户推荐需要执行的行为等。

Siri其实是语音助手领域里起步比较早的应用,是大众认知里

熟悉度最高的个人智能助理,也使大众第一次对智能助手的概念有了

认知,“调戏”Siri也曾是风靡一时的娱乐项目。

五、微软Cortana

2014年2月,微软公司推出了自己的语音助手小娜(Cortana),

并嵌入安装Windows操作系统的计算机和手机中。

它是一款基于语音和文本的虚拟助手,目前已经可以支持

Windows、iOS、以及Android系统。借助微软自身深厚的技术功底,

Cortana实现了对语音的较高识别率和与系统功能的深度集成,给用

户带来了不少便利。

Cortana可以处理事务提醒和日常预约,设置闹钟,同时它还能

启动Bing(必应)搜索引擎获取体育,天气和其他信息。

六、小结

因为所面对的用户群体不同,用户使用习惯也有很大差别,中外

AI头部企业在智能助理这一领域发力方向也都不尽相同。

本文标签: 智能助理语音用户对话