由阿里巴巴集团旗下人工智能实验室(A.I. Labs)研发的第一款智能语音终端设备——天猫精灵X1在近期终于得以露面。这款面向家庭用户消费级的AI产品,内置有阿里巴巴推出的第一代人机交流系统AliGenie,售价定为499元。
天猫精灵与Siri唤醒相似,只需要用户对智能音箱说一声“天猫精灵”, AliGenie便可提供类似播音乐、听故事、讲笑话、查运势、玩游戏、查天气、找手机控等服务功能。值得一说,依靠阿里云强大的机器学习技术和计算能力,AliGenie能够不断的成长变得越来越聪明,能够成为人类的生活助手。
“这是我们在人机交互新大陆上的探索,希望和大家一起体验探索未知世界的乐趣。”阿里人工智能实验室负责人浅雪说,“语言是人与人之间最主要的沟通方式,也应该是人与另外一种智能进行交流的主要方式。”
外观轻巧灵动全程用对话沟通
采用圆柱形设计的天猫精灵X1,有黑白两种配色,与普遍家用的蓝牙音箱外形十分相似。在X1顶部中央,配有一枚静音键。当用户触发此键时,X1会立刻停止声音播放,并停止识音功能。
在底部设计了一圈隐藏指示灯,会通过声音来判断用户方位,亮起灯光以示提醒,灯光还会根据不同使用功能和场景配合进行提示。
X1搭载了6麦克风环形阵列,能够在家庭环境下实现5米范围语音识别。并经过专业音效调节的独立功放芯片,使得X1同时也具有优秀的外放效果。
针对声音环境的多变性,X1还具备一定的自我学习功能,可以根据环境噪音进行优化,适应不同家庭环境噪音。不过考虑到中文语义环境的复杂性,阿里人工智能实验室通过众包平台等方式,针对生活中的各种生活场景所需要用到的语义问法进行了征集,仅天气预报就能够理解786种中文问法,通过深度机器学习,天猫精灵X1已覆盖20个领域的中文自然语义理解,能够理解人类80%的意图。
声纹识别可以分辨家里每一个人
有别于其他的智能音箱产品,天猫精灵X1除了具备语音控制音乐和音频内容播放等功能外,还通过AliGenie接入了丰富的生活服务。目前已经达成的合作伙伴包括美泰、KEEP、西溪天堂综合体、优酷、高德地图、淘票票、支付宝、虾米音乐、天猫超市等。可以说丰富的合作伙伴与第三方技能服务,能够为用户带来更好的体验。
天猫精灵X1可以通过声纹识别技术分辨家里的每一个人。浅雪介绍,声纹识别技术是生物识别的重要识别手段之一,结合服务链多重安全机制,已达到商用的级别。这也是阿里在语音深度学习领域的核心技术之一。据悉,天猫精灵目前最多可以识别6个人的身份。通过个性化推荐,声纹识别在辨别出使用者的身份后还能够实现“千人千面”,根据每个人的喜好设定和推送不同的内容。
比如,声纹识别技术可以应用到一些购物场景中。用户先将自己的声音注册后生成声音密码,与机器绑定后,确认开启声纹购功能。随后,当你说出 “帮我买一箱牛奶”这样的需求时,天猫精灵会要求用户跟着念一串随机数字进行声纹校验,如果确认为用户本人,天猫精灵会从用户绑定的支付宝中进行扣款完成交易。
AliGenie开发者平台 开放软硬件核心技术
天猫精灵X1内置了第一代人机交流系统AliGenie,由阿里巴巴的科学家团队研发,当天,阿里人工智能实验室还同时发布了面向开发者和硬件厂商的AliGenie开发者平台。
AliGenie开发者平台将向应用开发者免费开放NLP语义理解、TTS语音合成等多项自然语言处理技术。开发者既可以创建技能,为更多的语音用户提供服务,也可以将自己的设备接入云端服务,获取语音交互能力。
除了技术的开放外,生态的开放会是平台开放的特色和重点。开发者可以为天猫精灵用户开发多种“技能”服务。目前,天猫超市、菜鸟、KEEP等已推出基于天猫精灵X1的语音应用,用户只需动动口就可以完成话费充值、购买商品等服务,很快还将上线打车、叫外卖、叫保洁等。
针对内容创作者,AliGenie还提供了语音公众号功能,开发者只需将语音或文字上传至后台就可以完成应用的创建和发布,文字将通过语音合成引擎转换为语音,用户可以通过订阅实现定时播放,点播,开发者也可以进行主动推送,或联合其他应用进行深入集成,组合播放,为内容创作者开辟了新的传播方式。
AliGenie开发者平台还为硬件制造企业准备了单麦克风到多麦克风阵列的参考设计方案,并提供包括唤醒词定制,声学结构,核心电路设计和芯片方案在内的相关套件的参考设计,以及云端服务和应用管理所必要的全套工具和用户APP SDK组件。接入的硬件设备能够快速具备人机语音交互能力,并共享应用商店的所有应用技能。
在发布会上,阿里人工智能实验室也公布了首个硬件开放合作伙伴——将与国际玩具巨头美泰合作探索其旗下主要核心IP如费雪、芭比、托马斯和朋友等智能玩具的合作开发机会。