您的位置:首页 > 国内 > 定制化“AI爸妈”上线:小度AI语音交互深度渗透家庭场景

定制化“AI爸妈”上线:小度AI语音交互深度渗透家庭场景

2016年,美国一位科技记者James Vlahos,做了一件感动无数人的事。

他在父亲临终前几个月,下定决心要把父亲的声音和教诲永远留在身边。于是非技术背景的James在一个AI项目的帮助下,自学语音合成与机器学习。在父亲的帮助下,他每天录制父亲一到两个小时的声音,共记录了9万多个单词用来训练AI模型。最终完成了由父亲声音构成的,类似siri的语音助手,得以让James时时寄托哀思。

这个故事在感动了全球无数家庭的同时,也让AI开发者与技术人员看到了用AI语音定制化的重要意义。毫无疑问,全球众多家庭都在渴望着类似功能,无论是记录老人的声音,让自己的声音能够更多陪伴孩子成长,还是恋人之间的声音陪伴,家庭,正在成为AI语音技术应用场景的主战场。

这种需求也在不断受到产业界的重视。近来几年,语音合成、声音克隆等技术相继发展,自然语言处理整体能力也得到了突飞猛进的发展。AI语音定制化这件事,也早已不用耗时几个月,用数万条语料进行机器学习训练,而是真正的“飞入寻常百姓家”。

3月初,一直以技术领先著称的百度,在小度音箱中上线了语音定制功能。在小度APP中“爸妈讲故事”这个功能场景中,用户可以通过“一键录制专属语音”,录制自己和家人的语音包。

这是对话式AI硬件中,首次出现用户语音定制能力。当用户可以定制自己的语音包,让智能音箱不断传来自己的声音,众多行业规则似乎都在发生变化。

让我们从语音合成、对话式AI,以及智能语音硬件三者发展的合流中,审视一下进入AI语音定制时代的2020,可能发生的三个改变。

门槛已去:AI语音进入定制化时代

事实上,AI语音定制的能力,一直都处在AI行业与用户的高度期待里。一方面让AI模拟用户声音,关乎家庭、陪伴、记忆等诸多社会情感因素;另一方面熟悉的声音可能触发很多新的应用想象,比如你可能懒得打开音频课,但如果你的爱豆或者女神给你上音频课,你可能都懒得睡觉。

因此,AI语音定制的工程化与商业应用,始终被抱以高度期待。这条技术线索可以说是AI语音硬件,比如智能音箱、智能屏等产品持续发展的奇兵。

而AI语音定制的相关技术,在过去几年间迎来了不断降低门槛、提升应用规模的过程。James Vlahos用了9万多条语料进行机器学习训练,但如今只需要几分钟就可以训练出语义理解和自然语言处理效果远远超过siri的定制化语音模型。

近几年,随着技术的升级,定制用户语音的相关产业探索一直在前进。比如一个名为Revoice的公益项目,希望能够帮助渐冻症患者留住自己的声音;而汽车AI厂商Cerence在去年推出了创建用户声音语音助手的功能;微软的Custom Voice服务,可以一定程度上让用户声音成为小冰的语音。去年,“语音定制功能”开始被应用到地图场景,用户在百度地图APP上录制20句话,就能够生成个人完整语音包。

如今,定制化语音的功能来到了最复杂的AI场景里:对话式AI设备。

在小度语音定制功能中,用户进入小度APP,就可以在“爸妈讲故事”这个功能里录制自己的专属语音包。谈不上多复杂,3-5分钟就可以录好,录制的声音可以播讲大段的故事,并且语气、语调、顿挫感在百度的AI语音能力加持下非常逼真,没有异样感。

这意味着,AI定制语音的能力已经基本不再存在任何用户门槛,我们不用学习复杂的技术,浪费大量时间,忍受一次次的失败。用户将以非常简单的方式,就能够利用智能语音定制来展开实现家庭场景中的应用。语音定制的产业化通道也就此展开。

在另一条轨迹上,我们可以将其看作智能语音助手和对话式AI硬件的整体进化。

从2015年,亚马逊的Ehco诞生起,语音助手就处在用机器音一问一答的基本能力里。用户时常找不到继续说下去的动力。一问一答模式也与真人交互并不相似。

2019年,小度助手实现了全双工免唤醒能力,可以一次唤醒多次交互,终于让多轮对话在硬件中得以实现,聊天开始形似真人。

而AI语音定制的能力,或许可以看作2020年智能语音助手和相关硬件的又一次升级,用户可以借此实现千人千面的AI硬件,开发者有了新的开发基础。连锁发生的产业化影响也能够随之展开。

饭圈&家庭:两个场景的AI硬件或爆发

AI语音定制化带来的第一个改变,就是用户可能会重新开始思考自己如何应用对话式AI硬件,以及为什么购买相关产品。

有了AI语音定制能力后,有两个商业场景的改变是显而易见的。首先在家庭场景中,定制家人声音这一能力其实至关重要。因为家人的声音代表着陪伴、依靠和温暖,这是人之天性,无法在任何时代改变。用父母的声音给孩子讲故事、讲知识,让子女的声音在智能音箱中陪伴着父母,给父母报时间,念新闻。这些温暖的应用,是中国人的普遍需求,也是繁忙都市工作下的必然选择。

今天的情况就是一个很好的例证,疫情推迟了复工,这让很多父母有了更多时间陪伴孩子,从而产生了“疫情下的父母依赖”。但返工开始,父母不得已又将离开孩子怎么办?在智能音箱家庭使用场景下,语音定制功能就给出了一个选项。

另一方面,AI语音定制功能的更大红利还要看饭圈。这几天饭圈的能量之大,让整个社会颇为领教。那么让爱豆的声音不仅仅出现在地图导航,而是时时留存在智能产品中,与自己时时对话,聊天、讲故事、玩游戏——以此产生的购买力和再开发能力,简直不敢细想。

这两个场景在AI语音定制能力下,是最有可能快速呈现爆发的。而以此为基础,一波新的开发者红利即将上线。

泛化定制:AI语音开发者获得新船票

随着AI语音产业的成熟,开发者技术支持的日趋完备,已经有越来越多的声音博主、AI开发者,投身到AI语音生态的大潮中。而随着AI语音定制功能的上线,开发者的基础能力又得到了不小突破,“千人千声”的对话式AI设备不再仅仅是个产业想象。

AI语音开发者,或许很快就可以通过语音定制功能,获得“泛化定制”的全新机会。可以预见,AI语音定制将通过以下几种方式影响AI语音的开发空间与产业价值:

1、技能定制得到飞速发展。用家人的声音定制一个语音技能,甚至定制只有家庭成员、情侣之间、粉丝专属的语音技能,是一个广阔的产业想象力。很多语音技能在有了用户声音这个选项之后,将产生全面改变,可能影响到娱乐、家庭、教育、陪伴等多个场景。

2、生活场景定制成为重头戏。在智能家居、智能手机助手、智能穿戴设备中听到自己亲人、偶像的声音,是一件可以充满各种玩法的事情。开发者将可以借助各种硬件形态,挥洒AI语音定制的想象力。

3、“声音著作权”的无数新玩法。上面说过,AI语音定制能力的出现和普及,将让“高净值声音”成为一种新的版权资本。明星、偶像、公众人物,甚至特定领域网红的声音,将可以通过AI交互的形式普及到各种硬件中,造成内容产业与科技产业的又一个垂直风口。

能够规模化落地的AI语音泛定制应用、硬件,以及专属服务,是将用户、偶像、软件开发者和硬件品牌融合在一起的全新形式,由此激发的购买欲望和平台开发机遇,也许将是2020年的独特风景。

4、AI语音的社会价值与意义被重新估判。从James Vlahos的故事不难看出,AI语音定制能力,包含着深刻隽永的亲情关怀与家庭意义。人与人无法永远陪伴,但对方声音的智能化,却可以将很多重要的时刻与陪伴感放大。AI语音定制化的开发者们,接下来将可能担负起更多关于亲情、社会与陪伴的探索。从技术价值到社会价值,AI语音定制化的影响力也将以此被放大。

AI语音定制化,正在成为对话式AI硬件市场上新的驱动因素。细心观察近三年来的对话式AI硬件以及AI语音市场,就会发现市场的波动式增长,呈现与技术突破紧密契合的关系。在一种硬件形态处于草创阶段的时候,这种因技术而爆发的商业能量是产业常态。

换句话说,对话式AI打开的硬件市场,呈现这样的逻辑关系:技术能力突破代表着更好的用户体验,继而将直接催生市场回馈。在2019年,小度带来全双工免唤醒能力后,AI语音硬件市场一度解封了三足鼎立的形态,展现出小度独自向前大幅飞跃的局面。而AI语音定制化能力,作为与开发者、技能生态、内容生态联系更紧密的技术突破,显然将持续维护这种技术领先性,带来更多的市场回馈,以至于某种市场质变的临近。

基于“技术+生态=市场规模“的商业模型,我们就可以理解相对作为后来者的小度智能音箱,为什么能快速获得国内第一、世界前三的市场规模。

但不管最终是哪个平台获得最后的留场权,对于AI开发者来说,语音定制化能力带来的产业机遇都刚刚开始。千人千面的硬件,千变万化的应用,千方百计的技术突破,是我们最终想在新硬件形态上看到的结果。对于用户和AI开发者来说,2020年,将继续在智能语音的世界众里寻他千百度。

相关推荐

12.33亿元!顶固集创拟收购智能门锁品牌凯迪仕96.3%股权

2019年12月24日晚间,顶固集创发布公告称,拟以通过发行股份及支付现金的方式购买由苏祺云、蒋念根、徐海清、李广顺、建信远致、深圳领凯合计持有的凯迪仕96.2963%股权,股权作价约为12.33亿元。 值得注意的是,本次交易前,顶固集创持有凯迪仕3.7037%股权,本次交易完成后,顶固集创将累计持有凯迪仕100%股权。 据财报指出

2019-12-25
践行绿色环保 我们在路上

践行绿色环保 我们在路上

       3月21日上午,中铁电气化局第一工程有限公司上海分公司青年员工践行中国中铁绿色发展理念,参加上海市地方组织的生活垃圾分类宣传周启动仪式,并开展垃圾分类志愿宣传服务活动,分公司结合集团公司发展理念,为此次志愿活动制定“保护环境 为品质生活提速”主题。       垃圾

2019-03-22
100万的宝马旗舰SUV实车曝光 外观设计太个性

100万的宝马旗舰SUV实车曝光 外观设计太个性

此前,行车视线已经从经销商处获悉,全新宝马X7已经在国内开启了预定窗口,新车预计售价为100万元起。近日,我们又获得了一组新车在国内的无伪路试谍照。从外观设计上看,新车采用全新夸张的设计风格,特别是车头加大尺寸的进气格栅彰显出这款旗舰SUV的特性。在内饰部分,新车匹配了水晶档杆,豪华感更强。此外,新车有望

2019-03-26
弘扬浙菜文化:特种兵浙江招牌菜争霸赛正式启动

弘扬浙菜文化:特种兵浙江招牌菜争霸赛正式启动

“特种兵生榨椰子汁·2019浙江招牌菜争霸赛”启动仪式于3月26日下午在浙江广电集团举行。此次赛事由浙江广电集团、浙江省餐饮行业协会、浙江省饭店业协会、浙江商业职业技术学院指导,苏萨食品有限公司、特种兵生榨椰子汁、钱江台&钱江视频主办,只为“寻正宗浙味为欢聚喝彩”! (嘉宾集体倒“椰子汁”,预祝本次争霸大赛取

2019-04-02
中国牡丹的骄傲——高寒牡丹的-43℃之路

中国牡丹的骄傲——高寒牡丹的-43℃之路

  1993年,当赵潜龙第一次来到长春的时候,可能都没有意识到,这一次的到访对他、对甘肃牡丹乃至中国牡丹产业意味着什么。这一年赵潜龙第一次将甘肃牡丹种植在东北寒地上,以甘肃牡丹产业有限公司为主导的牡丹北移栽培试验正式拉开序幕。      -43℃,中川牡丹书写历史  1993年秋,赵潜龙第一次将200株中川

2019-04-09
主打低脂高蛋白,金锣健食力紧跟新消费群体需求

主打低脂高蛋白,金锣健食力紧跟新消费群体需求

  伴随着消费升级及从新晋消费主体90、95后的对账单中可以看出,目前国民消费需求已经悄然发生转变,理性健康消费的方式已然成为市场主流趋势。趋势往往能够催生多种商机,在肉制品行业领域,诸多企业已经开始对健康类肉制品趋之若鹜,并且借此加码布局中高端低脂产品领域。作为肉制品行业巨头之一,金锣集团紧跟新消费趋

2019-04-16
虽然改名为纳米音壳,但他们的初心未曾改变

虽然改名为纳米音壳,但他们的初心未曾改变

作为国内非常受欢迎的一支乐队,自由动机在今年年初正式确定改名为纳米音壳,这支成立20年的乐队为我们带来不少优秀作品,在创作上,他们不被风格束缚,不被规则禁锢,诸如《像在雨天》,《麦田往事》,《夏日晚风》都已经成为乐迷群体中传唱的经典。 用认真的态度做最细致的音乐,这就是他们做音乐的初心,不管是过去的自

2019-04-27
2019啪嗒碰偶像大赛精彩绝伦,还不来呐喊助威?

2019啪嗒碰偶像大赛精彩绝伦,还不来呐喊助威?

  2019年04月27日下午由南山区委宣传部、南山区文化广电旅游体育局支持,深圳市合纵文化发展有限公司主办的《2019啪嗒碰偶像大赛—四月份深圳赛区》在京基百纳广场(白石路)圆满结束,选手们用最好的状态呈现了一场精彩绝伦的“汇演”。  本次大赛一共29组参赛队伍,115位参赛选手带来了精彩纷呈的艺能演出,现场围观群众多

2019-04-30