一场没有手机的锤子发布会,唯一的亮点就是它了!

2018年11月7日 12时25分 100000+ 来源:躺倒鸭


看了今天鸭鸭的头条的话,你们一定都知道,我去成都参加锤子发布会了。


老罗现实重新定义了“19:30”,姗姗来迟,发布了三款新品(具体的去看今天头条),等发布会结束已经是晚上十点多,我在成都的夜风里思考夜里该怎么撸这篇稿子,毕竟都不是……很好写。最有记忆点的大概是“耿大卫”了,哦,简单介绍一下,它是锤子刚发布的智能音箱(虽然看着像保温杯多一点)



还给智能音箱配了个遥控器,会玩……



老罗说“耿大卫”能颠覆用户对“智能音箱”的认知,首先它可以自定义唤醒词,这很好理解,我们可以给自己的音箱取个性化的名字,不再是传统的“小ai同学”、“天*精灵”,这倒不算什么创新。


这个音箱另一个被“吹爆”的功能是定制个性化的语音交互,想做点跟其他智能音箱不一样的东西。现在市面上,很多智能音箱只能用一种声音对话,不少评测人都说“听起来呆呆的”,总觉得家里有个陌生人。既然是智能的,那可以变换声音吗?



老罗带来的这款智能音箱就演绎了自己是如何“时男时女”、“刚柔并济”,耿大卫能变成何希瑞……



让音箱能够使用多种音色发音,这玩法不错,但老罗又卖了关子:音箱好玩吧?最快明年就能跟大家见面了!


这还要等?这类语音技术不是早就有了吗,而且不用花钱买智能音箱,直接就能免费用啊。


大家还记得我上周刚推荐过一款刷爆朋友圈的亲子伴读产品——呀呀伴读,它运用了讯飞个性化语音合成技术,父母花费5分钟朗读一段文字,就可以完整定制自己的声音,自动用父母的声音给宝宝讲故事、朗读绘本,同时具备专业声优的抑扬顿挫和感染力。


(呀呀伴读下载二维码)


当时很多孩子爹妈留言大呼“太需要了”、“解脱了”、“孩子真的听‘我’读故事的声音睡了”……


类似的语音合成产品讯飞还有很多,毕竟科大讯飞在2016年就掌握并应用了个性化语音合成技术,并且利用这个技术打造出多个经典案例,大家可以看视频简单感受一下“智能声优”的魅力:



语音合成最为大众所熟知的有高德地图里的明星导航:甜美的志玲姐姐、耿直的黄晓明、青春洋溢的TFBOYS等,用他们声音的路况播报并不是每字每句提前录好的,而是通过合成明星个人音库来实现的。


去年过年大家抖音上抢过大牌明星发的红包吗?比如何老师发红包时,会念出用户的昵称送上祝福,这当然不是何老师在手机另一边直播“点名”,而是要归功于高品质的语音合成嵌入。



虚拟主持人“康晓辉”与记者在CCTV特别报道《直播长江》现场对话互动等实例,这些都运用了讯飞个性化语音合成技术。



除了上述之外,这项技术在二次元界也颇为吃香,腾讯地图里的王者荣耀妲己,二次元虚拟偶像赫兹,咪咕阅读里的楚楚,均通过讯飞个性化语音合成进行专属定制,他们都能开口说话了!



不同于传统的语音合成基于拼接方法,所合成出来的声音自然度和舒适度存在这样那样的缺陷,讯飞的语音合成效果更逼真生动,这是因为科大讯飞研发团队受到深度神经网络为代表的智能语音技术的启发,进行端到端的语音合成研究,直接根据文本生成音频。


这种新的合成方式,不光解决了以前花费很多人力去做分析,并从中提取特征的工作量,更重要的是以大数据驱动技术的方式,通过机器深度挖掘语音语言特性,利用声学模型和文本处理模型进行训练。在可懂度、自然度、承载情感信息等方面取得了良好的效果,具有媲美真人发音的表现力。


有点看不懂了是不是?直接体验一下你就懂了。


只需通过录入10段话的语音样本,即可获得个人或者亲友完整的声音库,从而能将书城内任意文字转化为个性化的声音:

(讯飞阅读下载二维码)


作为国内智能语音和人工智能的引领者,科大讯飞在这一领域的布局已早早展开。


2012年科大讯飞的语音合成技术首次在国际最权威的英文合成大赛“暴风雪竞赛”中超过了人类平均水平,自然度指标达到4.0分(5.0分是播音员水平),这是人类历史上第一次让语音合成机器开口说话像人类一样。


自2006年以来,科大讯飞连续第十三年取得该项评测的最好成绩。


2017年叮咚音箱2代发布,已具备自定义唤醒词,加入9种音色的发音功能,满足不同音箱用户的喜好。


十九年来,科大讯飞在智能语音和人工智能领域不断发力,在保持核心技术世界领先的同时,更坚持让应用踏踏实实的落地,持续用技术打磨体验。

当前,讯飞个性化语音合成技术已覆盖汽车地图导航、媒体制作、有声APP、智能硬件等领域。在自身技术和产品应用做大做强的同时,科大讯飞秉承开放合作的理念,共享产业资源和技术红利,让更多合作伙伴一起把个性化语音合成创造的极致体验带到大众身边。


看完还想花899买这个音箱吗,

没钱的点个赞吧!