东方财经网

首页 > 汽车 > 正文

最像真人的车载AI语音什么样?小鹏P7告诉你

在小鹏汽车P5亮点解析文章中我曾说过,智能驾驶和智能交互系统是智能汽车的重要组成因素。在智能驾驶层面,小鹏汽车P7拥有L2+级驾驶辅助系统。而智能交互系统中,它拥有全场景连续对话、全系统功能覆盖以及语音技能自定义,强大的功能使其拥有良好的使用体验,但小鹏汽车似乎并不满足于此。

  7月24日,小鹏汽车召开了智能交互系统的品鉴活动。本次活动重点和语音识别成功率无关,更多地是聊小P搭载的全新车载AI语音系统能带来哪些不同的体验。话不多说,我们一同来看看与“真人”相同的AI语音都有哪些亮点。

  如何评价与“真人”媲美的声音?

  没有对比何谈胜负,想要评价小鹏汽车全新车载AI语音系统固然需要与其它产品比较,但对比过程中往往会因主观情感的介入影响客观判断。为此,小鹏汽车开展了“盲测”与“众测”两大环节。“盲测”环节以听声为主,通过扬声器感受智能交互系统的声音,并予以评分。“众测”环节为公开对比,体验多款产品并进行打分。

  实际体验后,小P的新声音与以往的机械式语音完全不同。它不仅像人类声音般生动自然、充满生命力,还非常细腻动听,能通过语气和语态表达更多人类情绪,独特的沉浸感宛如少女在耳边交谈一般。不过,实际体验仅能代表个人观点,缺乏绝对说服力。为此,小P的新声音还参加了MOS语音质量评测(分数越高越接近人声),最终获得4.49分的评分(满分为5分)。

  音质为何有如此巨大的提升?

  以往的声音采用小型离线拼接引擎合成,声音会产生明显的机械感或者跳音等不平衡感,最终导致语音与真人声音相差甚远。而小P的新声音采用全新一代超大规模在线神经网络引擎+小型离线拼接引擎制作,带来停顿音律更自然、更有亲切感的高保真HIFI音质。

  在音质内存方面,旧声音一秒为16K,而小P的新声音一秒高达24K,两者内存占用率相差33%。当新旧声音对比来听,就能体验到非常明显的差距。

  小P的新声音能带来哪些不同?

  回到体验层面,用户能感受到的只是更真实、更优质的新声音吗?不完全是。按照小鹏汽车的规划,未来新声音还有更多玩法。小P将拥有更多的情绪,像人类一样会欢喜、会忧愁、会羡慕、会热爱,能和用户产生更多情感共鸣,还有很多意想不到的情绪彩蛋。

  由此可见,小P的新声音就像与用户相伴的朋友。用户能感受到它的情绪变化,它也能通过不同的情绪向用户表达喜怒哀乐。或许,它会成为与用户共享快乐的旁听者,又或是聆听失落的陪伴者。总之,它的存在会让用车生活更有乐趣。

  高效的语音交互得以延续:

  智能座舱最大的亮点是全场景对话带来的智能化交互体验,它能对来自主/副驾位置的指令做出不同反应,清晰分辨真实需求与正常聊天内容,不用担心答非所问与误唤醒等问题出现。在本次“众测”环节中,小P面对40条不同指令时共执行了37条指令,为时1分钟内共执行14条指令。高识别率与高效的反馈效率是小P的优势,也是它深得用户喜欢的原因。

  写在最后:或许很多朋友都使用过智能交互系统,但较低的识别率让多数朋友离它而去。其实在本次活动前,我也对智能交互系统持有保留意见,认为物理按键才是最经典、最好用的设计。但体验过后却发现,小P拥有很高的指令识别成功率,且新声音带来了更加完美的体验。值得注意的是,当小P新声音登陆市场后,老用户可通过OTA升级获得“小姐姐”无微不至的关照。