以后飙车的时候可以听到志玲姐姐的声音:“我不是为了输赢,我就是认真”了,高德是如何把林志玲或者郭德纲的声音装进导航里的呢?难不成真是一句一句录下来的?

高德地图是如何把林志玲的声音装进导航里的

ZEALER向我们进行了揭秘,原来,语音导航内容可以分为两部分:简单的和复杂的。

简单的,比如直行、左转、掉头……真的就是罗永浩、林志玲亲自录下来的。

而比较长的句子则要用到TTS(Text To Speech)技术了,也就是文本转语音技术,包括Siri、谷歌翻译用的就是这一技术。通过计算机语音合成,可以将任意文本转换成具有高自然度的语音。

原理上,只要让林志玲姐姐把汉语中的21个声母、37个韵母、5个声调组合的不超过3000个语音全部录一次,播放时,再把每个字的语音串起来就可以了。

这就好比活字印刷术,志玲姐姐每个字的发音都是一个单字,TTS会把这些单字重新排列组合成导航里的长句子。

虽然组字成句听起来略显生硬,但随着TTS语音技术的发展,自然度已经越来越高了。

(编辑:899电脑网)