谷歌旗下的人工智慧公司DeepMind又取得突破。继AlphaGo赢了人类棋手后,他们又研制出了能够生成模仿人类语音的系统,该系统让机器说话与人类说话之间的差距缩小了50%。DeepMind将这个系统命名为Wavenet。

让人能与机器对话一直是人类希望在人工智慧领域里实现的目标。但是 ,目前用计算机生成语音仍然大量地依赖于TTS(文本到语音)拼接技术。在这个过程中 ,机器首先要记录一个说话人的声音片段,并基于此构建超大型的资料库,随后,经过再次结合过程,形成完整的表达。

这样一来,在不记录一个完整的新资料库的情况下,要修饰声音就会变得很困难(比如,转化到不同的说话者,或者转化语音中的情感和语气)。

WaveNet改变了这种旧范式,它直接对原始声音信号的声浪建模,每次对一个样本进行建模。和生成更加自然的语音一样 ,使用原始的声波意味着WaveNet能对任何音频建模 ,其中包括音乐。(云南信息报据澎湃)

迎泽区 | 北京凯利兴城全屋定制官网 | 深圳市 | 深圳市 | 商标转让_中国时代商标转让网_顶级商标转让 | 至德 | 机床附件 | 纺织 | 汽车用品 | Ready