亚马逊开发出有史以来最大的文本转语音模型
原创150****18802024-02-20 10:39
2月18日消息,据外媒报道,亚马逊的一个人工智能研究团队宣布,他们开发出了有史以来最大的文本转语音模型。所谓“最大”,是指拥有最多的参数,使用最大的训练数据集。外媒报道称,这个名为BASE TTS的新模型拥有9.8亿个参数,在同类产品中最大,在规模和能力上都超越了之前的迭代版本。它使用了10万个小时的录音来进行训练,其中大部分为英语语音,但也包括德语、荷兰语和西班牙语,这使它成为自然语音的新标准。研究人员表示,尽管遇到了文本转语音引擎固有的困难,如发音错误或语调错误,但该模型在处理复杂的语言结构方面表现出了非凡的能力。研究人员进一步指出,与之前的文本转语音模型相比,该模型提高了单词的发音质量。外媒称,这一突破标志着文本转语音技术的发展向前迈出了重要的一步,在不久的将来有可能得到广泛的应用。然而,该团队表示,为了避免滥用,BASE TTS不会向公众发布。相反,他们计划把它作为一种学习应用。(文章转自网络)
免责申明:网站文章均由网站用户自行通过本网站系统平台投稿编辑整理发布,仅供学习与参考,不代表本网站赞同其观点和对其真实性负责。如有侵犯您的版权,请联系我们,我们将及时删除。
《挑战奥美》作家:李刚 买卖广告我推荐传播易