近千小时的语音数据积淀,领跑同行

2018-06-17来源 : 互联网

标贝科技认为,要想让机器的声音更贴近人类,需要从音库质量入手,录制足够多的**声音数据,从源头把控数据质量。今年年初,标贝科技推出了TTS评测系统,并针对语音合成系统提供了一整套TTS前端解决方案。

根据标贝科技相关负责人介绍,评测系统主要分为两大模块:合成缺陷度评测和合成自然度评测。在合成缺陷度方面,主要体现为韵律、多音字、数字符号及分词词性四个模块,而在合成自然度评测则包括ABX和MOS评测。这一系列的测评,**了数据处理的**度,成为语音数据质量的护城河。

除此之外,为了采集合适的人声作为语料,标贝科技的数据**需要和发声人做大量的前期沟通,指导发声人的说话风格、语调和停顿方式等,并在录音环境进行监听,**发音人的风格一致。

传统的语音语料数据处理需要人工进行标注,标贝科技则利用深度学习技术,通过计算机程序进行预处理,之后再由人工进行校正,极大缩短了处理时间。

在定制型音库方面,标贝科技已成功为用户提供了150小时的中文女声情感音库、350小时的中文女声音库、100小时的男声音库、80小时粤语语音库、50小时美语女声语音库、40小时的ToBI语音库、40小时模仿儿童语音库、30小时儿童语音库、20小时葡萄牙语音库、20小时台湾普通话语音库、10小时日语、10小时韩语以及20小时明星语音库等,音库还在不断丰富和积累中。

同时标贝科技还提供自有音库,中文男女声,美语男女声,儿童,粤语,台普、日语、韩语等及个性化音库,广大客户现已能直接使用整体解决方案。

在李秀林加入前,标贝专注于数据服务,凭借在数据加工处理方面的优势,致力于为客户提供快速、准确的专业数据服务,帮助客户盘活各类大数据资源,充分挖掘海量数据中有价值的信息。而现在,李秀林希望和标贝一道完成一次转型——从数据公司转为技术公司,为企业用户提供更垂直的合成服务。

标签: 语音数据积淀

联系电话:023-62873158      地址:重庆市渝北区金开大道68号3幢22-1

增值电信业务经营许可证:渝B2-20120016 渝ICP备11000776号-1 北京动力在线为本站提供CDN加速服务

Copyright©2004-2021 3158.CN. All Rights Reserved 重庆叁壹伍捌科技有限公司 版权所有

3158招商加盟网友情提示:投资有风险,选择需谨慎