- A+
翻开网易新闻 查看精彩图像
据国外媒体报导,vocalize.ai的实验室早年对亚马逊的语音辅佐alexa、苹果的语音辅佐siri和谷歌的语音辅佐谷歌 assistant进行了一项语音辨认才能查验。研讨人员别离运用美国、印度、我国三个不一样国家的口音英语对这三种语音辅佐进行了查验。来检测这些语音辅佐对口音英语的了解程度。
翻开网易新闻 查看精彩图像
成果发现,谷歌 assistant有了解我国口音英语方面完全跨越了其它两种语音辅佐。呈现这种成果的首要缘由是谷歌 assistant学习了我国口音英语数据而其他两种语音辅佐并没有学习。
作为一种世界通用言语,不一样区域的英语口音存在较大间隔是很正常的,有的当地英语口音大到听起来完全就是两种言语。假定ai不对不一样区域的英语口音进行学习,很有可以闹出大乌龙。
无特有偶,上一年印度空军就发现了从法国订购的“阵风”战争机听不理解印度英语致使“阵风”的语音辨认体系无法辨认印度飞翔员的指令,甚至发生误判了。
翻开网易新闻 查看精彩图像
印度“阵风”战争机无法辨认
印度英语
最根柢缘由就是“阵风”战机的语音辨认体系没有将各种不一样言语和方言归入数据库,在飞翔进程中,飞翔员很有可以因为发音不可标准,构成语音辨认体系无法辨认甚至误判。为了避免因为口音疑问呈现误判,现代战争机的语音控制体系都有必要经过长时刻的调试、改进和
晋级,才干够满足需要。
其时期间,标准英文asr体系现已可以获得较高的辨认正确率,满足必定场景的商用需求,可是带有口音标示的语音数据的短少严峻捆绑了口音英语辨认有关研讨的打开。
作为全球抢先的人工智能数据效能效能商,数据堂已搜集数十个国家和区域的口音英语数据集,能快速前进口音英语辨认模型的辨认精准度。
多国人员音英语数据集
我国人员音英语数据集
3000余名名我国人参加录制的10万句常用英语句子,掩盖国内江苏、山东、北京、河南等方言区,契合我国人说英语的特定口音。录音文本包括常用英语句子,内容丰厚,领域广泛,音素均衡。可用于改进语音辨认体系对我国人说英语的辨认作用。
美式英语口音数据集
近2000余名美国母语发音人参加录制,口音正宗。录音文本由言语专家参加方案,以交互场景为导向,包括交互、车载、家居、通用等多品种,内容丰厚。文本经过人工校正,精确率高。
英式英语口音数据集
由1651名英国本乡发音人参加录制,口音正宗。录音文本包括通用、交互、车载、家居等多品种,内容丰厚。文本经过人工校正,精确率高。
德国人员音英语数据集
1000余名德国人参加录制,口音正宗。录音文本由言语专家参加方案,包括通用、交互、车载、家居等多品种,内容丰厚。文本经过人工校正,精确率高。匹配干流安卓、苹果体系手机。可用于语音辨认、声纹辨认模型练习、机器翻译语料库的缔造或算法研讨。
法国人员音英语数据集
1000余名法国人参加录制,音频内容包括通用、交互、车载、家居等多品种,内容丰厚。掩盖18~60岁年纪段,在恬静室内进行录制。可使用于语音辨认、机器翻译等场景。
印度英语口音数据集
近2000余名印度本乡发音人参加录制;录音文本由言语专家参加方案,包括通用、交互、车载、家居等多品种;文本经过人工校正,句精确率95%,可使用于语音辨认、机器翻译、声纹辨认。
数据堂已搜集英国、美国、我国等数十个国家和区域的多国人员音英语数据,掩盖了各种发音特征、口音轻重,并结束对数据集的音标、重音标示
、韵律标示,可以加强英文语种辨认、口音语音辨认的研讨交流。
翻开网易新闻 查看精彩图像
口音英语搜集国家与区域别布
数据堂一向以最高标准需求自个,据守并践行维护用户利益、维护数据平安、尊敬用户隐私的承诺,现已过iso27701、iso27001隐私信息打点体系认证以及iso9001质量打点体系认证,值得信赖。
翻开网易新闻 查看精彩图像
假定以上数据不能满足您其时的需要,数据堂还可以关于特定人群、特定场景、特定语种供给相应的数据定制化效能,全力协助客户得到满足的数据效能。