你听不懂我的言语?SkypeTranslator现场翻译

2015-04-14 10:08 来源:电子信息网综合 作者:龙猫伞

随着交通的越来越便利,人们能踏足的地方也越来越远,但五花八门的语言使人们望而却步。然而几天之前微软旗下的Skype宣布,具备实时语音翻译技术的翻译器SkypeTranslator中文预览版正式在中国市场推出。使问题慢慢得到了解决。

作为一项长久愿望,在此前数十年时间,语音实时翻译的发展一直受到错误率高,麦克风敏感度差异,噪音环境等因素阻碍。但近些年来,由于大数据的涌现,这项技术取得了不错的进展。而SkypeTranslator更是凝聚了微软在语音识别,自动翻译和机器学习等多领域的成果。

简单地说,SkypeTranslator的翻译逻辑主要分为三步:将你的实时语音转成文字;将文字翻译成另一种语言的文字;将文字转成语音。其中,识别实时语音并转成文字是最棘手的部分。

如你所知,精确的实时语音翻译有赖于强大的机器学习——也就是软件学习训练数据的能力。这些训练数据包括翻译的网页,配有字幕的视频,以及预先翻译且转录成文字的一对一谈话。事实上,已有不少人分享了他们过去的对话记录。SkypeTranslator通过记录对话来分析文本并训练系统更好地“学习”语言——当准备好的数据录入系统后,机器学习软件会在这些对话和环境涉及到的单词中搭建一个统计模型,当你说话时,软件会在统计模型中寻找相似内容,然后应用到预先“学到”的转化程序中,得以让语音转换为文本,再从文本转换成另一种语言。

值得一提的是,与程序设定一般的朗诵不同,人会一边思考一边说话,会犯错,这种犯错在口语表达中的体现就是打磕巴,停顿,重复,或者频频出现如“嗯”“啊”“呃”之类的语气助词,针对于此,SkypeTranslator的机器学习模型也会处理这些停顿。在预览版中,用户可以看到部分语气词停顿被移除,而未被移除的部分则可能通过用户反馈进行再优化。

目前看来,实时语音翻译技术并不完美,它是一项不断优化的技术。每个国家的语言,时刻都在变化,哪怕同一国家,因地域不同也有不同口音。这些问题可以通过更大范围的数据解决么?也许能,但还需要时间。

SkypeTranslator

相关阅读

暂无数据

一周热门