推广 热搜: 军事  生活  教育  热点  时政  明星  医疗  汽车  房产  购物 

百度发布即时翻译“神器” 突破自然语言处理重大难关

   日期:2019-07-25 15:22:32     来源:主簿甄庄网    浏览:1307    评论:0    

不过,从1983年至1993年担任苹果首席执行官的斯卡利表示,投入健康医疗领域,受益的不仅仅是苹果,亚马逊也在为此做着准备。

9月19日,农民在云南省维西县永春乡的冰葡萄种植园内除草。 近年来,云南省维西傈僳族自治县永春乡大力发展冰葡萄产业,以“公司 合作社 基地 农户”的模式,推广冰葡萄规范化种植,助力贫困户脱贫。 新华社发(谢子艺 摄)

在机器同传领域,百度联合语音技术、机器翻译技术,从语音识别、翻译质量、时延、融合领域知识等方面推出了“一揽子”解决方案。

虽然机器同传有了新的突破,但它与经验丰富的同传人员相比,依然存在一定差距。百度翻译技术负责人表示,同传的目的并不在于取代人类译员,而是为了降低同传成本,让同传的应用范围更加广泛,也希望世界各地的人在AI的助力下早日实现“无障碍”交流。

两岸40年,可分三阶段

作为对外开放和商业国际化的需求之一,同声传译被广泛应用于政府间的峰会、多边谈判和其他商业场合,但是同传人员稀缺也成为了当前的棘手问题。为了解决全球范围内同传译员人数少、费用高等难题,越来越多开发者专注于机器同传的研发,百度也希望通过研发高质量机器同传技术和系统解决即时翻译难题。

在翻译质量方面,提出了“语音容错”的对抗训练翻译模型,根据语音识别模型常犯的错误,在训练数据中有针对性的加入噪声数据,使得模型在接受到错误的语音识别结果时,也能够在译文中纠正过来。比如,语音识别系统将“大堂”错误的识别为“大唐”,这一对噪声词将被自动收录到训练数据中,并将源语言句子“我们在酒店大堂见面吧”替换为“我们在酒店大唐见面吧”,而保持目标语言翻译不变“Let'smeetatthelobbyofthehotel”,同时将这两个中文句子用于训练,进而获得具有更强的容错能力模型。

异地考驾照不再需要居住证

↑7月26日,孙杨在训练中。 当日,孙杨与队友在香港体育学院进行训练,备战8月在印尼雅加达举行的2018亚洲运动会。 新华社记者卢炳辉摄

在同声传译时,经常会遇到不同领域的专业知识,这就要求同传人员在短时间内吸收大量相关领域的内容,这对他们也是极大地挑战。基于此,百度模仿人类同传的准备过程,提出了快速融合领域知识策略。该策略依托百度海量的互联网大数据,训练得到的具有通用翻译能力的模型;当它接到某一个领域的同传翻译任务时,系统会收集该领域数据并在通用模型的基础上进行增强训练,得到相应领域增的强模型;最后对该领域术语库进行强制解码,使专业术语翻译得准确可靠,且提升翻译效率。

在语音识别方面,区别于传统的上下文相关建模技术,百度提出了上下文无关音素组合的中英文混合建模单元,包含1749个上下文无关中文音节和1868个上下文无关英文音节。该方法具有泛化性能好、对噪声鲁棒、中英文混合识别等特点。

为了降低时延提升翻译质量,人类译员通常对演讲内容进行合理预测,百度开发人员从人类译员身上获得启示,研发了“wait-kwords”模型,可以根据历史信息,直接预测翻译中目标语言词汇。该模型在翻译质量和翻译延迟之间做出了很好的平衡,用户可通过根据实际需求设定延迟时间(例如延迟1(k=1)词或延迟5(k=5)词)。比如,法语和西班牙语这种较为接近的语言,延迟可设置在比较低的水平;但是,对于英语和汉语这种差异较大的语言,以及英语和德语这种词序不同的语言,延迟应当设置为较高水平,以便于更好的应对差异。

这帮人是真的狠

11月11日15时30分,乘客张某黛携带内藏一把长约10厘米水果刀的背包欲乘坐地铁,在北京地铁八通线管庄站东厅通过安检时被发现。她携带的刀具属于禁止带入地铁的器具,安检人员依据《北京市轨道交通运营安全条例》《北京市轨道交通禁止携带物品目录》之规定向其告知禁带理由,说明若坚持乘坐地铁则要自弃刀具,否则只能换乘其他交通工具。张某黛不以为然,在与安检员争吵一番后,拿起背包从东厅出站,又绕到西厅准备进站,结果再一次被安检员拦住。张某黛坚持要带着10厘米的水果刀进站,与安检员口角起来。

机器同传利用语音识别技术自动识别演讲者的讲话内容,将语音转化为文字,然后调用机器翻译引擎,将文字翻译为目标语言,显示在大屏幕或者通过语音合成播放出来。相比人类译员,机器最大的优势是不会因为疲倦而导致译出率下降,能将所有“听到”的句子全部翻译出来,这使得机器的“译出率”可以达到100%,远高于人类译员的60%-70%。同时,在价格上也占有优势。

据了解,本次任务是远望3号船今年第1次执行北斗型号任务,也是该船累计第34次执行北斗型号卫星任务。任务的成功标志着该船组取得了82次连胜,也实现了该船2019年首航任务全胜。任务结束后,远望3号船将返回港口进行补给。

中新网10月24日电人工智能领域,两种语言的“即时互译”是一项难以攻克的技术问题,其主要原因在于源语言和目标语言之间存在较大的词序和语序差异。近日,百度研发了具备预测能力和可控延迟的即时机器翻译系统,可实现两种语言之间的高质量、低延迟翻译。这是自然语言处理方面的重大技术突破,将对机器即时笔译和口译的发展起到极大地推动作用。

编辑 | 李博丹

蒙特卡罗开户

上一篇: 内蒙古自治区党委第五巡视组原组长杨静波被逮捕 下一篇: 高承一《九千米的爱情》开机 逐梦高空之旅将启程
 
打赏
 
同类资讯
推荐图文
推荐资讯
网站首页  |  广告招商  |  版权隐私  |  联系方式  |  关于我们  |  网站地图  |  RSS订阅

Copyright © 2013-2019. All Rights Reserved. 主簿甄庄网 版权所有