中国高校课件下载中心 》 教学资源 》 大学文库

机器翻译研讨会(PPT讲稿)神经机器翻译前沿进展(PPT讲稿)

文档信息
资源类别:文库
文档格式:PPTX
文档页数:42
文件大小:2.97MB
团购合买:点击进入团购
内容简介
机器翻译研讨会(PPT讲稿)神经机器翻译前沿进展(PPT讲稿)
刷新页面文档预览

第十二届全国机器翻译研讨 2016年8月,乌鲁木齐 神经机器翻译前沿进展 刘洋

神经机器翻译前沿进展 刘洋 第十二届全国机器翻译研讨会 1 2016年8月,乌鲁木齐

机器翻译 ·目标:利用计算机实现自然语言的自动翻译 布什 与 沙龙举行 会谈 Bush held a talk with Sharon 2

机器翻译 • 目标:利用计算机实现自然语言的自动翻译 2 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon

发展历史 趋势:让机器更“自主”地学习如何翻译 规则 数据驱动 机器翻译 机器翻译 1980 1990

发展历史 • 趋势:让机器更“自主”地学习如何翻译 3 规则 机器翻译 统计 机器翻译 神经 机器翻译 1980 1990 2013 数据驱动 机器翻译 1990

数据驱动的机器翻译 核心问题:如何为翻译过程建立概率模型? X布什 与 沙龙举行 会谈 y/X; 0 y Bush held a talk with Sharon

数据驱动的机器翻译 • 核心问题:如何为翻译过程建立概率模型? 4 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon

统计机器翻译 ·隐变量对数线性模型:在隐式语言结构上设计特征 X布什 与 沙龙举行 会谈 Pyx)=∑ exp(·¢(x,y,z) >y∑xexp(·0(x,y,z) (Och and Ney, 2002 y Bush held a with Sharon

统计机器翻译 • 隐变量对数线性模型:在隐式语言结构上设计特征 5 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon (Och and Ney, 2002)

基于短语的统计机器翻译 ·短语翻译模型:以隐结构短语为基本翻译单元 布什与沙龙举行了会谈 布什 与沙龙 举行了会谈 Bush With Sharon held a talk Bush held a talk With Sharon Bush held a talk With Sharon (Koehn et al., 2003) 6

基于短语的统计机器翻译 • 短语翻译模型:以隐结构短语为基本翻译单元 6 布什 与 沙龙 举行 了 会谈 布什 与 沙龙 举行 了 会谈 Bush with Sharon held a talk Bush held a talk with Sharon Bush held a talk with Sharon (Koehn et al., 2003)

统计机器翻译的优缺点 优点 ·隐结构可解释性高 利用局部特征和动态规划处理指数级结构空间 缺点 线性模型难以处理高维空间中线性不可分的情况 ·需要人类专家设计隐式结构及相应的翻译过程 需要人类专家设计特征 离散表示带来严重的数据稀疏问题 难以处理长距离依赖

统计机器翻译的优缺点 • 优点 • 隐结构可解释性高 • 利用局部特征和动态规划处理指数级结构空间 • 缺点 • 线性模型难以处理高维空间中线性不可分的情况 • 需要人类专家设计隐式结构及相应的翻译过程 • 需要人类专家设计特征 • 离散表示带来严重的数据稀疏问题 • 难以处理长距离依赖 7

难点:长距离调序 held Bush President talk Sharon at Minister Israel the He ouse Prime 如何用上述词语拼成合理的译文?

难点:长距离调序 8 Bush President held a talk with Israeli Prime Minister Sharon at the White House 如何用上述词语拼成合理的译文?

统计机器翻译示例 Chinese 美国总统布什昨天在白宫与以色列总理沙龙就中东局势x 举行了一个小时的会谈。 English Yesterday, U.S. President George W. Bush at the White House with Israeli Prime Minister Ariel sharon on the situation in the middle east held a one-hour talks 9

统计机器翻译示例 9

深度学习带来新思路 nature full stop Is chosen (7, 72.,76. Overall, this process generates sequences of French words according to a probability distribution that depends on the English sentence. This rather naive way of performing machine translation has quickly become competitive with the state-of-the-art, and this raises serious doubts about whether understanding a sen- tence requires anything like the internal symbolic expressions that are manipulated by using inference rules. It is more compatible with the Yann Le cun Yoshua Bengio Geoffrey Hinton (Le Cun et al, 2015)

深度学习带来新思路 10 Yann LeCun Yoshua Bengio Geoffrey Hinton (LeCun et al, 2015)

刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档