机器翻译研讨会(PPT讲稿)神经机器翻译前沿进展(PPT讲稿)

第十二届全国机器翻译研讨 2016年8月,乌鲁木齐 神经机器翻译前沿进展 刘洋
神经机器翻译前沿进展 刘洋 第十二届全国机器翻译研讨会 1 2016年8月,乌鲁木齐

机器翻译 ·目标:利用计算机实现自然语言的自动翻译 布什 与 沙龙举行 会谈 Bush held a talk with Sharon 2
机器翻译 • 目标:利用计算机实现自然语言的自动翻译 2 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon

发展历史 趋势:让机器更“自主”地学习如何翻译 规则 数据驱动 机器翻译 机器翻译 1980 1990
发展历史 • 趋势:让机器更“自主”地学习如何翻译 3 规则 机器翻译 统计 机器翻译 神经 机器翻译 1980 1990 2013 数据驱动 机器翻译 1990

数据驱动的机器翻译 核心问题:如何为翻译过程建立概率模型? X布什 与 沙龙举行 会谈 y/X; 0 y Bush held a talk with Sharon
数据驱动的机器翻译 • 核心问题:如何为翻译过程建立概率模型? 4 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon

统计机器翻译 ·隐变量对数线性模型:在隐式语言结构上设计特征 X布什 与 沙龙举行 会谈 Pyx)=∑ exp(·¢(x,y,z) >y∑xexp(·0(x,y,z) (Och and Ney, 2002 y Bush held a with Sharon
统计机器翻译 • 隐变量对数线性模型:在隐式语言结构上设计特征 5 布什 与 沙龙 举行 了 会谈 Bush held a talk with Sharon (Och and Ney, 2002)

基于短语的统计机器翻译 ·短语翻译模型:以隐结构短语为基本翻译单元 布什与沙龙举行了会谈 布什 与沙龙 举行了会谈 Bush With Sharon held a talk Bush held a talk With Sharon Bush held a talk With Sharon (Koehn et al., 2003) 6
基于短语的统计机器翻译 • 短语翻译模型:以隐结构短语为基本翻译单元 6 布什 与 沙龙 举行 了 会谈 布什 与 沙龙 举行 了 会谈 Bush with Sharon held a talk Bush held a talk with Sharon Bush held a talk with Sharon (Koehn et al., 2003)

统计机器翻译的优缺点 优点 ·隐结构可解释性高 利用局部特征和动态规划处理指数级结构空间 缺点 线性模型难以处理高维空间中线性不可分的情况 ·需要人类专家设计隐式结构及相应的翻译过程 需要人类专家设计特征 离散表示带来严重的数据稀疏问题 难以处理长距离依赖
统计机器翻译的优缺点 • 优点 • 隐结构可解释性高 • 利用局部特征和动态规划处理指数级结构空间 • 缺点 • 线性模型难以处理高维空间中线性不可分的情况 • 需要人类专家设计隐式结构及相应的翻译过程 • 需要人类专家设计特征 • 离散表示带来严重的数据稀疏问题 • 难以处理长距离依赖 7

难点:长距离调序 held Bush President talk Sharon at Minister Israel the He ouse Prime 如何用上述词语拼成合理的译文?
难点:长距离调序 8 Bush President held a talk with Israeli Prime Minister Sharon at the White House 如何用上述词语拼成合理的译文?

统计机器翻译示例 Chinese 美国总统布什昨天在白宫与以色列总理沙龙就中东局势x 举行了一个小时的会谈。 English Yesterday, U.S. President George W. Bush at the White House with Israeli Prime Minister Ariel sharon on the situation in the middle east held a one-hour talks 9
统计机器翻译示例 9

深度学习带来新思路 nature full stop Is chosen (7, 72.,76. Overall, this process generates sequences of French words according to a probability distribution that depends on the English sentence. This rather naive way of performing machine translation has quickly become competitive with the state-of-the-art, and this raises serious doubts about whether understanding a sen- tence requires anything like the internal symbolic expressions that are manipulated by using inference rules. It is more compatible with the Yann Le cun Yoshua Bengio Geoffrey Hinton (Le Cun et al, 2015)
深度学习带来新思路 10 Yann LeCun Yoshua Bengio Geoffrey Hinton (LeCun et al, 2015)
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《计算机操作系统》课程PPT教学课件(讲稿)第六章 文件管理.ppt
- 厦门理工学院:《网页设计》培训课件教学资源(PPT课件).ppt
- 《数字图像处理》课程教学资源(PPT课件讲稿)第5章 图像编码与压缩.ppt
- 香港浸会大学:Community Search over Big Graphs:Models, Algorithms, and Opportunities.ppt
- 清华大学出版社:《JAVA程序设计实例教程》课程教材电子教案(PPT课件讲稿,共七章,主编:关忠).ppt
- 香港中文大学:Arm board tutorial Part 1 Using the ARM board And start working with C Tutorial 5 and 6.pptx
- 同济大学:《大数据分析与数据挖掘 Big Data Analysis and Mining》课程教学资源(PPT课件讲稿)Evaluation & other classifiers.pptx
- 面积对象编程(PPT讲稿)Object-Oriented Programming and Classes.ppt
- 《计算机网络概述》教学资源(PPT课件讲稿).ppt
- 《计算机组成原理》课程PPT教学课件(讲稿)第三章 计算机核心部件及其工作原理.ppt
- 《大型机系统管理技术》课程教学资源(PPT课件讲稿)第2章 大型服务器外存管理.ppt
- 《ARM嵌入式软件开发》课程教学资源(PPT课件讲稿)第三章 ARM体系结构及编程模型.ppt
- 北京大学:基于信息利用的烟花算法研究(PPT讲稿)Research on Fireworks Algorithms from the Perspective of Information Utilization.pptx
- 系统编程工具REXX和CLIST.ppt
- 《软件测试 Software Testing》教学资源(PPT讲稿)Part 1 The Big Picture.ppt
- 西南民族大学:软件需求分析与总体设计(PPT讲稿,主讲:殷锋).ppt
- 中国地质大学(武汉):R语言入门教程(PPT讲稿).ppt
- 对外经济贸易大学:《大学计算机基础》课程电子教案(PPT课件)第5章 PowerPoint幻灯片制作(PowerPoint 2010).pptx
- 西安培华学院:《计算机网络工程》课程教学资源(PPT课件讲稿)第1章 网络工程知识(主讲:张伟).ppt
- 《计算机网络安全》课程教学资源(PPT课件讲稿)第四章 数据加密技术.ppt
- 山东大学:《微机原理及单片机接口技术》课程教学资源(PPT课件讲稿)第三章 计算机系统的组成与工作原理 3.1 理解模型机的结构及工作过程 3.2 掌握单片机的结构.ppt
- 清华大学出版社:《计算机导论 Introduction to Computer Science》课程配套教材教学资源(PPT课件讲稿,第3版)第4章 操作系统与网络知识.ppt
- 《数据库系统原理》课程PPT教学课件(SQLServer)第7章 Transact-SQL程序设计.ppt
- 《Chemdraw 软件教程》教学资源(PPT讲稿)第一部分 ChemDraw简介.ppt
- 北京大学:计算智能实验室(PPT讲稿)烟花算法算子分析.pptx
- 上饶师范学院:《数据库系统原理 An Introduction to Database System》课程教学资源(PPT课件讲稿,共九章).ppt
- 清华大学:《数据中心网络 Data Center Networking》课程教学资源(PPT课件讲稿).pptx
- 人工神经网络(ANN)方法简介(PPT课件讲稿).ppt
- 合肥工业大学:使用大数据进行计算建模(PPT讲稿)Computing/Modeling with Big Data(主讲:吴信东).pptx
- 《模式识别》课程教学资源(PPT讲稿)Learning with information of features.ppt
- 烟台大学:《C语言程序设计》课程电子教案(PPT课件讲稿)第五章 数组、字符串、指针(主讲:荆蕾).ppt
- 《数据结构》课程教学资源(PPT课件讲稿)第六章 树与二叉树.ppt
- 南京大学:《计算机图形学》课程教学资源(PPT课件讲稿)第6讲 图形观察与几何变换.pptx
- 《高级软件工程》课程教学大纲 Advanced Software Engineering.doc
- 《Android 程序设计基础》课程教学资源(PPT课件讲稿)第8章 数据存储和访问.ppt
- 新乡学院:《PHP动态网站开发》课程教学资源(教学大纲).pdf
- 南京大学:《面向对象技术 OOT》课程教学资源(PPT课件讲稿)构件化软件 Component Software.ppt
- MSC Software Corporation:Dynamic System Modeling, Simulation, and Analysis Using MSC.EASY5(Introductory Class).ppt
- 南京航空航天大学:《C++》课程电子教案(PPT课件讲稿)第2章 文件操作.pptx
- 《Java面向对象程序设计》课程教学资源(PPT课件讲稿)第四章 Java图形用户界面设计 4.3 事件处理.pptx