《自然语言处理》课程教学资源(PPT课件讲稿)语言模型

语言模型
语言模型

大纲 概述 参数估计 基本平滑算法 其它平滑算法
大纲 • 概述 • 参数估计 • 基本平滑算法 • 其它平滑算法

概述
概述

噪声通道模型 原型 0,1,1,10,1,0, 通道 0.1.10.0.1.1.0 输入 (增加噪声) 输出 模型:出错的概率 举例:p(01)=0.3,p(1|1)=0.7,p(10)=0.4, p(O0=0.6 任务是: 已知带有噪声的输出 想知道输入是什么(也称为: Decoding)
噪声通道模型 • 原型 • 模型:出错的概率 • 举例:p(0|1)=0.3, p(1|1)=0.7, p(1|0)=0.4, p(0|0)=0.6 • 任务是: – 已知带有噪声的输出 – 想知道输入是什么(也称为:Decoding) 通道 (增加噪声) 0,1,1,1,0,1,0,1 0,1,1,0,0,1,1,0 输入 输出

噪声通道的应用 ·OCR 文本→打印(引入噪声,扫描→图像 手写识别 -文本→神经肌肉(引入噪声扫描→图像 语音识别 文本→朗读(引入噪声)→声学波形 机器翻译 目标语言→翻译(引入噪声)→源语言 其它:词性标注 词性序列→选择词形→文本
噪声通道的应用 • OCR – 文本→打印(引入噪声), 扫描→图像 • 手写识别 – 文本→神经肌肉(引入噪声), 扫描→图像 • 语音识别 – 文本→朗读(引入噪声) →声学波形 • 机器翻译 – 目标语言→翻译(引入噪声) →源语言 • 其它:词性标注 – 词性序列→选择词形→文本

:噪声通道:黄金规则 适用于OCR,手写识别,语音识别,机 器翻译,词性标注等各个问题 贝叶斯公式:P(AB)PBA)P(AP(B) Abest argmaxA P(BAP(A) P(BA)是声学图像翻译等模型 在不同领域用不同的术语来描述 P(A)是语言模型
噪声通道:黄金规则 • 适用于OCR,手写识别,语音识别,机 器翻译,词性标注等各个问题 • 贝叶斯公式:P(A|B)=P(B|A)P(A)/P(B) • Abest=argmaxA P(B|A)P(A) • P(B|A)是声学/图像/翻译等模型 – 在不同领域用不同的术语来描述 • P(A)是语言模型

什么是语言模型( Language Model) 模 模型是用来计算一个句子的概率的概率 例如:P(w1,w2,wy ·语言模型的用途 决定哪一个词序列的可能性更大 已知若干个词,预测下一个词 应用 语音识别 机器翻译 上下文敏感的拼写检查
什么是语言模型(Language Model) • 语言模型是用来计算一个句子的概率的概率 模型 – 例如:P(w1 ,w2 ,…,wn ) • 语言模型的用途 – 决定哪一个词序列的可能性更大 – 已知若干个词,预测下一个词 • 应用 – 语音识别 – 机器翻译 – 上下文敏感的拼写检查

应用于语音识别 有的词序列听起来很像,但并不都是正 确的句子 例子1: I went to a party Eye went two a bar tea 例子2: 你现在在干什么?√ 你西安载感什么?
应用于语音识别 • 有的词序列听起来很像,但并不都是正 确的句子 – 例子1: • I went to a party. √ • Eye went two a bar tea. – 例子2: • 你现在在干什么? √ • 你西安载感什么?

应用于机器翻译 给定一个汉语句子 例如:王刚出现在电视上 英文译文: Wang Gang appeared in TV In Wang gang appeared TV. Wang Gang appeared on TV
应用于机器翻译 • 给定一个汉语句子 – 例如:王刚出现在电视上。 – 英文译文: • Wang Gang appeared in TV. • In Wang Gang appeared TV. • Wang Gang appeared on TV. √

应用于拼写检查 举例 汉语 我自己知道 我自已知道 英语 Wang Gang appeared on tv.v Wang Gang appeared of Tv
应用于拼写检查 • 举例 – 汉语 • 我自己知道 √ • 我自已知道 – 英语 • Wang Gang appeared on TV. √ • Wang Gang appeared of TV
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 中国科学技术大学:《计算机文化基础》课程教学资源(PPT课件讲稿,共四章,李金龙).ppt
- 清华大学:《计算机导论》课程电子教案(PPT教学课件)第5章 程序设计知识.ppt
- 北京建筑大学:《计算机图形学》课程教学资源(PPT课件讲稿)第一章 绪论(吕书强).ppt
- 理论计算机科学(PPT专题讲稿)Topics in Theoretical Computer Science(Linear Programming).pptx
- 《C语言程序设计》课程电子教案(PPT课件讲稿)第9章 文件操作.ppt
- 香港科技大学:Recent Development of Heterogeneous Information Networks - From Meta-paths to Meta-graphs.pptx
- 西安培华学院:《计算机应用基础》课程教学资源(PPT课件讲稿)第1章 信息技术与计算机基础知识.ppt
- 同济大学:FWA for Noisy Optimization Problems(张军旗).pptx
- 南京大学:《编译原理》课程教学资源(PPT课件讲稿)第三章 词法分析.ppt
- 电子科技大学:《计算机操作系统》课程教学资源(PPT课件)第一章 操作系统引论.ppt
- 电子工业出版社:《计算机网络》课程教学资源(第五版,PPT课件讲稿)第五章 运输层.ppt
- 四川大学:《操作系统 Operating System》课程教学资源(PPT课件讲稿)Chapter 5 互斥与同步(Mutual Exclusion and Synchronization)5.1 Principles of Concurrency 5.2 Mutual Exclusion.ppt
- 中国科学技术大学:《计算机网络 Computer Networks(计算机通信网)》课程教学资源(PPT课件讲稿)Chapter 06 Internet Protocol.ppt
- 构建互联互通的单位局域网(PPT讲稿).ppt
- 安徽理工大学:《汇编语言》课程教学资源(PPT课件讲稿)第八章 输入输出程序设计.ppt
- 中国科学技术大学:《信号与图像处理基础 Signal and Image Processing》课程教学资源(PPT课件讲稿)空域滤波 Spatial Filtering.pptx
- 广西医科大学:《计算机网络 Computer Networking》课程教学资源(PPT课件讲稿)Chapter 03 Network Management and Operation(Network Architetures and Standarts).pptx
- 《电子商务实用教程》课程教学资源(PPT课件讲稿)第三章 网络营销.ppt
- 河南中医药大学:《网络技术实训》课程教学资源(PPT课件讲稿)第7讲 网络安全实训(主讲:许成刚).pptx
- 《计算机应用基础》工学结合配套课件(PPT讲稿)模块二系统软件操作技术(Windows XP的实用工具).ppt
- 《计算机网络》课程教学资源(PPT课件讲稿)第7章 运输层.ppt
- 河南中医药大学(河南中医学院):《计算机文化》课程教学资源(PPT课件讲稿)第八章 数字多媒体.ppt
- 丽水职业技术学院:《电子商务实训》课程教学资源(PPT课件讲稿)电子商务交易模式之“B2C”.ppt
- 中国科学技术大学:《数据结构》课程教学资源(PPT课件)第八章 查找表.pps
- 《数据结构》课程教学资源(PPT课件讲稿)第九章 排序 Sort.ppt
- 《微机原理》课程教学资源(PPT课件讲稿)第三章 寻址方式与指令系统.ppt
- 《数据结构和编程设计》课程教学资源(PPT课件讲稿)Chapter 1 Programming Principles.ppt
- 西安电子科技大学:人工神经网络(PPT讲稿)Artificial Neural Networks(Introduction).ppt
- A New Approach for Accurate Modelling of Medium Access Control(MAC)Protocols.ppt
- 贵州师范学院:《高级语言程序设计 Advanced Programming》课程教学资源(PPT课件讲稿)第9章 结构体.ppt
- 《大型机高级系统管理技术》课程教学资源(PPT课件讲稿)第3章 作业控制语言.ppt
- 厦门大学:《大数据技术原理与应用》课程教学资源(PPT课件讲稿)第九章 图计算.ppt
- 《微机原理笔记》课程教学资源(PPT课件讲稿)第6章 输入输出和中断技术.ppt
- 香港科技大学:Introduction to Software Defined Network(SDN).pptx
- 《高级语言程序设计 Advanced Programming》课程教学资源(PPT课件讲稿)第5章 循环结构程序设计.ppt
- 中国科学技术大学:《计算机科学导论》课程教学资源(PPT课件讲稿)第五讲 经典计算的计算模型(主讲:陈意云).pptx
- 华中师范大学:智能与分布计算(PPT课件讲稿)语义网与本体 Semantic Web & Ontology(Introduction).ppt
- 西安电子科技大学:《现代密码学》课程教学资源(PPT课件讲稿)第六章 数字签名算法.pptx
- 《Computer Networking:A Top Down Approach》英文教材教学资源(PPT课件讲稿,6th edition)Chapter 8 网络安全 Network Security.ppt
- 武昌理工学院:《操作系统原理》课程教学资源(PPT课件)第一章 操作系统概述(主讲:温静).pptx