南京大学:《自然语言处理 Natural Language Processing(NLP)》课程教学资源(PPT课件讲稿)自然语言处理概述、基于规则(知识工程)的传统自然语言处理方法(理性方法)

自然语言处理 Natural Language Processing(NLP) 陈家骏,戴新宇 chenjionju. edu.cn daixinyu@nj u. edu. cn
自然语言处理 Natural Language Processing(NLP) 陈家骏,戴新宇 chenjj@nju.edu.cn daixinyu@nju.edu.cn

主要内容(1) 口自然语言处理概述 ■什么是自然语言处理 ■自然语言处理的典型应用 ■自然语言处理的基本任务 ■自然语言处理的基本策略和实现方法 ■自然语言处理的难点 ■自然语言处理所涉及的学科 (http://cs.nju.educn/chenjiajun/nlptraditional.ppt
主要内容(1) 自然语言处理概述 ◼ 什么是自然语言处理 ◼ 自然语言处理的典型应用 ◼ 自然语言处理的基本任务 ◼ 自然语言处理的基本策略和实现方法 ◼ 自然语言处理的难点 ◼ 自然语言处理所涉及的学科 (http://cs.nju.edu.cn/chenjiajun/nlp_traditional.ppt)

主要内容(2) 口基于规则(知识工程)的传统自然语言处理方法 (理性方法) ■基于词典和规则的形态还原(英语)、词性标注以及 分词(汉语、日语) ■基于CFG(上下文无关文法)和扩充的CFG(复杂特 征集、合一运算)的句法分析 ■基于逻辑形式和格语法的句义分析 基于规则的机器翻译 (http://cs.nju.educn/chenjiajun/nlp_traditional.ppt
基于规则(知识工程)的传统自然语言处理方法 (理性方法) ◼ 基于词典和规则的形态还原(英语)、词性标注以及 分词(汉语、日语) ◼ 基于CFG(上下文无关文法)和扩充的CFG(复杂特 征集、合一运算)的句法分析 ◼ 基于逻辑形式和格语法的句义分析 ◼ 基于规则的机器翻译 (http://cs.nju.edu.cn/chenjiajun/nlp_traditional.ppt) 主要内容(2)

主要内容(3) 口基于语料库的自然语言处理方法(经验方法) ■语言模型(N元文法) 分词、词性标注(序列化标注模型) ■句法分析(概率上下文无关模型) ■文本分类(朴素贝叶斯模型、最大熵模型) 机器翻译(Ⅰ BM Model等) (基于神经网络的深度学习方法)
基于语料库的自然语言处理方法(经验方法) ◼ 语言模型(N元文法) ◼ 分词、词性标注(序列化标注模型) ◼ 句法分析(概率上下文无关模型) ◼ 文本分类(朴素贝叶斯模型、最大熵模型) ◼ 机器翻译 (IBM Model等) ◼ ......(基于神经网络的深度学习方法) 主要内容(3)

自然语言处理概述
自然语言处理概述

什么是自然语言处理 口充分利用信息将会给人们带来巨大的收益,而大 量的信息以自然语言(英语、汉语等)形式存在。 口如何有效地获取和利用以自然语言形式出现的信 自然语言处理( Natural Language processing,简 称NLP)是指用计算机对自然语言信息进行处理的方法 和技术。 口与NLP相近的两个研究领域: ■自然语言理解( Natura| Language Understanding, NLU):强调对语言含义和意图的深层次解释。 计算语言学 Computational Linguistics,CL):强调 可计算的语言理论
什么是自然语言处理 充分利用信息将会给人们带来巨大的收益,而大 量的信息以自然语言(英语、汉语等)形式存在。 如何有效地获取和利用以自然语言形式出现的信 息? ◼ 自然语言处理(Natural Language Processing,简 称NLP)是指用计算机对自然语言信息进行处理的方法 和技术。 与NLP相近的两个研究领域: ◼ 自然语言理解(Natural Language Understanding, NLU):强调对语言含义和意图的深层次解释。 ◼ 计算语言学(Computational Linguistics, CL):强调 可计算的语言理论

NLP技术的典型应用 口机器翻译 口自动摘要 口文本分类与信息过滤 口信息检索 口自动问答 口情感分析 口信息抽取
NLP技术的典型应用 机器翻译 自动摘要 文本分类与信息过滤 信息检索 自动问答 情感分析 信息抽取

机器翻译( Machine translation) 口机器翻译( Machine translation,简称MT)是指 利用计算机实现自然语言之间的自动翻译 ■是最早的计算机应用之 分为:文本机器翻译和语音机器翻译 口机器辅助翻译( Machine Aided translation或 Computer aided Translation,简称MAT或CAT) ■翻译记忆体( Trans| ation Memory,简称TM) ■双语对照的译后编辑
机器翻译(Machine Translation) 机器翻译(Machine Translation,简称MT)是指 利用计算机实现自然语言之间的自动翻译。 ◼ 是最早的计算机应用之一 ◼ 分为:文本机器翻译和语音机器翻译 机器辅助翻译(Machine Aided Translation或 Computer Aided Translation,简称MAT或CAT) ◼ 翻译记忆体(Translation Memory,简称TM) ◼ 双语对照的译后编辑 ◼

自动摘要( Text summarization) 口利用计算机自动地从原始文档中提取全面、准确 地反映该文档中心内容的简洁、连贯的短文。 应对信息过载 分为单文档摘要和多文档摘要
自动摘要(Text Summarization) 利用计算机自动地从原始文档中提取全面、准确 地反映该文档中心内容的简洁、连贯的短文。 ◼ 应对信息过载 ◼ 分为单文档摘要和多文档摘要

文本分类( Text classification) 口将一篇文档归于预先给定的一个类别集合中的某 类或某几类 ■图书馆的图书分类 网页分类 ■信息过滤
文本分类(Text Classification) 将一篇文档归于预先给定的一个类别集合中的某一 类或某几类。 ◼ 图书馆的图书分类 ◼ 网页分类 ◼ 信息过滤 ◼
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 西安电子科技大学:《操作系统 Operating Systems》课程教学资源(PPT课件讲稿)Chapter 06 文件系统 File Systems(主讲:高海昌).ppt
- 香港大学:Data Analysis - Factors Potentially Affecting Development.pptx
- 北京大学:《高级编译技术 Advanced Compiler Techniques》课程教学资源(PPT课件讲稿)Introduction to Optimizations.ppt
- 南京大学:《编译原理》课程教学资源(PPT课件讲稿)第四章 语法分析(戴新宇).pptx
- 《计算机组装与维修》课程教学资源(PPT课件讲稿)第十三章 局域网维护及常见故障处理.ppt
- 北京大学:《软件需求工程》课程教学资源(PPT课件讲稿)第十章 软件需求开发与管理工具.ppt
- 中国科学技术大学:《网络信息安全 NETWORK SECURITY》课程教学资源(PPT课件讲稿)第二章 数据加密技术基础.ppt
- 《汇编语言》课程教学资源(PPT课件讲稿)第6章 子程序.ppt
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)MSI、MESI、分布式共享存储器体系结构、Models of Memory Consistency.pptx
- 《数据库系统概论》课程教学资源(PPT课件讲稿)第六章 数据库设计.ppt
- 电子科技大学:《汇编语言程序设计》课程教学资源(PPT课件)第一章 基础知识(主讲:詹瑾瑜).ppt
- 进程(PPT课件讲稿)Processes.pptx
- 《大学计算机基础》课程教学资源(PPT课件讲稿)第四章 Excel 2007电子表格.ppt
- 东南大学:《C++语言程序设计》课程教学资源(PPT课件讲稿)Chapter 11 Operator Overloading; String and Array Objects(主讲:东方).ppt
- 《计算机网络》课程实验教学大纲.pdf
- 广西医科大学:《计算机网络 Computer Networking》课程教学资源(PPT课件讲稿)Chapter 18 NETWORK DESIGN AND IMPLEMENTATION.pptx
- 《多媒体技术基础》课程教学资源(PPT课件讲稿)单元1 多媒体概述.ppt
- 中国科学技术大学:《并行算法实践》课程教学资源(PPT课件讲稿)上篇 并行程序设计导论 单元I 并行程序设计基础 第三章 并行程序设计简介.ppt
- 《计算机控制技术》课程教学资源(PPT课件讲稿)第二章 模拟量输出通道.ppt
- 哈尔滨工业大学:开放式中文实体关系抽取研究(导师:秦兵).pptx
- 香港科技大学:片上网络(PPT讲稿)network-on-chip(NoC)NoC Building Blocks.pptx
- 《数据结构》课程教学资源(PPT课件讲稿)第五章 数组.ppt
- 语义网与本体(PPT讲稿)Semantic Web & Ontology(元数据 Metadata).ppt
- 软件开发环境与工具(PPT讲稿)Software development environment and tool.ppt
- 哈尔滨工业大学:逻辑斯蒂回归与最大熵(PPT课件讲稿).pptx
- 《机器学习》教学资源(PPT讲稿)支持向量机 support vector machines.ppt
- 中国科学技术大学:《计算机视觉》课程教学资源(PPT课件讲稿)第二章 视觉的基本知识.ppt
- 《编译原理》课程教学资源(PPT课件讲稿)第二章 词法分析.ppt
- 《计算机网络》课程教学资源(PPT课件)第4讲 以太网组网及故障排除.ppt
- VB.Net程序设计基础(PPT课件讲稿).ppt
- 《计算机导论》课程教学资源(PPT课件讲稿)第9章 计算机学科方法论.ppt
- 厦门大学:《大数据技术原理与应用》课程教学资源(PPT课件讲稿,2017)第11章 图计算.ppt
- 《Visual Basic 6.0程序设计》课程教学资源(PPT课件)第四章 常用控件与窗体.ppt
- 大连工业大学:《计算机程序设计(C语言版)》课程教学资源(PPT课件讲稿,共十三章).pps
- 《高级语言程序设计》课程教学资源(试卷习题)试题五(无答案).doc
- 《计算机文化基础》课程教学大纲 Computer Culture Foundation.pdf
- 《图像处理与计算机视觉 Image Processing and Computer Vision》课程教学资源(PPT课件讲稿)Chapter 08 Stereo vision.pptx
- 《计算机网络 Computer Networking》课程教学资源(PPT课件讲稿,英文版)Chapter 6 Wireless and Mobile Networks.ppt
- Gas Systems Modeling andSimulation with MSC.EASY5:GD Advanced Class Notes(EAS105 Course Notes).ppt
- 哈尔滨工业大学:《语言信息处理》课程教学资源(PPT课件讲稿)机器翻译 II Machine Translation II.ppt