《计算机情报检索原理》课程教学资源(PPT课件)第五章 自动标引

第五章自动标引
1 第五章 自动标引

本章内容提要 口旬动标引基本原理 自动标引的主要方法和技术 汉语旬动标引
2 本章内容提要 ◼ 自动标引基本原理 ◼ 自动标引的主要方法和技术 ◼ 汉语自动标引

第一节自动标引的基本原理 自动标引的定义、类型 自动标引的意义 自动标引的流 自动标引的原理
3 第一节 自动标引的基本原理 ◼ 自动标引的定义、类型 ◼ 自动标引的意义 ◼ 自动标引的流程 ◼ 自动标引的原理

1自动标引的定义 自动标引( Automatic Indexing),又称计 算机辅助标引( Computer Aided Indexing),是根据文献内容,依靠计算机 糸统全部或部分地自动给出标引行号的过 口换句话说,就是利用计算机糸统模仿人的 标引话动并自动生成情报检索所需的索引 符号的过程
4 1 自动标引的定义 ◼ 自动标引(Automatic Indexing),又称计 算机辅助标引(Computer Aided Indexing),是根据文献内容,依靠计算机 系统全部或部分地自动给出标引符号的过 程。 ◼ 换句话说,就是利用计算机系统模仿人的 标引活动并自动生成情报检索所需的索引 符号的过程

2自动标引的类型 口按人工介入与否分为金旬动标孔与半自动 标引。 口按标引词来源分为自动抽词标引与自动赋 词标引
5 2 自动标引的类型 ◼ 按人工介入与否分为全自动标引与半自动 标引。 ◼ 按标引词来源分为自动抽词标引与自动赋 词标引

CSIRS基于概念空间的信息检索系统 文件自动处理概念空间系毵 丁开文件预处理抽训标吲受控标吲白动分 待处理文本 标引结果 抽词标引結果 关键词 主题词: 息作出乐 德 o机构书 者3 喬晶的 的嵌元符答欧洲的莉益 赋词标引结果 18.57T324 停森隆 投资者 3. 000000 分类结果 290.T5T3s 迎族数慰 如果从2日日
6

强CSR5筛词检索- Microsoft Internet Explorer 中后退·④的备说搜索回收藏夹媒体③③·回B回 地址(D)hp2219585494860 owe. asp?word=15 转到 Google CSIRS 筛词检索 关键词查找 关键词维护 主题词维护 积念空间维护 欧菜雅公司 欧美地区 美各国 欧美关系 欧美国家 欧美市 欧盟 欧盟成员国 欧盟东扩 欧盟法 欧盟经济 欧盟一体化 欧佩克 欧佩克成员国 欧式期权 欧亚大陆桥元发行 元汇率 欧元启动 欧元区经济欧元运行 欧元走势 欧洲标准 欧洲大市场欧洲单一货1 欧洲地区 欧洲电信标准 欧洲各国 欧洲共同市场 欧洲拱同体 欧洲国家 欧洲经合组织 洲联 欧洲人 欧洲统 洲政治 欧洲质量奖洲中央银行 洲资本市场 偶然事件 偶然性 耦合器 禺合作用 凶网页上有错误 . Internet
7

C5IRs筛词检索- Microsoft Internet Explorer 件()编辑(查看0收藏工具(D帮助 中后退·→·⑨的益搜索囟收藏夹守媒体(·身·回季回 地址①))t0:19525494160107d%c9%C0%D2%%D2%%D0%D0%8%4%8% ◇转到Goge·「 CSIRS 筛词检索 关键词查找 关键词浏览 关键词维护 主题词维护 概念空间维护 您输入的检索词是:商业银行改革 后 63418346354 8.36386662080925E-02 中击击击击 8.22119476371001E-02 6.32324012620214E-02 银行业 5.06841425388512E-02 5.02867338959348E-02 金融改革 产权制度改革 点击 点击 Concept space net 完毕 Internet
8

3旬动标引的意义 1.适应信息资源快速增长的需要 加利福尼亚大学伯克利分校研究人员发现,仅 199920024 出的信 新产生的信息中92%记录在硬盘等 碱存储介质上。 信息资源的快速增长,造成信息相对过剽。只 有提高信息组织的效率,才能摆脱信息相对过剩 带来的因惑,因此信息标引显得非常重要。自动 标引适应了这一需要
9 3 自动标引的意义 1.适应信息资源快速增长的需要 加利福尼亚大学伯克利分校研究人员发现,仅 1999-2002年的三年中,全球新生产出的信息量 就翻了一番。新产生的信息中92%记录在硬盘等 磁存储介质上。 信息资源的快速增长,造成信息相对过剩。只 有提高信息组织的效率,才能摆脱信息相对过剩 带来的困惑,因此信息标引显得非常重要。自动 标引适应了这一需要

3旬动标引的意义 2.相对手工标引存在很大优势,克服了手工标引难 以克服的缺点。 与熟练标引人员相比,自动标引的准确性不如手工 标引,但在其他指标方面旬动标引具有无可比拟 的优势: 处理能力强 处理速度快 >成本低 致性好,稳定性好
10 3 自动标引的意义 2.相对手工标引存在很大优势,克服了手工标引难 以克服的缺点。 与熟练标引人员相比,自动标引的准确性不如手工 标引,但在其他指标方面自动标引具有无可比拟 的优势: ➢处理能力强 ➢处理速度快 ➢成本低 ➢一致性好,稳定性好
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
- 《计算机网络》课程教学资源(PPT课件讲稿)Chapter 04 网络层 Network Layer.ppt
- 湖南科技大学:分布式工作流系统的时间管理模型研究(PPT讲稿,周春姐).ppt
- 《编译原理》课程教学资源(PPT课件讲稿)第九章 独立于机器的优化.ppt
- 西安电子科技大学:《现代密码学》课程教学资源(PPT课件讲稿)第七章 数字签名和密码协议.ppt
- 南京大学:移动Agent系统支撑(PPT讲稿)Mobile Agent Communication——Software Agent.pptx
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)第五章 存储层次.ppt
- 合肥工业大学:《网络安全概论》课程教学资源(PPT课件讲稿)第一讲 网络安全概述.ppt
- 南京大学:《编译原理》课程教学资源(PPT课件讲稿)第六章 中间代码生成.ppt
- 《编译原理与技术》课程教学资源(PPT课件讲义)中间代码生成.ppt
- 《软件测试 Software Testing》教学资源(PPT讲稿)Part 3 Applying Your Testing Skills.ppt
- 电子工业出版社:《计算机网络》课程教学资源(PPT课件讲稿)第1章 概述.pptx
- 《计算机算法设计与分析》课程教学资源(PPT课件讲稿)分支界限法.ppt
- 中国科学技术大学:《数据结构及其算法》课程电子教案(PPT课件讲稿)第7章 图(主讲:刘东).pptx
- 兰州大学:搜索引擎的使用(PPT讲稿,主讲 杨青).ppt
- Folksonomies and Social Tagging(PPT讲稿).ppt
- Enabling SOA Using Messaging(PPT讲稿).ppt
- 《大学计算机基础》课程教学资源(PPT课件讲稿)第三章 字处理软件Word 2003.ppt
- 烟台理工学院:《算法与数据结构》课程教学资源(PPT课件)第1章 绪论(主讲:高慧).ppt
- 文字处理软件 Word 2010(PPT讲稿).pptx
- 山东大学:《数据结构》课程教学资源(PPT课件讲稿)第7章 跳表和散列(Skip List and Hashing).ppt
- SOFT COMPUTING Evolutionary Computing(PPT讲稿).ppt
- 马尔可夫链蒙特卡洛算法(PPT讲稿)Hamiltonian Monte Carlo on Manifolds,HMC.pptx
- 中国科学技术大学:《计算机体系结构》课程教学资源(PPT课件讲稿)顺序同一性的存储器模型.pptx
- 《编译原理》课程教学资源(PPT课件讲稿)第四章 语法制导的翻译.ppt
- 《ASP动态网页设计实用教程》教学资源(PPT课件讲稿)第3章 Web页面制作基础.ppt
- 《计算机网络》课程教学资源(PPT课件讲稿)第四章 网络层.pptx
- 南京大学:《编译原理》课程教学资源(PPT课件讲稿)第四章 语法分析.ppt
- 南京大学:《形式语言与自动机 Formal Languages and Automata》课程教学资源(PPT课件讲稿)Transition System(主讲:卜磊).pptx
- 安徽理工大学:《算法导论》课程教学资源(PPT课件讲稿)第4章 分治法——“分”而治之.ppt
- 南京大学:《数据结构 Data Structures》课程教学资源(PPT课件讲稿)Chapter 1 基本概念和算法分析.ppt
- 《计算机网络》课程PPT教学课件(英文版)Chapter 4 物理层 PHYSICAL LAYER.pptx
- 清华大学:图神经网络及其应用(PPT讲稿)Graph Neural Networks and Applications.pptx
- 《计算模型与算法技术》课程教学资源(PPT讲稿)Chapter 8 Dynamic Programming.ppt
- Network and System Security Risk Assessment(PPT讲稿)Firewall.ppt
- 东北大学:《可信计算基础》课程教学资源(PPT课件讲稿)第三讲 认证技术与数字签名.ppt
- 《计算机网络》课程教学资源(PPT课件讲稿)Chapter 04 网络层 Network Layer.ppt
- 《时间序列分析及应用》课程教学资源(PPT课件讲稿)第二章 时间序列的预处理.ppt
- 中国科学技术大学:《算法基础》课程教学资源(PPT课件讲稿)算法基础习题课(二).pptx
- 中国科学技术大学:《计算机编程入门》课程PPT教学课件(讲稿)An Introduction to Computer Programming.ppt
- 上海交通大学:《挖掘海量数据集 Mining Massive Datasets》课程教学资源(PPT讲稿)Lecture 03 Frequent Itemsets and Association Rules Mining Massive Datasets.ppt