中国高校课件下载中心 》 教学资源 》 大学文库

《信息检索》课程教学资源(PPT课件讲稿)第三章 Retrieval Language(3-1)检索语言概述

文档信息
资源类别:文库
文档格式:PPT
文档页数:10
文件大小:78KB
团购合买:点击进入团购
内容简介
Chap3 Retrieval Language 3-1检索语言概述 3-2分类检索语言 3-3主题检索语言
刷新页面文档预览

Chap3 Retrieval Language 3-检索语言概述 3-2分类检索语言 3-3主题检索语言 思考题 课题4:经济管理网络信息分类的基本特征

1 Chap3 Retrieval Language 3-1 检索语言概述 3-2 分类检索语言 3-3 主题检索语言 思考题 课题4:经济管理网络信息分类的基本特征

3-1检索语言概述 检索语言的概念和特点 检索语言的类型与谱系 三、检索语言的构成和基本功能 四、检索语言的基本原理 五、检索语言的基本要求 2

2 3-1 检索语言概述 一、检索语言的概念和特点 二、检索语言的类型与谱系 三、检索语言的构成和基本功能 四、检索语言的基本原理 五、 检索语言的基本要求

“∴:…2 、信息检索语言的概念和特点 信息检索语言是根据信息检索的需要而创制的人工语言,其实质是表 它可以是从自然语言中精选出来并加以规范化的一套词汇,也可 以是代表某种分类体系的一套分类号码,还可以是代表某一类事 物的某方面特征的二套代码用以对文献内容和信息需要进行 (1)简明扼要地表达文献及其检索课题的主题概念,使词语和概念一 对应,排除一词多义、多词一义或词义含糊等现象。 (2)科学准确地匹配概念,即将检索时的标引用语和检索用语进行相 符性比较 (3)全面有效地显示概念之间的相互关系。采用等级结构、参照系统、 轮排聚类法、范畴聚类法和图示法等各种显示概念之间关系的方 法,来实现对内容相同或相关的信息加以集中或揭示其相关性

3 一、信息检索语言的概念和特点 信息检索语言是根据信息检索的需要而创制的人工语言,其实质是表 达一系列概括文献信息内容的概念及其相互关系的概念标识系统。 它可以是从自然语言中精选出来并加以规范化的一套词汇,也可 以是代表某种分类体系的一套分类号码,还可以是代表某一类事 物的某一方面特征的一套代码,用以对文献内容和信息需要进行 主题标引、逻辑分类或特征描述。 ⑴ 简明扼要地表达文献及其检索课题的主题概念,使词语和概念一 一对应,排除一词多义、多词一义或词义含糊等现象。 ⑵ 科学准确地匹配概念,即将检索时的标引用语和检索用语进行相 符性比较。 ⑶ 全面有效地显示概念之间的相互关系。采用等级结构、参照系统、 轮排聚类法、范畴聚类法和图示法等各种显示概念之间关系的方 法,来实现对内容相同或相关的信息加以集中或揭示其相关性

E、检索语言的类型与谱系 2、1依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类一主题一体化语言、代码语言和引文语言等 类型。 2、2依据检索语言的受控情况,把检索语言分为 Artificial Language 和 Natural Language“““ 此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分 2、3检索语言的谱系∵

4 二、检索语言的类型与谱系 2、1 依据检索语言的构成原理,把检索语言划分为分类检索语言、 主题检索语言、分类-主题一体化语言、代码语言和引文语言等 类型。 2、2 依据检索语言的受控情况,把检索语言分为Artificial Language 和Natural Language。 此外,可以按检索语言的学科或专业范围、适用范围、检索标识的 组合使用方法以及对信息特征的描述等标准,对检索语言进行划 分。 2、3 检索语言的谱系

2、1按构成原理对检索语言进行划分 ≮分类检索语言是指使用分类号码表达文献主题标识,并按照知 分类的原理加以排列的一类信息检索语言 其主题检索语言则是指使用名词术语表达文献主题标识,并照按字 顺加以排列的一类信息检索语言。 其分类检索语言和主题检索语言相互影响、渗透、补充和结合,从 而出现了分类主题一体化语言,即分类语言和叙词语言在术语系 统、参照系统、标识系统和索引系统等方面完全实现兼容所组成 的统一体。如分面叙词表、叙词表式字顺索引、分类表一叙词表对 照索引及集成词表等等 其代码检索语言是指用来标引、检索特定专业文献的某种代码系统。 其引文检索语言则是基于文献之间的引证关系而形成的一种检索语 言。它以引文为检索词,根据引证关系将有关文献自然地耦合在 起

5 2、1 按构成原理对检索语言进行划分 分类检索语言是指使用分类号码表达文献主题标识,并按照知识 分类的原理加以排列的一类信息检索语言。 主题检索语言则是指使用名词术语表达文献主题标识,并照按字 顺加以排列的一类信息检索语言。 分类检索语言和主题检索语言相互影响、渗透、补充和结合,从 而出现了分类主题一体化语言,即分类语言和叙词语言在术语系 统、参照系统、标识系统和索引系统等方面完全实现兼容所组成 的统一体。如分面叙词表、叙词表式字顺索引、分类表-叙词表对 照索引及集成词表等等。 代码检索语言是指用来标引、检索特定专业文献的某种代码系统。 引文检索语言则是基于文献之间的引证关系而形成的一种检索语 言。它以引文为检索词,根据引证关系将有关文献自然地耦合在 一起

2、2按语言受控情况对检索语言进行划分 Artificial Language是指采用 Controlled term并进行人工控制的语 言,或称受控语言。所谓规范词是指采用特定的词汇来专指或 网罗相应的概念,它们能够对同义词、近义词、相关词、多义一 词及缩略语等进行规范。使用规范词能够提高检索效率。单元 词语言、标题词语言、叙词语言等都是规范语ˉ Natura| Language是指采用 Uncontrolled term,即不加规范、不 受控制的 Free term,它们直接来自所处理的文献本身的标引用 语或检索用语,在使用前未经优选和规范化处理

6 2、2 按语言受控情况对检索语言进行划分 Artificial Language是指采用Controlled term并进行人工控制的语 言,或称受控语言。所谓规范词是指采用特定的词汇来专指或 网罗相应的概念,它们能够对同义词、近义词、相关词、多义 词及缩略语等进行规范。使用规范词能够提高检索效率。单元 词语言、标题词语言、叙词语言等都是规范语言。 Natural Language 是指采用Uncontrolled term,即不加规范、不 受控制的Free term,它们直接来自所处理的文献本身的标引用 语或检索用语,在使用前未经优选和规范化处理

2、3检索语言的谱系 一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。 检索语言语系检索语言语族检索语言语支检索语言语种∷ 描述文献内容分类检索语言标魎词法 特征的检索语言住题检索语言元词法 分类主题一体叙词法汉语主题词表 描述文献外在 化语言键词法 特征的检索语言 7

7 2、3 检索语言的谱系 一般地,可以将检索语言类型按亲属关系划分为4个层次,从而构成 检索语言的谱系。 检索语言语系 检索语言语族 检索语言语支 检索语言语种 描述文献内容 分类检索语言 标题词法 特征的检索语言 主题检索语言 元词法 分类主题一体 叙词法 汉语主题词表 描述文献外在 化语言 键词法 特征的检索语言

三、检索语言的构成和基本功能 1、检索语言的构成。检索语言包括两个部分:一是检索语言词江 即登录在分类表、词表中的全部标识。一个标识(分类号、检索 词、代码)就是它的一个语词,而分类表、词表、代码表则是它 的词典。二是检索语言语法,它是指如何创造和运用那些标识 来正确表达文献内容和信息需要,以有效地实现信息检索的 整套规则。检索语言语法可以进一步分为词法和句法两个方面。 2、检索语言的基本功能。 其对文献的信息知识内容及某些外部特征加以标引; 其对内容相同或相关的信息加以集中或揭示其相关性; 便于对标引用语和检索用语进行相符性比较 对大量信息加以系统化或组织化;

8 三、检索语言的构成和基本功能 1、检索语言的构成。检索语言包括两个部分:一是检索语言词汇, 即登录在分类表、词表中的全部标识。一个标识(分类号、检索 词、代码)就是它的一个语词,而分类表、词表、代码表则是它 的词典。二是检索语言语法,它是指如何创造和运用那些标识 来正确表达文献内容和信息需要,以有效地实现信息检索的一 整套规则。检索语言语法可以进一步分为词法和句法两个方面。 2、检索语言的基本功能。 对文献的信息知识内容及某些外部特征加以标引; 对内容相同或相关的信息加以集中或揭示其相关性; 对大量信息加以系统化或组织化; 便于对标引用语和检索用语进行相符性比较

四、检索语言的基本原理 1、基本原理与机制之一:概念逻辑 概念逻辑是揭示事物夲质属性及各种事物之间联系与区别的科学思 维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展

9 四、检索语言的基本原理 1、基本原理与机制之一:概念逻辑 概念逻辑是揭示事物本质属性及各种事物之间联系与区别的科学思 维方式,它反映概念之间的关系,确定概念的类型、内涵和外延 等。检索语言就是运用概念之间的各种关系,对文献内容和外部 特征进行标引。具体而言,概念的划分与概括,侧重于概念的隶 属关系和并列关系,并据此建立检索语言的概念等级体系。概念 的分析与综合,主要是利用概念的交叉关系,依此建立检索语言 的概念组配体系。 2、基本原理与机制之二:知识分类 知识分类是指以各门科学所研究的运动形态的固有特征及其互相关 联与转变的次序为依据,对整个科学知识领域所做的分类。目的 是考察各门科学之间的区别与联系,确定各门科学的内部结构, 建立相应的分类体系,以反映当代科技水平并指导科学的发展

五、信息检索语言的基本要求 1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索, 从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性 6、具有不断进行现代化改造的可能性

10 五、信息检索语言的基本要求 1、保证较高的检全率和检准率。 2、能满足多种检索要求。从学科、专业出发的族性检索, 从事物出发的特性检索,多途径、多因素检索以及检 索范围的自由改变。 3、易于标引,易于检索,减少标引和检索误差。这就需 要语词或符号的明确性,语法的严谨性,标识的直观 性,排序的易理解性,查词查号手段的多样性以及整 个语言包含概念的丰富和完备性等。 4、多方面的适应性。 5、具有与其它检索语言的兼容性和通用性。 6、具有不断进行现代化改造的可能性

已到末页,全文结束
刷新页面下载完整文档
VIP每日下载上限内不扣除下载券和下载次数;
按次数下载不扣除下载券;
注册用户24小时内重复下载只扣除一次;
顺序:VIP每日次数-->可用次数-->下载券;
相关文档