武汉大学信管专业期末复习系列

您所在的位置:网站首页 信息检索的定义 武汉大学信管专业期末复习系列

武汉大学信管专业期末复习系列

2023-12-17 23:29| 来源: 网络整理| 查看: 265

************************************************************************* 免费订阅我的“信息管理与信息系统专业课期末复习”专栏,后续会相继推出其他专业课和平台课的期末复习资料哦 ************************************************************************* 

目录

第一讲 信息检索概述

(一)信息素养

(二)数据链

(三)信息检索模型

       1. 定义:

        2. 类别:

        3. 布尔模型:

        4. 向量空间模型:

        5. 经典概率模型:

(四)信息检索系统的结构与评价

        1. 信息检索系统的定义:

        2. 数据库类别:

        3. 信息检索系统的评价:

第二讲 信息检索的方法与技巧

(一)网络信息检索的基本方法

        1. 布尔逻辑检索

        2. 邻近检索(位置限制检索)

        3. 短语检索(精确检索)

        4. 截词检索

        5. 字段限制检索

(二)信息检索的技巧

        1. 扩大检索范围:

        2. 缩小检索范围:

这两章内容不是很多,就整合在一起了。复习内容综合了书本知识和课上老师讲的内容,因此将更加全面。

整理不易,觉得好的话可以点个赞~

第一讲 信息检索概述 (一)信息素养

课堂上老师曾多次提及信息素养这一概念,但是并没有给出一个明确的定义,因此这里将我记录的笔记呈现出来,欢迎大家的补充。

        1. 信息素养概念一:得知何时需要信息,如何获取信息,以及获取信息后如何评价和有效利用信息的能力

        2. 信息素养概念二:信息素养是信息意识、信息能力、信息知识、信息道德

        3. 信息素养概念三:信息素养是一种批判性思维,并且能够使用数字技术获取信息解决问题

        4. 信息素养概念四:

                从定义性的角度:从定义什么是由信息素养的人展开,描述一个具有信息素养的人是什么样的使人定义信息素养。

                从过程性的角度:沿着人处理信息的过程展开,过程逻辑明确、系统。

                从结构性的角度:a. 首先关注外在能力,包括高效获取,评判与选择信息,归纳存储,快速提取信息的能力,以及运用多媒体表达和使用信息的能力。

                                             b. 其次,把这种外在能力转化为社会能力,即实现自身的社会意义

                                             c. 最后,关注内在,提升人的内在品质,注重道德、情感、法律意识和责任感的培养。 

(二)数据链 数据信息知识智慧原始的(Row)有语义的(Meaningful)有用的,并且得到的过程可靠,经过了实践的验证(Useful)是一种信念,通过反思与实践(Thinking) (三)信息检索模型        1. 定义:

        信息检索模型,就是运用数学的语言和工具,对信息检索系统中的信息及其处理过程加以翻译和抽象,表述为某种数学公式,再经过演绎和推断,揭示和实际校验,翻过来指导信息检索实践。

        2. 类别:

                  集合论:代表模型是布尔模型

                代数模型:代表模型是向量空间模型

                概率模型:代表模型是经典概率模型 

        3. 布尔模型:

        定义:是基于集合理论和布尔代数的一种简单的检索模型。

        优点是:形式简洁,结构简单

        缺点是:只能判断文献要么相关要么不相关,无法描述与查询条件部分匹配的情况,可能导致检出的文献过多或过少。

        4. 向量空间模型:

        定义:通过对检出文献按相似度降序排列的方式来实现文献与查询的部分匹配。

        优点:标引词加权改进了检索效果;其部分匹配策略云心检出与查询条件相近的文献;余弦公式根据文献与查询之间的相似度对文献进行排序。

        缺点:标引词被认为相互独立

        5. 经典概率模型:

        emmm,感觉课本上的不太会考,就没做笔记了(绝对不是懒)

(四)信息检索系统的结构与评价         1. 信息检索系统的定义:

                信息检索系统是具有信息存储和信息查询功能的一类信息服务设施。

        2. 数据库类别:

按内容与功能划分包括以下几种:

 指南数据库交易数据库全文数据库(研究人员最常用)书目数据库(研究人员最常用)字典数据库数值数据库图像数据库          3. 信息检索系统的评价:

                定义:信息检索系统评价的核心是检索性能的评价。检索性能评价是根据一定的评价指标对实施信息检索活动所取得的成果进行客观科学评价以进一步完善检索工作的过程

                指标1-查全率:从数据库中检出的数据中相关的信息量/整个数据库中相关的数据量

                指标2-查准率:从数据库中检出的数据中相关的信息量/从数据库中检出的所有信息量

        为了帮助大家理解这两个概念,请看下表:

所有的数据量(信息量) 你检索到的信息量      你没检索到的信息量相关的信息量(始终是分子)相关的信息量不相关的信息量        不相关的信息量

        我把数据分成四个部分,检索到的相关的,检索到的不相关的,没检索到的相关的,没检索到的不相关的。

        而检索到的相关的始终是分子,检索到的相关的+没检索到的相关的是查全率的分母,所以查全率用来表示相关记录(指所有的信息量)被检中的比例;检索到的相关的+检索到的不相关的是查准率的分母,所以查准率用来表示检出记录(指检索出来的所有信息量)的相关程度。                 指标3-其他:其他还有一些指标如误检率、漏检率、新颖率大家可以自行查看。

第二讲信息检索的方法与技巧 (一)网络信息检索的基本方法         1. 布尔逻辑检索

                包括逻辑与(AND),逻辑或(OR),逻辑非(NOT),这个比较简单就不细讲。

        2. 邻近检索(位置限制检索)

                定义:用一些特定的算符来表达检索词与检索词之间的顺序和词间距的检索

                依据:文献记录中词语的相对次序或位置不同,所表达的意思可能不同,而同样一个检索表达式中词语的相对次序不同,其表达的检索意图也不一样。

        3. 短语检索(精确检索)

                就是一字不差的检索,很好理解

        4. 截词检索

                定义:在检索标识中保留相同的部分,用相应的截词符代替可变化的部分。

                类别:前截词,后截词,中截词

        5. 字段限制检索

、                定义:在信息检索过程中,为了提高查全率或查准率,需要将检索范围限制在特殊的字段中,即字段限制检索

                   字段类型:

基本索引字段:一篇记录中主要用来表达文献内容特征的字段称为基本索引字段,如篇名,文摘,叙词+自由词(主题词)辅助索引字段:表达文献外部特征的字段,如著者,机构名,语种,刊名,出版物等 (二)信息检索的技巧         1. 扩大检索范围:

                检索词角度:使用上位词;增加同义词、近义词、缩略词等

                逻辑连接词角度:使用逻辑或OR,减少逻辑非NOT

        2. 缩小检索范围:

                检索词角度:使用下位词;减少同义词、近义词、缩略词等

                逻辑连接词角度:使用逻辑与AND,减少逻辑非NOT

        ......暂时只想到这些,后续可能有补充,也欢迎大家补充~

喜欢这篇文章的话就点个赞吧~如果觉得对你有用的话可以收藏起来以备不时之需

        如果你对这类复习文章感兴趣的话,可以免费订阅我的“信息管理与信息系统专业课期末复习”专栏,里面后续会推出信管专业其他专业课的期末复习资料。



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3