第二课信息检索原理

Posted ymx

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了第二课信息检索原理相关的知识,希望对你有一定的参考价值。

一、学术信息的检索步骤

 

 

1、检索准备:

- 明确课题学科属性、专业范围及相关内容

  如:微生物降解苯酚的研究进展

- 弄清检索课题的信息类型和时间要求

  即:为文献类检索课题还是事实数据类检索课题

  如:中国经济领域的统计数据、政策

  即:考虑所需文献的时间跨度

- 考虑课题的特殊要求

- 明确用户自身的信息要求

2、选择检索系统:

-依据数据库收录的信息内容所涉及的学科范围

-依据数据库收录的文献类型、数量、时间范围及更新周期

-依据数据库提供的检索途径、检索功能和服务方式

3、制定检索式:

    检索词是检索式的基本组成元素,能否选准、选全检索词直接影响到检索效果的优劣。检索词包括:专业技术名词、作者、机构名称、分类号、出版物名称等。

(1)确定检索词

     自由词   (任意词)

     关键词  (专业词、非受控词)-推荐使用

     主题词  (规范词、受控词、叙词 )

 

    确定检索词常用的方法是:从给定的课题名称出发,经过切分、删除、补充等步骤,确定检索词,最终通过组配,构成能全面、明确表达信息需求的检索式。对于课题名称中无法获取充分检索词的情况,可以从技术要点中抽取核心技术词汇。

切分:对语句进行切分,以词为单位划分句子或词组。

删除:删除不具有检索意义的虚词、其他非关键词及过

      于宽泛和过于具体的限定词。

补充:补充还原词组、同义词和近义词。对需要较高查全率的检索课题,可以以降低检索词的专指度为出发点,补充选用检索词的上位词。

示例1:工农业/废水/的/循环利用/的/研究

检索词包括“工业、农业、工农业、废水、废液、循环利用”

示例2:高速公路/运营/财务/管理/模式/研究

检索词包括“高速公路、高速路、运营、营运、财务”

(2)构建检索提问式

    检索提问式是计算机信息检索中用来表达用户检索提问的逻辑表达式,由检索词和各种布尔逻辑算符、位置算符、截词符以及系统规定的其它组配连接符号组成。

-  布尔逻辑算符

   用布尔逻辑算符进行检索词的逻辑组配,是一种常用的检索技术。常用的逻辑运算有三种:与、或、非。

      1)逻辑“与”

      用and、 “*”或者空格表示。在网络搜索引擎中常用“空格”代替“*”。

      2)逻辑“或”

      用or、“+”或逗号表示。在网络搜索引擎中习惯用逗号代替or或+。

      3) 逻辑“非”

      用not 或“-”号表示。在网络搜索引擎中习惯用减号代替not。

- 西文检索通配符的使用

  • 截词符(前截词、后截词)

      comput*,表示computer, computerized, computation 等

      *physics 表示 physics、astrophysics、biophysics、chemicophysics

  • 替代符(替代一个字母,或替代若干个字母)

       wom?n可检到women, woman,

  • 邻近算符(same、near、W/n )

       Cellulose SAME wood 可检索到 wood cellulose, cellulose from wood, wood-cellulose等

       laser near/3 diode

          精确检索

  •   “international space station”

  (3)确定检索式

    如:检索词A and 检索词B and 检索词C

         土豆 and 种植

        (检索词A or 检索词B) and 检索词C

         (土豆 and 洋芋) and 种植

(4)确定检索途径

      即限定检索词出现的字段

      如:AU=作者;LA=语种;TI=篇名;AB=文摘;PY=年代等。

       从主题途径查找:通过主题、关键词、主题词这些能够反映文献主题内容方式进行信息检索;

       从分类途径查找:信息资料和科技文献一般都是用分类表按学科进行组织管理,检索时要熟悉分类表,了解所查文献隶属于哪一“类”,利用类号做检索点查找文献。分类查找特点:可以避免因检索词考虑不周而造成漏检;

       从著者途径查找:文献的编者、作者、译者等;

       从文献代号途径查找:科技报告、专利、标准、会议、图书、期刊都有自身的标准号码,它们是查找具体文献标示,是获取文献的重要途径。

4、调整检索策略

    检索时,应及时分析检索结果是否与检索要求一致,根据检索结果对检索提问式进行相应的修改和调整,直至得到比较满意的结果。

- 检索结果信息量过多

  a 增加更多限制概念,采用逻辑“与”连接检索词

  b 减少同义词与同族相关词

  c 使用字段限定,将检索词限定在某个或某些字段范围

  d 使用逻辑“非”算符,排除无关概念

  e 调整位置算符,由松变严

- 检索结果信息量过少

 a 选全同义词与相关词,并用逻辑“或”将它们连接起来 

 b 减少逻辑“与”的运算,丢掉一些次要的或者专指性太

   强的概念。

 c 去除某些字段限制

 d 调整位置算符

5. 筛选文献

根据详细记录符合检索需求的文献线索,包括文献名称、作者、时间、文献出处、文献类型等,确定最终希望获取的信息。

6、获取全文

二、实例

实例:工农业废水的循环利用研究

检索要求:查证国内外关于“工农业废水的循环利用研究”情况。

通过分析得知:“工农业废水的循环利用研究”属于环境学科。

根据检索要求,查阅的资料范围应为国内外资源(包括期刊文献、专利文献、会议论文、学位论文等),检索的主要内容为“工农业废水的循环利用”方面的研究报道。

- 确定检索词

工业        industry 、 industrial

农业        agriculture 、agricultural、 farming

工农业      industrial and agricultural

废水        wastewater、waste water、effluent

循环利用    recycling、recycle

- 编写检索式

(工业 OR 农业 OR 工农业) AND 废水 AND 循环利用

(industr* or agricultur* or farm*) AND (wastewater OR “waste water” OR effluent) AND recycl*

三、练习题

  • 确定下列课题的检索式

 ① 了解“碳纳米管在电极中的应用” 情况;

 ② 查找有关“山楂的食品加工”文献;

 ③ 查找有机锡、有机锑类的塑料热稳定剂资料;

 ④ 煤灰利用;

 ⑤ 用生物方法防治棉铃虫(排除用赤眼蜂)的文献。

参考答案:

  课  题:了解“碳纳米管在电极中的应用” 情况。

  检索式:(碳纳米管 OR 巴基管) AND 电极

  课  题:查找有关“山楂的食品加工”文献;        

  检索式:(山楂 OR 红果 OR 山里红) AND 食品加工

  课  题:查找有机锡、有机锑类的塑料热稳定剂资料;

  检索式:(有机锡 OR 有机锑) AND 热稳定剂

  课  题:煤灰利用;

  检索式:(煤灰 OR 粉煤灰 OR 煤渣) AND (砖 OR 水泥 OR 混凝土 OR 路基 OR……)

  课  题:查找“用生物方法防治棉铃虫(排除用赤眼蜂)的文献”

  检索式: 生物 AND 棉铃虫 NOT 赤眼蜂

  注意:检索运算顺序非常重要,检索式应能正确表达检索意图。

 

以上是关于第二课信息检索原理的主要内容,如果未能解决你的问题,请参考以下文章

大学计算机第二课

Spring Boot OAuth2:如何检索用户令牌信息详细信息

如何检索有关此批量加载错误的更多信息?

互联网信息检索应用-推荐系统初识

1.《SQL必知必会》--(更新中...)

web安全入门-搜索引擎信息