Embase:从索引的角度看Embase中的文献检索策略构建与检索原理(三)

您所在的位置:网站首页 embase数据库检索模块有 Embase:从索引的角度看Embase中的文献检索策略构建与检索原理(三)

Embase:从索引的角度看Embase中的文献检索策略构建与检索原理(三)

2024-03-27 20:59| 来源: 网络整理| 查看: 265

02 关键词检索实战困难4:是否“主”相关

相信大家在进行文献检索的时候也有类似的经历,就是用我们想要的关键词去进行检索的时候,能找到文献,但是通过阅读发现其中的一些文献和我们想要的内容并没有直接的相关性。文献中只是提及了我们用的检索词,但其实并没有就这个“词”做过多的研究。可能有些同学和老师不能很好地理解这背后的意思,这里用一个案例来说明下这种情形。

如以下这篇文献:

https://doi.org/10.1016/j.bioactmat.2022.08.029

这篇文献是通过二型糖尿病关键词“non insulin dependent diabetes mellitus”检索到的,而且其摘要中还存在这个概念,但是通过阅读其摘要发现,这篇文献其实和二型糖尿病没有关系,他重点讲述的是,二型糖尿病加重牙周炎,使得糖尿病牙周骨再生是一个挑战,作者从“天然骨愈合”受到启发,开发了一种热敏水凝胶,用于缓慢释放药物,用于牙周骨再生。

以下是Embase对这篇文献的提炼,可以看到其提炼了“二型糖尿病”这个词,符合我们的检索逻辑,但这又是一个典型的“非主相关”文献:

这就是我们今天讨论的第一个困难,非“主”相关,就是文献与检索词之前有那么一点点关系,但是这个“关系”不是主要的。这些非“主”相关文献,在筛选上是比较头痛的,“索引”类文献数据库又是通过什么手段来处理这些有一点点关系,但又不是特别相关的文献,如何有效地去除这些“噪音”文献的呢?

03 是否“主”相关的解决方案

在计算机技术还不是很发达的时期,这种“主”相关的困难是靠“人工阅读”来完成的,利用人工的方式,对文献中的重要概念进行重点“标引”,来告知读者这篇文献中重点谈到的概念,在数据库中以黑体字样出现在索引词中,如上述文献在Embase中的记录,其中的索引词中的黑体如下:

单独地看下这些黑体词与文献内容之间的关系:

“黑体”标记的意义在于,可以很快的告知检索人员,这篇文献中的重要内容。随着计算机语义识别技术的发展,现在已经脱离了“人工”阅读的手段,逐渐采用人工智能语义识别技术,用于“主”相关概念的标引。Embase在实现“主”相关概念标引的同时,还开发了筛选的功能,通过简单筛选过程,直接获取与“主”相关概念有关的文献,这个在以后的分享中在和大家探讨具体的案例。

04 关键词检索实战困难5:词间“关系”

结合数据库的功能,通过对“主”相关内容的筛选,确实可以帮我们去除掉很多无关的文献,但是是否就足够?我们通过下面的一个案例和大家做一个分享:

检索需求:

获取用“二甲双胍”治疗“二型糖尿病”的文献。

检索策略:

检索结果中的一条记录:

https://doi.org/10.1155/2018/8501418

Embase中的记录如下:

在这条记录中,我们发现“二甲双胍”和“二型糖尿病”都是“主”相关(黑体),但从摘要中可以看出,这篇文献并不涉及二甲双胍治疗糖尿病的研究,而只是在评估在接受二甲双胍治疗的2型糖尿病(T2D)患者中,继续使用Dapagliflozin的疗效和安全性。

从这个案例,我们可以看出,即使都是“主”相关的概念,也可能与我们想要的结果不相关。这背后的原因,从这个案例来看,就是“主”相关概念间缺少了“治疗关系”的定义。我们可以想象,如果我们可以筛选“二甲双胍”和“二型糖尿病”之间的关系是“治疗”,是否可以满足我们的需求?这就是我们今天讨论的第二个困难,如何定义词间“关系”。

05 词间“关系”的解决方案

词间“关系”的解决方案,其实和“主”相关的解决思路是一样的,就是在提炼的时候用人工标记或者人工智能语义识别技术,在有“关系”的词之间打上“关系”的标签,Embase中存在100多种这样的关系。简单的和大家看下这种关系在Embase记录中的呈现形式。

上图是Part 4中那条记录中的一个索引词Dapagliflozin,展开后我们发现其存在Drug Therapy的关系词条,且这个Drug Therapy与二型糖尿病相关联,这就是说在文献中存在用Dapagliflozin治疗二型糖尿病的“关系”。

对于“关系”词条,从文献检索的角度来看,还有一种说法叫做Subheading。对于熟悉Medline平台同学和老师应该知道,Medline中也存在Subheading,那么Medline中的Subheading和Embase中的Subheading 有什么区别? 简单来说有下面两点:

那么如何理解上述的第二点,我们用下面的这篇文献在Embase和Medline中的记录和大家做个比较:

以下索引词条源自Embase:

可以很清楚的看到“二甲双胍”这个词条的三层关系,即“二甲双胍”与“二型糖尿病”、“非酒精性脂肪肝”是“Drug Therapy”关系。但是相同记录在Medline中的词条如下:

Medline中的关系,只能给出两层,即“二甲双胍”在文献中有“治疗作用”,“非酒精性脂肪肝”在文献中有“药物治疗”的描述,但是没能给出“二甲双胍”是用于治疗“非酒精性脂肪肝”的。这就是三层关系和两层关系的区别。当然这只是词条的呈现形式,Embase除了可以呈现之外,还有更多的工具可以用于筛选,这个后面会和大家贪大,但是Embase对文献提炼和标引的数据是所有一切的基础。

小结

截至到现在,我们就文献检索中的一些困难和解决方案,和大家做了三期的分享。在今天的分享中,我们通过两个案例,和大家分享了当解决检索“全面性”后还会遇到的检索麻烦,其一为如何获取“主”相关文献,其二为如何存在“特定关系”。内容类索引数据库通过添加标签来解决这类麻烦,同时还需要依据这些标签开发相应的功能来用于筛选。Embase目前的解决方案是利用人工智能语义分析,进行标签的添加,并在检索和筛选时开发了大量的功能用于文献的筛选。这些功能的应用,我们会在后面的分享中继续和大家探讨。

本系列前期相关阅读:

关于Embase

Embase是Elsevier Life Science旗下的生物医学文献数据库,包含全面的期刊和会议报道,采用全球最大的生命科学索引体系Emtree对全文进行深度的索引与概念关联,并利用多元化与模块化的搜索引擎,帮助科研人员从错综复杂的全文中快速定位最关关键的内容。且专门开发了适用于循证医学,药物警戒,医疗器械临床评价报告,药物临床风险管理计划撰写等应用场景的文献检索模块。目前收录超过8,300本期刊,11,500个会议的会议论文,总计超过4,000万文献记录,以及430万会议记录,文献覆盖量约为PubMed Medline的1.5倍。如果大家对于Embase感兴趣可以通过文末二维码留下您的联系方式,我们会尽快与您联系,帮您了解更多。

更多精彩内容,请关注“爱思唯尔科研医学服务”公众号。

返回搜狐,查看更多



【本文地址】


今日新闻


推荐新闻


CopyRight 2018-2019 办公设备维修网 版权所有 豫ICP备15022753号-3