超级广告吧

 找回密码
 立即注册

QQ登录

只需一步,快速开始

扫一扫,访问微社区

搜索
热搜: 广告位招租:766698661
查看: 7|回复: 0

说说EI数据库署名单位检索功能利用研究2020/2/21 18:37:33

[复制链接]
发表于 2020-2-21 18:37:44 | 显示全部楼层 |阅读模式

EI数据库提供针对署名单位(Author Affiliation)的检索功能,并提供署名单位名称索引的浏览功能。该浏览功能按照英文字母顺序排列,把EI数据库里署名单位字段出现的单位英文名称都收集整理到一个独立页面上展示。用户通过该浏览功能可直观获得EI收录文献的所属单位各种表达 形式的英文全称。以西安交通大学为例,笔者在EI数据库的署名单位名称索引中共查到15种不同的表示形式,最具代表性的有:Xi'an Jiao Tong university、Xi'an Jiao Tong University、Xian jiaotong Univ等。因此,如果针对一个单位EI 收录的整体情况进行检索,需要充分考虑到该单位科研人员 的投稿习惯或规律,即单位名称在数据库中的各种英文表达 形式,并通过科学利用截词符、布尔运算符等,检索并获取到 更准确全面的EI数据库的文章收录情况。EI检索就是工程索引:《工程索引》(The Engineering Index,简称EI)创刊于1884年,是美国工程信息公司(Engineering information Inc.)出版的著名工程技术类综合性检索工具。


笔者在EI数据库里针对署名单位这项内容进行检索、统计分析工作时,发现针对某一署名单位的检索,数据库显示出的检索结果不准确并且出现大量干扰项,极大地影响了检索结果的准确性和后续的统计分析工作。需要考虑到产生这一问题的主要原因可能有如下几个方面。

原因一:从文章作者的角度来看,同一单位内科研人员 投稿时针对署名单位的署名习惯不同,尤其是英文文章投稿时,作者对单位的英文名称表述差异很大。这样导致一级单 位名称(校级)、二级单位名称(院级、国家重点实验室级)和三级单位名称(系、所、中心等级别)表述形式多样。并且,单 位物理地址的表述也形式多样。

原因二:从单位决策层的角度来看,每个单位内的各级相关科研机构繁多,导致机构结构和科研合作关系形式复杂。而学校决策层目前并未强制或明确规定相应每一级下级或下属单位科研人员在投稿时采用的中英文全称和简称表达形式,未足够重视本单位科研人员的署名单位表述不一致、不标准、不规范的问题和影响。

基于以上两种主要原因的相互作用,同一单位的署名单 位产生了多种多样的表达形式。例如,针对西安交通大学航天学院为署名单位的院系地址出现以下多种英文表达形式:

MOE、Dept Engn Mech、MOE Key Lab Strength & VIbrat、SV Lab、MOE Key Lab Srtength & Vibrat Mech Struct、NIE sch Aerosp、S&V Lab、MOE Lab、MSSV、SVL、Sch AEROSP。

原因三:从图书馆检索业务的角度来看,仅运用AND、OR等常用布尔运算符无法准确限制和缩小检索范围,检索结果会出现大量干扰项,从而影响数据分析的结果。针对这 一问题,检索人员需要使用ONEARn运算符来精确限制检索词之间的距离。通过综合利用AND、OR以及ONEARn的组合检索,可以提高针对署名单位的检索结果的全面性和准确性,减少大量干扰信息的出现,最终获得准确的数据分析结果。例如,当检索西安交通大学为署名单位在近5年内的EI文章收录情况时,在针对“Xian Jiaotong Univ*)WN AF)”这个检索条件检索时,xian Jiaotong Liverpoor University就成为干扰因素,只有通过使用EI数据库认可的布尔运算符ONEAR0,限制检索结果中署名单位的Jiaotong和University是紧邻关系,中间不出现其他词,才可以排除掉署名单位为xian Jiaotong Liverpoor University对分析数据的干扰,检索结果只显示署名单位为xian Jiaotong University的EI文章记录。但在检索分析其他高校的EI收录情况时,如以浙大为署名单位的EI收录情况时,使用以上方法无法排除掉署名单位为Zhejiang University of Science and Technology等多个单位的EI收录文章对zhejiang University的EI收录文章的干扰。

原因四:从全国高校及科研院所的署名发展来看,我国各级高校及科研院所取名的唯一性、独特性、特色性等方面 存在不足,导致了以上情况的大量出现。例如,当检索以南京大学为署名单位的EI文章收录情况时,在针对“Nanjing univ*"这个检索条件的检索时,检索结果中的Nanjing University和Nanjing university of science and Technology等为署 名单位的检索记录互为干扰项。

基于以上两种主要原因会检索出多个满足检索条件的署名单位。例如,xian Jiaotong University、xian Jiaotong university City College和xian Jiaotong Liverpoor University互为干 扰项,Nanjing University和Nanjing university of Science and Technology互为干扰项,同样zhejiang university和zhejiang University of Science and Technology互为干扰项。

原因五:在利用EI数据库针对某一个或多个署名单位 进行检索研究时,还必须考虑到该学校的不同校区地址可能会对署名单位检索结果的影响。例如,西安交通大学在西安主要有3个校区,分别是兴庆校区(邮编710049)、雁塔校区(邮编710061)、科技园校区(邮编710054)。因此,检索时可以利用布尔运算符OR来检索所有这些地址为署名单位地址的记录。否则,检索结果数据将会大打折扣。再例如,笔者在检索浙江大学在EI数据库中的文章收录情况时,考虑到 浙江大学主要有6个校区,分别是玉泉校区(邮编310027)、西溪校区(邮编310028)、华家池校区(邮编310029)、之江校区(邮编310008)、紫金港校区(邮编310058),因此,综合利用邮编信息也是署名单位检索的关键切入点。



备注:本文节选自:陈楠楠 - 《图书馆学刊》 - 2015年2期。

相关帖子

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

免费发布广告信息|超级广告吧

GMT+8, 2020-4-10 21:23 , Processed in 1.156324 second(s), 26 queries .

Powered by Discuz! X3.4

© Comsenz Inc.

快速回复 返回顶部 返回列表