科研星球

如何利用CNKI句子检索功能提高研究效率

摘要:CNKI句子检索功能在科技查新、专利审查等方面有着广泛的应用。本文从如何提高学术研究效率的角度,进一步丰富CNKI句子检索功能的应用情境。具体地,本文通过实例展示了如何解决研究者在概念、命题和理论三个方面所面临的常见检索问题,并指出“猜测”在使用句子检索功能时的重要性。


关键词:句子检索;猜测;文献检索;研究效率;CNKI


引言


文献检索是做研究必不可少的步骤。常用的文献检索方法有:关键词检索、引文检索、还有诸如专业检索、句子检索等高级检索方法。关键词检索因简单方便而被普遍应用,但检索的过程中会因为“同义词”或者“一词多义”等现象的存在,导致检索结果不全面或者不准确。引文检索虽然有助于研究者准确地理解研究的脉络,却需要花费较长时间。专业检索则需要熟悉不易掌握的专业检索表达式语法,因此,研究者较少使用该功能。CNKI句子检索属于全文检索的一种,在关键词检索、引文检索、专业检索力有不逮的时候,能为我们提供有效的帮助。


关于CNKI句子检索的研究较少,现有的文献主要从CNKI句子检索的功能设计与应用情境展开。在功能设计方面,现有的研究主要探讨了CNKI句子检索存在的盲点[1],如利用“同句检索”功能时,判断两个关键词是否属于同一句话,是根据是否有标点符号出现,而不是以句号出现来判断。在应用情境方面,现有的研究主要讨论了CNKI句子检索功能在科技查新、专利审查等方面的应用。例如,周广西[2]介绍了CNKI同句或同段检索功能在查新中的应用;邵文博[3]和陈优[4]都举例说明了CNKI同句检索功能在专利审查中的应用;边恩莲[5]举例说明了CNKI句子检索功能在判断论文间内容相似或者相同程度方面的应用。


CNKI是中国最大的连续动态更新的学术论文全文数据库。学术论文全文包含着重要的学术信息。如果能够有效利用,将大大提高科研人员的研究效率。因此,本文要回答的研究问题是:如何利用CNKI的句子检索功能提高学术研究的效率?本文的研究将进一步丰富CNKI句子检索功能的应用情境。


要回答上述研究问题,就是要回答,CNKI句子检索功能可以从哪些方面提高研究效率?学术论文是学术研究成果的载体。在进行学术研究时,科研人员如果能够快速地获取想要的学术研究成果信息,那么研究的效率将大大提高。学术研究成果是什么?曹文彪[6]认为不管是自然科学、社会科学还是人文科学,学术研究的成果都是通过概念、命题和理论来体现的。持同样观点的还有Lorraine Olszewski Walker和Kay Coalson Avant [7],他们从两个维度提出了构建理论的方法。第一个维度是学术研究成果的要素:概念、命题和理论;第二个维度是可以对成果要素进行的操作:类比、综合和分析。研究者可以通过对学术成果要素,进行类比、综合或分析操作来改进或构建理论。因此,我们认为概念、命题和理论是学术研究成果的三要素。更快地获取有关概念、命题和理论的信息将会提高研究效率。本文将借助实例来说明,如何利用CNKI句子检索功能快速地获取有关概念、命题和理论三个方面的信息,从而提高研究效率。


1.CNKI的句子检索功能


CNKI句子检索功能属于高级检索功能中的一个,它通过限制关键词出现的相对位置,使其位于同句或同段,来进行检索。CNKI句子检索功能中的同句检索,其检索结果是关键词同时出现在两个标点符号之间的句子,以及句子所在的学术论文信息;同段检索,则会找出两个关键词同时出现在五个标点符号之内的段落以及学术论文信息[5]。


CNKI句子检索功能的具体使用方法为:首先进入CNKI首页,在检索框右侧选择“高级检索功能”,进入界面之后,选择“句子检索”。其次在两个搜索框中分别输入关键词,选择同句或者同段即可进行检索。若检索效果不理想,可继续添加检索条件并通过“并且”、“或者”和“不含”连接两个条件,进一步检索。要注意的是,CNKI句子检索功能使用过程中最多有两行检索条件、四个关键词。除了上述操作,CNKI句子检索功能还有“结果中检索”、“分组浏览”等这些常规操作。熟练掌握CNKI句子检索功能能帮助研究者快速检索目标信息,提高研究效率。


2.利用CNKI句子检索功能提高研究效率的途径


在学术研究过程中,研究者不可避免地会遇到问题,如果可以快速有效地解决这些问题,将会提高研究效率。在本文中,我们将在学术研究中可能遇到的问题分为三个方面,即学术成果的三要素(概念、命题以及理论)中分别会有哪些问题。


在概念方面,研究中可能遇到的问题有:怎样定义一个概念;怎样将英文的概念翻译为合适的中文;怎样找到一个概念的已有量表等。命题反映变量间的关系,学术论文中的研究问题、研究假设、中介变量以及调节变量都涉及到变量间关系,因此在命题方面,研究者也会有不少的问题。学术研究经常需要有理论作为支撑,怎样快速了解一个理论,了解它的使用情境、边界条件以及局限性,这些是研究者在理论方面可能遇到的问题。


表1 CNKI句子检索从学术成果三要素

提高研究效率

640.png


接下来,本文针对表1中所提到的问题,以实例展示如何运用CNKI句子检索功能提高研究效率。


3.检索实例


3.1 概念


概念是认识的起点,如果概念模糊,则后续的研究步骤就会出现偏差。接下来将针对在概念方面研究者可能遇到的问题,借助CNKI句子检索功能举例说明怎样快速检索信息。


①首先,怎样定义一个概念呢?研究过程中会遇到陌生的概念,使用CNKI句子检索功能可以帮助研究者快速理解这些概念。我们选取“理论构建”这个概念进行尝试,先将“理论构建”和“定义”这两个关键词进行同句检索,出现了306条检索记录。将结果按相关性排序后,第一条记录为姜红丙等人的文章[8],相关的句子“由此,理论构建被定义为产生、检验和改进理论的过程”。通过CNKI句子检索功能,我们可以方便快速地检索到概念的相关定义。


②其次,遇到英文概念,怎样将其翻译为合适的中文呢?在研究过程中,因为语言使用的差异,研究者在将英文概念转化为中文时,会遇到一些障碍,此时不妨也尝试用CNKI句子检索功能来解决。以“construct identity”为例,将“construct identity”与“construct identity”同句检索,在结果中,我们可以看出大多数文章都将其翻译为“身份建构”,此时可以点击论文查看全文继续了解这个概念。再以“meta-analysis”为例,将“meta-analysis”与“meta-analysis”进行同句检索,综合检索记录,可以得出“meta-analysis”可称为“元分析”、“荟萃分析”或者“梅塔分析”。


③CNKI句子检索功能怎样应用于查找相关概念对应的量表呢?在实证研究中,研究者在测量不同概念时,通常会面临选用量表的问题,办法通常有两种:一是选择别人已开发的成熟量表,二是研究者自己开发新的量表。已开发的量表因被反复应用,不断完善,因此具有较高的信度和效度,研究者通常会使用这一类量表。那怎样获取已开发量表的信息呢?举例来说,待测概念为“组织公民行为”,那我们可以将“组织公民行为”和“量表”进行同句检索。从检索结果中可以看出,“组织公民行为”这个概念对应的量表有:Williams和Anderson开发的利他性组织公民行为量表、Podsakoff等提出的包含七个题目的量表、Aryee提出的九个题目的量表等。借助这些信息,我们可以进一步了解怎样使用这些量表。


3.2 命题


曹文彪[6]对命题的解释是:“命题就是由对概念之间的陈述所构成的”,命题反映概念之间的关系。在命题方面,我们可能遇到以下几种问题。


①应用CNKI句子检索功能,快速检验研究问题。一项研究实质上就是提出研究问题并解决的过程,所以研究问题的提出与验证是一项十分重要的工作,CNKI句子检索功能可以帮助研究者快速检验研究问题是否具有新颖性。例如我们在一篇文章中,看到它的研究问题是关于“创新源分散化”和“专利产出”之间的关系,想要验证该问题是否具有新颖性。那我们就可以利用CNKI句子检索功能将“创新源分散化”和“专利产出”进行同句检索,可以看到检索记录只有一条,这时不妨点击检索结果,进一步去验证该研究问题的新颖性。


②熟练应用CNKI句子检索功能,快速定位文章的研究假设。研究假设是对研究问题的尝试性回答,也是命题的一种基本形式。快速定位文章的研究假设能帮助研究者了解现有研究对某一个问题的基本结论是什么。举例来说,若想进行与“群体决策”相关的研究,那我们不妨将“群体决策”与“研究假设”进行同句检索,检索得到11条记录,包括:“本研究中提出如下研究假设:H1群体决策可以提高决策质量”;“提出个人知识组织化对群体决策绩效的研究假设H3a:认知需要对群体决策绩效有正效应”等。其他的研究假设皆可按照这种方式进行检索,若检索结果不够理想,可添加限制条件继续检索。


③应用CNKI句子检索功能,快速了解中介变量。考虑自变量X对因变量Y的影响,如果X通过影响变量M来影响Y,则称M为中介变量[9]。CNKI句子检索功能能帮助研究者快速地了解在已有研究中某一个变量是否被作为中介变量,以及是怎么应用的。我们以“组织承诺”作为待查询的变量,将“组织承诺”与“中介变量”进行同句检索,得到两方面的结果:一方面是“组织承诺”作为中介变量的检索结果:“员工职场孤独感与工作绩效的关系——以组织承诺为中介变量”;“现有研究中,组织承诺常被作为其他组织行为与员工绩效的中介变量”等。另一方面是“组织承诺”被中介的结果:“敬业度也是工作资源与组织承诺的中介变量”;“发现工作投入是工作资源对组织承诺影响的中介变量”等。


④应用CNKI句子检索功能,快速了解调节变量。调节变量是一种影响自变量X对因变量Y作用强度和方向的变量[10]。我们选择“创新搜索”这个概念作为待搜索项,将“创新搜索”与“调节变量”进行同句检索,得到8条检索结果,同样也包括两方面的内容。一方面是“创新搜索”作为调节变量的结果:“把创新搜索作为企业网络影响绩效的中间解释机制,考察企业网络通过影响创新搜索进而影响企业绩效的作用机制”;另一方面是“创新搜索”作为被调节变量的结果:“将双元创新搜索及企业创新绩效分别作为自变量与因变量,情境分离作为调节变量”;“引入知识属性作为调节变量,以弄清创新搜索宽度和深度对于创新绩效的作用机制以及知识属性对这种机制作用的调制强度或方向”等。


3.3 理论


在研究过程中,我们经常会遇到这样的句子:“本文的理论视角是......”,“本文基于XX理论解决了XX问题”等,由此可见理论在研究中的重要地位。这一部分关于理论的介绍,以“扎根理论”为例,探讨如何借助CNKI句子检索功能来快速学习这个理论是什么?如何使用?理论的边界条件有哪些?使用的效果怎么样?该理论有什么缺点?


①首先,“扎根理论”是什么?将“扎根理论”与“定义”同句检索,在分组浏览中选择“扎根理论”,可以看到这样的检索记录:“他们将扎根理论定义为:从社会研究中获取数据,并通过系统的方法分析数据从而发现理论的一种研究方法”。通过检索记录,我们可以了解到扎根理论其实就是在收集到的资料和待发展的理论之间的工具。


②其次,如何使用“扎根理论”?了解到扎根理论的基本定义之后,我们不妨再利用CNKI句子检索功能查找扎根理论的使用步骤。将“扎根理论”与“步骤”同句检索,可以看到这样的检索记录:“主要包括资料收集过程、三层次编码和理论生成与检验3个阶段”,根据这条检索记录,我们可以从这基本的三个步骤出发去学习“扎根理论”。第一步资料收集阶段,关于资料的来源有这样的记录:“资料可以是访谈和观察获得的第一手田野数据,也可以是图书馆的档案数据、日记等文献资料,教材、《课程标准》属文献资料”;第二步三层次编码阶段,有这样的记录:“访谈文本的编码工作按照扎根理论的三个步骤开展,即开放式编码、主轴编码和选择性编码”;第三步理论生成与检验,可以看到这样的记录:“理论生成与检验扎根理论的主要目标是建立实质理论”,在张婕的论文中,我们可以看到“通过资料分析过程生成初步的理论(通常为实质理论)后,还需要对理论进行检验和评价”。因为检索记录较少,如果理解不到位,就可以点击搜索到的学术论文了解详细内容。在了解“扎根理论”的基本步骤之后,那么研究者都是在哪些领域中去应用“扎根理论”的呢?同句检索“扎根理论”和“应用”,在分组浏览中选择主题,就可以发现有应用于影响因素分析、案例分析、质性研究等主题的。如果想要继续了解在每一个领域是怎样应用的,就不妨点击你想要了解的那个主题,在检索结果中学习。


③然后,“扎根理论”的边界条件是什么?理论的边界条件即使理论有效的前提条件。为了解“扎根理论”的边界条件,我们将“扎根理论”与“使用前提”同句检索,出现了4条记录,其中达到我们检索目的的信息只有一条:“斯特劳斯的《质性研究概论》中认为扎根理论使用前提是研究现象有关概念必须没有全被表明出来,即使概念理清,概念间的关系也没有完全被了解,或者没有人对该现象做过切实的研究,不知道该现象的影响因素”。到这里我们就大概明白“扎根理论”的边界条件了,至于更详细的内容就需要从大量文献中去总结。


④最后,“扎根理论”的使用效果怎么样?有什么缺点?将“扎根理论”与“局限性”进行同句检索,在检索记录中我们可以看到现有文献中对“扎根理论”局限性的分析体现在“扎根理论”的三个步骤中。在数据收集方面,比如“受访群体对于研究问题的熟知程度,是否访谈到了某一领域的权威人士等”;在编码方面,比如“如在编码时难以真正保持一颗‘无知的心’,或多或少地带有作者个人的主观认识”;在理论生成与检验方面,比如“无法对其所建立的理论进行验证,要想建立以及验证系统化的、超越具体情景的、具有普遍性的理论,离不开定量方法的补充”。


以上就是针对概念、命题和理论在学术研究中可能遇到的一些问题,借助CNKI句子检索功能来有效应对的实例。从实例中可以看出,每一次检索都要输入2个或4个关键词,所以关键词的选取也是至关重要的。


4.讨论:猜测的作用


在进行文献检索时,因为同义词、多义词等问题的存在,会导致我们检索不到想要的文献。利用CNKI句子检索功能时,我们可以通过不断变换关键词来提高检索效率,那么需要哪些关键词呢?此时猜测发挥了很大的作用。我们不妨借助Taylor的信息需求四层次模型来说明猜测在信息检索中发挥的作用吧。

640 (1).png

图1 信息需求的四个层次


Taylor提出的信息需求四层次模型[13](如图1)认为,从有信息需求到进行信息检索要经过四个层次,分别是:Q1,实际存在而未意识到的信息需求;Q2,大脑开始有意识的对信息需求进行描述;Q3,对信息需求的正式表达;Q4,把信息需求表达为符合信息检索系统规则的语言。


信息需求是人们为解决各种问题而产生的对信息的必要感和不满足感,当人一旦有了信息需求以后,就会采取各种方法来获取所需信息[11-12],CNKI句子检索功能就属于这些获取信息方法中的一种。Taylor认为,信息需求具有无形性、抽象性的特征,会造成在借助检索系统查找信息时的不准确[14-17],也即我们不能保证将信息需求转化为检索关键词时的准确性,所以就需要尝试,找同义词、相关词、或者是经常同时出现的词等。在这个过程中,猜测就开始发挥作用,我们要依据经验合理猜测。


我们在这里提到猜测并非毫无根据,有很多研究者对猜测在科学研究中发挥的作用进行了详细的论证。例如,George Polya[18]157将科学研究的方法总结为猜测和检验;类似地,Karl Popper[19]则将研究方法总结为猜想和反驳;还有Susan B Shipley[20]认为研究假设其实就是一种猜测,只不过是有根据的猜测。由此可见,猜测在科学研究中确实发挥着重要的作用,所以在信息检索的过程中也要合理地应用猜测,提高检索效率。


结论


综上,现有关于CNKI句子检索功能的研究中,缺乏其在提高研究效率方面的应用。因此本文针对该问题,从学术研究成果的要素:概念、命题和理论三个方面列举实例,说明怎样利用CNKI句子检索功能快速查找目标信息,提高研究效率,并强调了猜测在检索过程中的重要性。本文梳理了如何使用CNKI句子检索功能以提高研究效率,丰富了现有CNKI句子检索功能的应用研究。


☉文章 | 李彩君、王晶
☉来源 |
 Smart Innovation


参考文献

[1] 武波,刘明. CNKI检索盲点及对策[J].中国发明与专利, 2019, 16(03): 101-104.

[2] 周广西. CNKI同句和同段检索功能在查新中文文献检索中的应用[J].图书馆工作与研究, 2017(04): 83-85.

[3] 邵文博,夏文静. CNKI“同句检索”在专利审查中的应用[J].中国科技信息, 2019(23): 24-26.

[4] 陈优.利用CNKI数据库高效检索现有技术的方法[J].河南科技, 2020(03): 153-155.

[5] 边恩莲.判断文献内容独创性的检索利器——CNKI检索平台精确检索功能使用体会[J].合肥师范学院学报, 2008(03): 130-132.

[6] 曹文彪.概念、命题及理论——简论学术成果的三要素[J].当代社科视野, 2010(11): 32-39.

[7] WALKER L O, AVANT K C. Strategies for Theory Construction in Nursing [M]. 6th ed., NY:Pearson, 2019.

[8] 姜红丙,刘跃文,孙永洪,马建.论证理论视角下的管理理论构建研究[J].管理学报, 2016, 13(01): 7-17.

[9] 温忠麟,侯杰泰,张雷.调节效应与中介效应的比较和应用[J].心理学报, 2005(02): 268-274.

[10] 张莉,林与川.实验研究中的调节变量和中介变量[J].管理科学, 2011, 24(1): 108-116.

[11] 齐虹.用户信息需求立体结构模型探讨[J].档案学通讯, 2009(02): 32-35.

[12] 宋朋.检索中的信息需求理论:将信息与知识建立联系[J].情报学报, 2015, 34(03): 227-235.

[13] TAYLOR R S. Question-Negotiation and Information Seeking in Libraries [J]. College & Research Libraries, 1968, 76(3): 251-267.

[14] 国佳,李建华,李贺.从信息到知识:信息需求理论研究[J].情报理论与实践, 2012, 35(06): 16-20+15.

[15] BELKIN N J, ODDY R N, BROOKS H M, et al. Ask for Information Retrieval: Part I.: Background and Theory [J]. Journal of Documentation, 1997, 38(2): 299-304.

[16] BELKIN N J, ODDY R N, BROOKS H M, et al. Ask for Information Retrieval: Part II. Results of a Design Study [J]. Journal of Documentation, 1982, 38(3): 145-164.

[17] HJORLAND B. The Foundation of the Concept of Relevance [J]. Journal of the Association for Information Science and Technology, 2010, 61(2): 217-237.

[18] POLYA GEORGE. Mathematical Discovery: On Understanding, Learning, and Teaching Problem Solving [M]. New York: John Wiley, 1962.

[19] POPPER K R. Conjectures and Refutations: The Growth of Scientific Knowledge [M]. New York: Harper & Row, 1968.

[20] SUSAN B SHIPLEY. The Hypothesis: An Educated Guess [J]. Aorn Journal, 1980, 32(5): 860-864.

(本文已录用,尚未刊出)


没有账号?