YiCorpus单语语料库检索—— Concordance使用指南
索引(Concordance)又称为“语境中的关键词”(key word in context, KWIC),指的是运用索引软件(concordancer)在语料库中查询某词或短语的使用实例,然后将所有符合条件的语言使用实例及其语境以清单的形式列出。
所谓“语境中的关键词”(KWIC)指的就是我们所得到的所有索引行(concordance lines)中都有一个共同的词(即检索词search word,或称节点node)。在这些索引行中,每一行中检索词都位于中间,前后各有若干词,即检索词的语境。YiCorpus多功能语料库检索平台提供排序功能,使用者可以设定不同的排序方法对检索词的前后语境进行排序,以便于我们从索引行中寻找规律。
在YiCorpus单语语料库检索工作界面,我们可以根据需求在“检索条件”里选择“检索模式”和“结果展示”,也可以设置“屏蔽词”。

检索模式:文本检索/通配符检索/正则表达式检索/区分大小写

(右上角-帮助-通配符)

(右上角-帮助-正则)
结果展示:只显示文本/只显示标注/显示文本和标注

(只显示标注)

(显示文本和标注)
屏蔽词:屏蔽后不展示含该词结果,多个屏蔽词请使用分号分隔
我们可以根据研究需要,一键切换“KWIC显示”或是“全句显示”。
在“显示设置”里,我们可以设置“显示宽度”和“排序方式”,以便在结果中展示我们所需内容。
(显示宽度即左右显示多少词;排序方式中L1-L10,R1-R10,即Left and Right Context)

在“统计信息”中,我们可以切换“文本”或“语料库”,查看检索词词频统计相关信息。

并且还支持Excel和 Txt格式的检索结果导出,根据导出的结果可以做进一步的分析研究。
利用好索引工具是语料库分析中最基本也是最重要的技能,而如何解读索引行则与研究问题、研究中的发现密不可分。
还没人赞这篇日记