常用在线语料库使用简介复习课程.ppt
《常用在线语料库使用简介复习课程.ppt》由会员分享,可在线阅读,更多相关《常用在线语料库使用简介复习课程.ppt(65页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、常用在线语料库使用简介BNC1.BNC官网主界面(图1-1)简单搜索区简单搜索区简单搜索区简单搜索区基本信息及基本信息及基本信息及基本信息及功能介绍区功能介绍区功能介绍区功能介绍区进入简单搜索功能介绍进入简单搜索功能介绍进入简单搜索功能介绍进入简单搜索功能介绍图1-12.BNC在线检索功能介绍 2.1 BNC simple search提供简单的检索功能,适用于快速检查词汇的频数、拼写等。可检索:a word,punctuation mark,or delimited string e.g.jam,?,Mrs.;a word-and-POS pair,e.g.CAN=NN1;a phrase,
2、e.g.not on your life;a pattern,e.g.colou?r;an SGML query,e.g.bread _ butter BNC2.1 BNC simple search可通过点击图2.1-1中的链接了解检索语言和词性标注代码BNC检索语言说明检索语言说明检索语言说明检索语言说明词性标注代码词性标注代码词性标注代码词性标注代码图2.1-12.1 BNC simple search随机生成50条结果,不以索引形式排列。例如检索“feature=VVB”,检索结果如图2.1-2 BNC频数频数频数频数出处出处出处出处图2.1-2 2.2 其他可下载的BNC产品BNC
3、XML edition:BNC全库BNC Baby:BNC子库,包含小说、新闻、科技、口语四类文本各100万词BNC sampler:BNC 子库,包含书面语、口语两类文本各100万词注:以上语料库采用XML格式,需使用XAIRA软件检索BNCBNC3.其他BNC检索界面(如图3-1)图3-1COCA4.COCA简介由美国杨伯翰大学(Brigham Young University)的Mark Davies 教授开发,是大型语料库资源平台http:/corpus.byu.edu/的一部分。如图4-1图4-1COCA4.COCA简介COCA语料库规模大,涵盖美国1990-2012年间口语(spo
4、ken)、小说(fiction)、流行杂志(pop magzine)、报纸(newspaper)和学术期刊(academic)五大类型的文本使用界面友好,检索速度快时效性强,不断更新功能COCA5.COCA界面简介 三大功能区:显示及查询条件界定区,包括:显示方式区,字串查询区,语料库分类区,查询结果排列方式区。查询结果数据显示区 例句显示区COCA5.COCA界面简介(图5-1)http:/corpus.byu.edu/coca/图5-1显示方式区显示方式区显示方式区显示方式区COCA5.COCA界面简介(图5-1)图5-1字串查询区字串查询区字串查询区字串查询区COCA5.COCA界面简介
5、(图5-1)图5-1语料库分类区语料库分类区语料库分类区语料库分类区COCA5.COCA界面简介(图5-1)图5-1查询结果排列查询结果排列查询结果排列查询结果排列方式区方式区方式区方式区COCA5.COCA界面简介(图5-1)图5-1查询结果数据显示区查询结果数据显示区查询结果数据显示区查询结果数据显示区COCA5.COCA界面简介(图5-1)图5-1例句显示区例句显示区例句显示区例句显示区/帮助信息显示区帮助信息显示区帮助信息显示区帮助信息显示区COCA5.1 显示方式区(DISPALY)(图5.1-1)LIST列表显示CHART图表显示,可以显示在各语料库类型中的使用频率和各时间段内的使
6、用情况。KWICKey word in context,例句以词语索引的形式呈现COMPARE单词比较显示,比较两个不同词或短语的搭配情况。图5.1-15.2字串查询区(图5.2-1)WORDS:输入字符串COLLOCATES:搭配词限定POS LIST:搭配词词性限定COCA图5.2-15.3 语料库分类区此区共包括42个子语料库,可以对查询的字符串限定语料类型(Genre)和时段(Year),并可明确限定某一个子语料库,或某一年某个字词的使用情况。(图5.3-1)COCA图5.3-15.3 语料库分类区42个子语料库(图5.3-2)COCA图5.3-25.3 语料库分类区42个子语料库(图
7、5.3-3)COCA图5.3-35.4 查询结果排列方式区Sort by:检索结果的排列方式,可按频率、关联度、或字母顺序排列,一般默认按频率排列(图5.4-1)Minimum:检索结果的最低限定值,可按频数或MI值进行限定,默认最低频数为10(图5.4-2)COCA图5.4-1图5.4-2COCA5.5 查询结果数据显示区以列表形式呈现结果(图5.5-1)图5.5-1COCA5.5 查询结果数据显示区以图表形式呈现结果(图5.5-2)图5.5-25.6 例句显示区 默认例句显示方式(图5.6-1)COCA图5.6-15.6 例句显示区 KWIC显示方式(图5.6-2)颜色代表不同词性COCA
8、图5.6-26.主要搜索功能介绍 6.1 搜索words、phrases、lemmas、wildcards和其他更加复杂的字词 6.1.1 检索某一词形输入“feature”(图6.1.1-1)COCA图6.1.1-16.1.1 检索某一词形在搜索结果区可得到“feature”的频数(图6.1.1-2)点击该词,可在例句显示区看到含有“feature”的词条(图6.1.1-3)COCA图6.1.1-2图6.1.1-36.1.1 检索某一词形在显示方式区选择KWIC 并再次点击search,可得含有“feature”的词语 索引(图6.1.1-4)COCA图6.1.1-4COCA6.1.2 检索
9、某一词性的单词输入“feature.v*”,可得到“feature”做动词时的使用情况(图6.1.2-1)“.”表示feature不与其后的字符串组成短语“v*”代表所有形式的动词点击POS LIST后的问号,可了解具体词性代码图6.1.2-16.1.3 检索短语输入“white n*”(图6.1.3-1)可得所有white修饰的名词短语 (图6.1.3-2)COCA图6.1.3-1图6.1.3-26.1.4 检索lemma输入“suggest”(图6.1.4-1)可得suggest所有词形的使用 情况(图6.1.4-2)COCA图6.1.4-1图6.1.4-26.1.5 使用通配符检索“*”
10、代表任意数量的字符“?”代表一个任意字符 输入un*ly和r?n*,结果如图6.1.5-1,6.1.5-2COCA图6.1.5-1COCA6.1.5 使用通配符检索图 6.1.5-26.2 检索搭配词 如需检索prevail前的名词,可在WORD(S)里输入“prevail”,COLLOCATES里输入n*,右边跨距设为0,如图6.2-1COCA图6.2-16.2 检索搭配词prevail左侧高频搭配名词如下(图6.2-2)由高频搭配词可知,prevail常与表示“条件,环境”,或者“制度,观点”的词搭配COCA图6.2-26.2 检索搭配词点击conditions可进一步观察prevail的
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 常用 在线 语料库 使用 简介 复习 课程
限制150内