HSK动态作文语料库代码说明(共6页).doc
《HSK动态作文语料库代码说明(共6页).doc》由会员分享,可在线阅读,更多相关《HSK动态作文语料库代码说明(共6页).doc(6页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、精选优质文档-倾情为你奉上“HSK动态作文语料库”语料标注及代码说明“HSK动态作文语料库”从字、词、句、篇、标点符号等角度,对所收入的作文语料中存在的外国人使用汉语的中介语偏误进行全面标注。1 、字处理(包括标点符号) C:错字标记,用于标示考生写的不成字的字。用C代表错字,在C前填写正确的字。 例如:地球C(“球”是错字)、这C。 B:别字标记,用于标示把甲字写成乙字的情况。别字包括同音的、不同音而只是形似的、既不同音也不形似但成字的等等。把别字移至B中B的后面,并在B前填写正确的字。 例如:提B题高、考虑B虎。 L:漏字标记,用于标示作文中应有而没有的字。用L表示漏掉的字,并在L前填写所
2、漏掉的字。 例如: 后悔L,表示“悔”在原文中是漏掉的字。 农L药,表示“农”在原文中是漏掉的字。 D:多字标记,用于标示作文中不应出现而出现的字。把多余的字移至D中D的后面。 例如:我的D的,表示括号中的“的”是多余的字(原文中写了两个“的”)。 F:繁体字标记,用于标示繁体字。把繁体字移至F中F的后面,并在F前填写简体字。 例如:记忆F憶、单F單纯、养F養分F份。 注意: 1)繁体字标记标示的是使用正确的繁体字,如果该繁体字同时又是别字,则先标繁体字标记,再标别字标记。 例如:俭朴F樸B僕。 2)繁体字写错了,标为:后F後C。 Y:异体字标记,用于标示异体字。把异体字移至Y中Y的后面,并在
3、Y前填写简体字。 例如:偏Y徧、沉Y沈。 P:拼音字标记,用于标示以汉语拼音代替汉字的情况。把拼音字移至P中P的后面,并在P前填写简体字。 例如:缘Pyan分、保护Ph。 #:无法识别的字的标记,用于标示无法识别的字。每个不可识别的字用一个#表示。 例如:更#保存自己的生命, BC:错误标点标记,用于标示使用错误的标点符号。把错误标点移至BC中BC的后面,并在BC前填写正确的标点符号。例如:勤奋、BC,刻苦的精神。BQ:空缺标点标记,用于标示应用标点符号而未用的情况。把BQ插入空缺标点之处,并在BQ中BQ的后面填写所缺的标点符号。 例如:周围的环境很安静BQ,生活也非常平凡。BD:多余标点标记
4、,用于标示不应用标点符号而用了的情况。把多余的标点移至BD中BD的后面。 例如:我家周围的BD,美丽风景。2、词处理:(包括成语) CC:错词标记,用于标示错误的词和成语。包括4种情况: 1)把词的构成成分写错顺序的。 把写错的词移至CC中CC的后面,并在CC前填写正确的词。 例如:首先CC先首、众所周知CC众所知周。 2)该用甲词而用乙词的。这种情况类似别字,但属于用词层面上的错误。 标示方法同上。 例如: 虽然现在还没有实现CC实践, 它在CC对价格方面有点贵,所以没得到广大消费者的支持CC持支。 3)生造词。指考生自造的、或某些外语中可能有而汉语中不存在的词。 例如: 农作物CC农产物/
5、农物、农产品CC农作品 但长期来看造成环境污染,破坏自然生态CC目态, 绿色食品的好处在于吃这些食品后在身体里没有农药的残留量CC潜留量。 4)词语搭配错误。包括词性、音节等方面的搭配错误。 例如: 最好的办法是两个都保持CC走去平衡。 我也回CC1回去沈阳。 吃这种东西会CC1可以得CC1得到病CC1疾病。 CLH:离合词错误标记,用于标示各种和离合词相关的错误。标在有错误的离合词的后边,表示前边的离合词用法有误。 例如: 我快要毕业CLH大学CQ了。 虽然这么L多年都没见面CLH过, 我对哈尔滨CJ-zy很感兴趣。有观光CLH哈尔滨的宿愿。 W:外文词标记,用于标示以外文词代替汉语词的情况
6、。把外文词移至W中W的后面,并在W前填写相应的汉语词。在W和外文词之间填写汉语词的字数。 例如: 非洲W2Africa、爵士乐W3jazz。 教我工作的方法W2ABC。 CQ:缺词标记,用于标示作文中应有而没有的词。在缺词之处加此标记,并在CQ中CQ的后面填写所缺的词。 例如: 这就CQ要由有关部门和政策管理制度来控制。 有的农民CQ在不使用化肥和农药的情B精况下BD,养农作物, CD:多词标记,用于标示作文中不应有而有的词。把多余的词移至CD中CD的后面。 例如: 然后肯德基的收入有所增加CD了。 中国政府应该采取良好的措施来管理农业CD方面, 但我觉得CD按照上面所写的方法是现在很多人或国
7、家用的方法。 词处理中需要注意下列问题: 1)因介词、方位词等的缺少或多余造成的结构不完整,助词的错用、多用、漏用,词性误用等,均视为词的错误。 例如: 随着社会CQ的发展,人们CQ对吃的东西很重视。 在这个过程CQ中 特别是非洲CD的话,问题很大的。 2)结构助词“的” 、“地” 、“得”混用:按错词处理。 例如: 按照人们的要求不用化肥和农药的话,产量会大大地CC的下降。 我认为当你很饿的时候,什么东西都吃得CC的下。 孩子们饿得CC地大哭小叫, 3)该用汉语数字而用阿拉伯数字的,一律按错词处理。 例如: 那应该怎样解决呢?所以我想出了一CC1个办法,少用化肥和农药。 把“十五”写成了“一
8、五”,应把“一五”整体按错词处理,而不能仅仅把“一”处理为别字。 4)错词、多词、成分赘余的一个标注符号中可以包括两个或两个以上的词。 例如: 我想任何人CC每一个都不要有浪费食品的习惯,(每/一/个) 没有CC2重视做未经污染的食品就是绿色食品。(重视/做/未/经) 5)原文字数和改后字数不一致的,须在括号中CC之后且紧靠CC处加一个阿拉伯数字,表明改后的字数。 例如: 战Pzhan争中最困难的人是没有力气的孩子和老人CC5老弱子。 所以我认为首先农民可以使用天然肥料CC4化肥,代替化肥来种植农作物 6)不清楚或无法理解的词用CY标示,表示“存疑”,标在该词的后面。 例如: 虽然这么L多年都
9、没见面CLH过,但我和他们的忆惯CY,是忘不了的。3、句处理:CJ:病句标记,用于标示错误的句子。一般标在有错误的句子之后、该句标点之前,并用小写汉语拼音字母简要标明病句的错误类型。 例如: 他把那本书看CJba。 我认为我们先尽量地B的产出农作物给他们,先给他们不挨饿CJjy。 如果有人批评这是太奢侈CJxw, 句子错误类型代码: CJba : 把字句错误 CJbei : 被字句错误 CJbi : 比字句错误 CJl : 连字句错误 CJy : 有字句错误 CJs : 是字句错误 CJsd : “是的”句错误 CJcx : 存现句错误 CJjy : 兼语句错误 CJld : 连动句错误 CJ
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- HSK 动态 作文 语料库 代码 说明
限制150内