计算机数据库技术在语言学研究中的利用,普通语言学论文.docx
《计算机数据库技术在语言学研究中的利用,普通语言学论文.docx》由会员分享,可在线阅读,更多相关《计算机数据库技术在语言学研究中的利用,普通语言学论文.docx(8页珍藏版)》请在淘文阁 - 分享文档赚钱的网站上搜索。
1、计算机数据库技术在语言学研究中的利用,普通语言学论文语言学是一门既古老又年轻的学科,语言学的研究不只是理论和分析方式方法的创新。当代科学表示清楚,研究方式方法和操作手段的更新往往成为理论发展的契机。语言学的研究需要收集、加工、处理语料,并强调语料的真实性和客观性。语言学研究的学者都能感遭到语料处理方式和手段的重要性。 语言学研究者面对大规模的文本语料,要从这些语料中开掘新的语言规则或需要的信息,首要任务就是对大规模真实的文本语料进行加工、挑选。采用手工的处理方式方法对海量语料数据进行统计、分类、分析等操作,工作效率会非常低,而且劳动强度非常大。这也促使处理语言材料的工作方式方法和操作手段发生变
2、化。数据库技术是一门数据管理自动化的综合性技术,数据库是组织、存储和管理数据的仓库。随着计算机技术的广泛应用和网络的普及,数据库在生产、生活、科技领域得到了广泛地应用和推广,在语言学研究中也表现出了强大的优势,已成为语言学家的重要工具。 二、数据库与语言学 数据库,顾名思义,就是存放数据的仓库。只不过这个仓库是在计算机存储设备上按一定的格式存放的,具有强大的数据组织、数据处理和数据管理能力。语言学研究的语料具有规模大、类型多、异构性、零散性等特点,使用数据库管理能够提高语言学研究者的工作效率。要想高效地使用数据库来存储、管理各种语言材料,语料库设计的首要任务就是对语言材料数据进行合理地定义,建
3、立便于对数据进行加工、处理的语言材料数据库。数据在数据库中的定义包括定义数据存储的格式、数据的存储类型和数据之间关联关系。数据的定义是数据库使用的关键,好的定义能够方便用户对数据进行统计、检索和处理。数据库管理系统具有强大的数据定义功能,为语言学研究者提供使用数据库的可能。 数据库在语言学中的应用主要具体表现出在对语言材料的加工和处理方面。数据库强大的数据定义功能为语言材料的存储提供了可能,更重要的是语言学研究者能够通过定义的语言材料对海量的语料进行加工和处理。数据库有强大的数据处理功能,语言学研究者能够通太多种操作方式方法获取语言材料信息,如挑选语料、语料排序、语料分类、语料统计和语料的更新
4、等。譬如,何乐士的( 左传 虚词研究中的文章大都写于二十世纪六十年代,当时主要靠手抄卡片积累资料、分析统计,这些工作何先生需要花费大量的时间和精神,几天甚至十几天才能获得结果,而如今研究者大都使用数据库或语料库,输入检索内容霎时就能准确无误地得到结果。这也是数据库的最大受益之处,省时省力。 当前,随着计算机网络的普及和各种语言材料数据库的建设,使语言学研究者最大限度地占有语言资料成为了可能,充分具体表现出了数据库的资源分享性。语言学研究也有不同的研究目的和语料需求,要想使数据库能够知足不同的主题需求,需要建立愈加广泛的数据资源库。当然,语言材料的来源不同,类型不同,要让这些异构异质资源进行合理
5、定义集成。语言学的研究需要现有的语言学研究成果,语言材料的数据库能够保证语言材料的可靠性,同时可以以知足语言学不断发展更新的需要,这也是数据库本身的特征。 随着计算机的发展,数据库在语言学中得到了广泛的应用,已成为语言学家的重要工具。利用数据库技术使其具有构造化、关系化、集成、稳定等特点,建立语言材料的数据仓库 语料库。语料库Corpus就是存放原始语言材料的数据仓库,就是一个由大量在真实情况下使用的语言信息经过科学的收集和组织而集成的专供研究使用的资料库。近年来计算机技术的发展,相关研究者和组织建立了广泛的语料库。 三、语料库语言学 语料库的设计需要大量真实语料的不断搜集、积累。所谓的语料库
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 文化交流
限制150内