《汉字概说》PPT课件.ppt
汉字 第一节第一节 汉字概说汉字概说 第二节第二节 现代汉字的形体现代汉字的形体 第三节第三节 现代汉字的结构现代汉字的结构 第四节第四节 现代汉字的构字法现代汉字的构字法 第五节第五节 汉字的信息处理汉字的信息处理 第六节第六节 字位及其突出方式字位及其突出方式 第一节 汉字概说 一一 文字的性质文字的性质 1.1.性质性质 文字是记录语言的书写符号体系,是最重要的辅助性辅助性交际工具。有声语言受到时间和空间的限制 有了文字,语言就可以留下痕迹。第一节 汉字概说 2 2要素要素 文字作为视觉对象都有一定的固定的形状(表现为一定的点和线的组合),这种形状必须代表语言中一定的声音和意义。任何一种文字都有形、音、义三个要素。没有“形”就不能成其为记录语言的符号,不记“音”就不能代表有声语言,而这种“音”必须代表一定的意义。第一节 汉字概说二、汉字的性质二、汉字的性质 文字是记录语言的符号体系,这是世界上一切文字的共性,它正确地说明了文字和语言的关系。汉字的性质,指的是该种文字区别于其他文字的本质特点,是文字类型学要研究的问题。正确认识一种文字的性质,是正确解决有关这种文字种种问题的基础。第一节 汉字概说 一种文字的性质就是由这种文字所使用的符号的性质决定的。文字是记录语言的符号,作为语言的符号的文字,跟文字本身所使用的符号是不同层次上的东西。例如:汉字“花”是汉语里花草之“花”这个词的符号,“艹”和“化”是这个字所使用的符号(字符)。古汉语里的“”,作为“日”这个词的符号来看,是一个有音有义的字;作为“日”字所使用的符号来看,则仅仅是像太阳之形的一个象形符号。第一节 汉字概说 语言有语音和语义两个方面,作为记录语言符号的文字,也必然有音有义。就这一点说,各种成熟的文字体系之间并没有区别。只有根据其字符的特点,才能区分各种文字体系。各种文字的字符,大体上可以归纳成三类,即意符、音符和记号。意符 跟词在意义上有联系的字符 音符 跟词在语音上有联系的字符 记号 跟词在语音和意义上都没有联系的字符 第一节 汉字概说 拼音文字只使用音符,汉字则三类符号都使用。(1)汉字字符有大量意符 意符内部还可以分类,木、石、示、衣、水、囗(方)、(圆)等为形符。“歪”这个字中的“不、正”为义符。第一节 汉字概说 (2)音符 语气词“其”借“簸箕”之“箕”表示;“花钱”之“花”借“花草”之“花”表示。形声字的声旁也是音符,如“珥”(玉石制的耳饰)、“花”之“耳、化”。第一节 汉字概说 汉字的音符跟拼音文字的音符有区别汉字的音符跟拼音文字的音符有区别 拼音文字的音符是专职的,汉字的音符则是借本来既有音又有义的现成文字充当的。有很多汉字在充当合体字的偏旁的时候,既可以用作音符,也可以用作意符,而且还能兼起音符和意符的作用。例如“耳”字在“饵”、“铒”等字里是音符,在“聪”、“聋”等字里是意符,在“珥”字里是音符兼意符。一般拼音文字所使用的字母数量都相当少。汉字音符的情形就不同了。从原则上说,汉字里每一个字都有可能借为音符,实际上用作音符的字,数量也很大(古今用作声符的字超过一千)。同样的字音往往借用不同的字来表示。如果要强调汉字和拼音文字的音符的区别,可以把汉字的音符称为“借音符”。第一节 汉字概说 (3)记号 在文字形成的初始阶段,有少量长期沿用的记号吸收到文字里来,古文字里的“十”、“八”等数字大概就来自这种记号。除此以外,用记号造字的情况就很难找到了。但是在汉字发展的过程里,由于字形和语音、字义等方面的变化,却有很多意符和音符失去了表意和表音的作用,变成了记号。第一节 汉字概说 表:小篆本是从衣、毛,指罩在皮衣外面的衣服的名称;春:小篆从艹(艹,春时生也)、从日,屯声,隶变的“春”是半记号;我:甲骨文像一种锯或刃形像锯的武器,楷书字也变成了记号字。再如:凤、权、劝、仅、对等字中的“又”,既不表音,又不表义,是纯粹的记号。总之,由于种种原因,在我们现在使用的汉字里,原来的意符和音符有很多已经变成了记号。相应地,很多表意字、形声字和假借字,也就变成了记号字或半记号字。第一节 汉字概说 结论:汉字在象形程度较高的早期阶段(大体上可以说是西周以前)基本上是使用意符和音符(严格地说应该称为借音符)的一种文字体系。后来随着字形的语音、字义等方面的变化,逐渐演变成为使用意符(主要是义符)、音符和记号的一种文字体系。第二节 现代汉字的形体 一、字的形体一、字的形体 字的形体:文字特定的书写(包括印刷)形状。形体和字体不是同一概念。字体,有时还指书写派别、书写风格不同的字,如欧体、颜体、柳体等,而就形体说,它们都是楷体。在一定的历史时期,字的某种形体占据主要地位。甲骨文是殷商的通行形体,金文是周代通行的形体,大篆是春秋战国时期秦国的统一形体,小篆是秦朝统一六国之后以政令形式推行的标准形体,隶书是汉代的主要通行形体。不同的形体,在笔画的姿态上不一样,如或方角或圆转、或为纯粹的线条或为点横竖撇;在外形的轮廓上也不一致,如或参差或整齐、或长方或扁方;构体情况也不统一,如部位是否固定不一;其他诸如笔画的繁简、异体字的多少等等,也有差别。第二节 现代汉字的形体 二、现代汉字的形体二、现代汉字的形体 现代汉字是简化字总表和印刷通用汉字字形表公布以后的,记录现代汉语的用字。现代汉字的形体,有印刷体和手写体的区别,它们都是在楷书基础上从笔形上作了一些变体,各有各的变体。手写体通常用行书,也可用楷书、草书、隶书、篆书等,现代商业设计逐渐采用各种pop手绘字体。第二节 现代汉字的形体 1印刷体 现代汉字的印刷体仍以楷书为范式,采用楷书和楷书的印刷变体。其特点是笔画清晰,端正匀称,便于辨认,大都不容易手写。印刷体可分为铅字印刷体和照排字体两大类。第二节 现代汉字的形体 铅字印刷体又可基本分为老宋体、仿宋体、正楷、黑体四种。宋体 又称古宋体、老宋体、灯笼体,其特点是正方形,横笔细、竖笔粗,有装饰性点线,不便于书写。这种字体起源于明代中叶,实际上并非起于宋代,叫它宋体是一种误会。后来知道了,为了区别仿宋体,就称它为老宋体。这种字体是最常用的印刷铅字体,是印刷体的代表形式。仿宋体 又叫真宋体,是比较接近宋代印刷和一种形体,称为仿宋,名副其实,确为仿宋版所用的形体。仿宋体分正仿、长仿,正方形的叫正仿,长方形的长仿。它的主要特点是笔画不分粗细,横竖全使用较细的匀称笔画,讲究顿笔,字形秀丽。一般用于表格的题头,或用于排印诗词和正文中的夹注等。正楷体 也称大宋体,是用于印刷上的楷书字体,同手写楷体一样,笔画比仿宋丰满,多数用来印刷通俗读物、小学课体和儿童读物等。黑体 也称方体、方头体、黑头体、粗体。黑体的主要特点是笔画从下笔到收笔一样粗,撇、捺等笔画不带尖。字迹浓黑醒目。通常用来表示着重语句,以引起注意和重视,也常用于标题。很少全篇用它来印刷的。印刷体根据字体的大小编号,叫做字号。常用的字号从大到小有初号、一号、二号、三号、四号、小四号(新四号)、五号、小五号(新五号)、六号、七号等十种。铅字印刷体一般用于活字印刷术,例如书籍、报刊、杂志、名片、信封等的印刷。第二节 现代汉字的形体 照排字体即照相字排,它是利用字盘和各种摄影主镜头、变形镜头左右前后移动,使同一种字体有各种大小、长宽、斜度变化,并将所需的文字一个一个摄取冲洗于相纸或底片上,然后用它编排制作“黑稿”。它的字体种类多,一个字盘可以排出7级到100级大小不同的字来,字体优美而富于变化。第二节 现代汉字的形体 2手写体 手写体的标准形式是行书。1965年1月30日,文化部和中国文字改革委员会联合发布了印刷通用汉字字形表,共收常用印刷宋体字6196个,明确规定了每个字的字形标准,统一印刷字形,使印刷体与手写体楷体也基本上一致。第二节 现代汉字的形体 印刷宋体与楷体的笔形基本上是一样的,只有少数字的笔画形状有差异。如走之儿的第二笔,宋体是横折,而楷体是横折折撇。草字头,宋体是横、竖、竖,而楷体是横、竖、撇。宋体月、目、自、且、日、曰、白、甘等字中间的横画与左右两边的笔画相接,而楷体只与左边的笔画相接,与右边的笔画相离。宋体“田”字中间一横与左右两边的笔画相接,而楷体则与两边的笔画相离。“雨”字作头时,宋体中的四点是四短横,而楷体中仍是四个点。宋体“小”字及“木”底带钩的字,左边是一短撇,右边是一长点,楷体左右两边都写成点。如小,少少,尘尘,尔尔,尕尕、尖尖,东东,拣拣、杂杂、寨寨、亲亲,茶茶等。宋体琵、琶、琴、瑟等字中左上角的王,其末笔是横,楷体作提;舟作左旁时,宋体末笔是横,楷体却改成提。第三节 现代汉字的结构一、结构单位 现代汉字的形体结构可以分为汉字、部件、笔画三个层次。汉字的最小构件是笔画,笔画依照一定的规则组合成部件,部件依照一定的规则组合成合体字。汉字是最高层次,部件是中间层次,笔画是最低层次。层次越高,表示一个字所用的符号越少,符号的总数越多。如最高的汉字层,表示一个字只需一个符号,如果有5万汉字,就得用5万个符号。层次越低,表示一个字所用的符号越多,符号的总数越少。如最低的笔画层,表示一个字最多要用几十个笔画符号(辞海中笔画最多的字是“齉”,36画),而笔画的总数减少到横竖撇点折等有限的几种。部件处于中间层,它是组成现代汉字的能够相对独立的结构单位。部件比笔画完整,又比汉字本身简单、灵活,所需的符号数目适中。在汉字形体结构的三个层次中,部件是枢纽性的一环,是汉字形体结构的核心。第三节 现代汉字的结构 (一)笔画(一)笔画 1笔画和笔形 笔画是汉字最小的构形单位,就是构成汉字的各种点和线。按楷书的要求写,从下笔到抬笔就是一个笔画。笔尖的走向和行程不同,就产生不同的笔画。笔画的形状即笔形,笔形分基本笔形和复杂笔形。1965年1月发布的印刷通用汉字字形表规定了五种笔形为基本笔形:横:横:竖:丨竖:丨 撇:丿撇:丿 点:丶点:丶 折:乛折:乛 1964年,汉字查字法整理工作组经过多次征求意见和比较研究,建议以横、竖、撇、点、折的顺序为规范,通称“札”字法。第三节 现代汉字的结构 为满足汉字的构形需要,在字的不同位置或不同部件中,基本笔形会在方向、直弯的角度、长短等方面发生不同的变形,当然这种变形不是指个人在书写时的自由变形,而是指依楷书要求书写的强制性变形。各种笔形的使用有一定的规律。例如:平撇只出现在部件的正上方,如千、禾、兵等;斜撇只出现在部件的左上方,如修、余、钉、包 竖撇只出现在部件的左侧,如月、厂、川。基本笔形可以派生各种复杂笔形。复杂笔形都不仅是由一个点或一条线构成的,要么是两条线或多条线,要么是一个点和一条线,如:“又”的第一笔横撇是由两条线构成的复杂笔形 “专”的第三笔竖折撇是由三条线构成的复杂笔形 “女”中的第一笔撇点是由一条线和一个点构成的复杂笔形 汉字的复杂笔形主要有十几种。五种基本笔形依起笔频率从高到低排列顺序是:一 丿 丶 丨 乛。第三节 现代汉字的结构 2笔顺 笔画在书写时,有先后顺序,即笔顺。书写汉字讲究笔顺。笔顺的正确与否,关系到字形的好坏和书写速度,汉字笔顺的一般规则是先横后竖,先撇后捺,从上到下,从左到右,还有从外到内,特殊的还有先中间后两边(如:水)。还有些上述规则以外的情况:右上或里边的点一般后写(如:夜、戈)横在字中间地位突出要后写(如要、册)竖在中间穿底的后写,不穿底的先写(如出、串)走之底、建字底要后写(如这、建)多数字的写法是以上规则的综合运用。第三节 现代汉字的结构 国家语言文字工作委员会标准工作委员会编了现代汉语通用笔顺规范,1997年8月由语文出版社发行。该规范给出了1988年3月由国家语委和新闻出版署发布的现代汉语通用字表中7000个通用汉字的笔顺。1999年10月,上海教育出版社出版了由国家语委制定的GB13000.1字符集汉字笔顺规范国家语言文字工作委员会语言文字规范GF30021999,1999年10月1日发布,2000年1月1日实施。本规范由。给出了GB13000.1字符集、汉字笔顺规范制定原则及该字符集所收20902个汉字的序号式笔顺。第三节 现代汉字的结构 规定笔顺的主要原则:规定笔顺的主要原则:一是便于书写。一是便于书写。现代汉字是横行排列的,采取先左后右,先撇后捺的笔顺,写完一个字后便于写下一个字。汉字基本笔画中横、捺、提总方向是自左至右。竖、撇的方向是自上而下,所以,采用“先左后右、从上到下”的笔顺,也可以照应笔画走向,使书写便利一点。二是便于组织结构。二是便于组织结构。如“国”字,假如先写“玉”,后写“囗”,往往会把字写大,与其他字的大小不一致,或是把方框写到“玉”的笔画上。再如“水”假如自左到右写,往往不易写得匀称,采取先中间后两边的笔顺,就容易把结构组织得好些。三是不破坏汉字的笔画系统。三是不破坏汉字的笔画系统。有些字,怎么写也不方便。比如“凸”规定的笔顺是竖、横、竖、横折折折、横,之所以这样规定是因为没有其他笔画。第三节 现代汉字的结构3笔画的组合笔画组合有三种类型:相离、相接、相交。相离:二三六八川刁氵相接:(1)匕上工正刀(相接的笔画,一个在端点,一个不在端点)(2)厂了口弓己(相接的笔画,两个都在端点)相交:十丈丰七九卅车综合运用以上三种类型的笔画组合也很常见。例如:“弋”,其中的横与斜钩是相交关系,这个组合同向右上的点是相离关系“饣”中的撇同横钩是相交关系,这个组合同下边的竖挑是相离关系。相同的笔画组合由于组合关系不同,构成的汉字也不同。如:八人入力刀田由甲申工上干士第三节 现代汉字的结构(二)部件(二)部件1部件及其层次部件也叫字根、字元或字素,是汉字的基本构字单位。部件介于笔画和整字之间,它大于或等于笔画,小于或等于整字。第三节 现代汉字的结构部件是笔画的组合,大于笔画,如:“口”有3笔,“日”有4笔,“聿”有6笔。但是有的笔画在一定条件下,可以单独成为部件,这时笔画和部件所指相同。最明显的是“一”和“乙”是部件,也是笔画。除了“一”和“乙”之外,处于分离状态的横、竖、撇、点、折,也单独构成部件。如“旦、旧、氕、礼”。可见笔画等于部件是有条件的,不是任何时候笔画都可以成为部件。第三节 现代汉字的结构 部件是基本构字单位。由一个部件构成的字是独体字,如“人、口、手”。由两个或两个以上部件构成的字是合体字。对独体字来说,部件等于整字,对合体字来说,部件小于整字。部件有大有小,它本身可以分级。对多层次的部件组合,由大到小逐层分解,直到单独的部件,不能再分为止。这样得出的部件依组合层次分别叫做一级部件、二级部件、三级部件等等。不论处在哪个层次上,只要是不能再分下去的部件,叫做末级部件。如“戆、麟”各有四个层次,七个末级部件。一般说部件,都指末级部件。第三节 现代汉字的结构 2部件的名称和部位的名称 为了便于称说,每个部件都应该有名称。成字部件就用该字的读音,如“土、白、长、中”等。在321个成字部件中,有43个有习惯名称。例如:宀:宝盖儿 冖:秃宝盖 忄:竖心儿 亻:单立人 艹:草字头 辶:走之儿 灬:四点底 刂:立刀儿 第三节 现代汉字的结构 有的部件不只一个名称,需要规范;没有名称的,就应有一通俗的、易被人们接受的名称。根据部件在整字中所处的位置,合体字可以有8个部件,名称是:上上“头头”下下“底底”,左,左“旁旁”右右“边边”,内内“心心”外外“框框”,中,中“腰腰”四四“角角”。第三节 现代汉字的结构 头 上下结构的上部,两面包围结构的左上部和右 上部。如八字头(公分、学字头(觉)、厂 字头(厌历)、气字头(氕氧)底 上下结构的下部。如心字底(志忠)、皿字底 (盖监)、儿字底(兄先)旁 左右结构的左边,两面包围结构的左下部。如 单立旁(他)、绞丝旁(红)、火字旁(灯)、走之儿旁(进这)、建之儿旁(延建)边 左右结构的右边。如立刀儿边(利刘)、工字边 (红扛)、方字边(防纺)心 全包围、三面包围结构内部。如玉字心(国)、口字心(问句)、又字心(凤)第三节 现代汉字的结构 框 全包围、三包围结构的外部。如国字框(因 国)、门字框(问闷)腰 左中右、上中下结构的中间部分。如秃宝盖 腰(壶受)、又字腰(树)角 上下结构的四角。如口字角(器嚣)、月字 角(赢)有了部件的名称和部位的名称,就能比较容易地说明字的结构。如“赢”字是亡字头,口字腰,左下是月字角,右下是凡字角,下部的中间是贝字腰。第三节 现代汉字的结构 3部件的变形 部件(末级部件和非末级部件)的变形指同一个部件由于出现在字的不同部位而引起的形体变化。可分为两种情况:一种是改变部分笔画的形状 一种是拉长或压扁,以便使整字的各部分协调匀称。如“犬、贝”在左左中右结构中要拉长,如状、狱、购、财等,在上下、上中下结构中压扁,如哭、器、货。第三节 现代汉字的结构 改变部分笔画的形状改变部分笔画的形状 (1)横改提:工、豆、鱼、马、牛、且等开笔是横的部件作左旁时,末笔的横改为提。如城、豇、驷、特、助。(2)竖改撇:“半、羊、辛”作左旁时末笔的竖改为撇。如判、翔、辣。(3)撇改竖:“月”在别人部件下边时起笔的撇改为竖,如有、青、肯,例外:萌、霸、赢。(4)捺改点:人、又、仓、禾等右边有捺笔的,作左旁或处在包围、半包围结构之中时,捺改为点。如从、劝、这、创、秋。(5)避重捺:当一个字的临近笔画有两个或两个以上的捺笔时,为了摆稳全字重心,使字形富于变化,只保留一个捺,其余的改为点。如奏、秦、暴、这、述、餐等。第三节 现代汉字的结构 (6)横折钩改横折竖:羽、甫处于别的部件上边时,去掉钩,如褶、翼、博、敷等。(7)横折弯钩改横折弯:“几”处在别的部件上边时,去掉钩,如朵、没、铅、般等。(8)横折弯钩改横折提:“几、九”处在别的部件左边时,第二画的横折弯钩改为横折提。如鸠、微等。(9)竖钩改竖:“小、可”用在别的部件上边时,竖改为竖。如少、劣、抄、雀、哥等。(10)竖钩改撇:“手”用在左旁或中腰时,竖钩改撇,如拜、掰、湃等。(11)竖弯钩改竖提:“七、厄、己、毛、克”等末笔为竖弯钩的部件作左旁时,竖弯钩改为竖提,如切、顾、改、橇、兢等。第四节 现代汉字的构字法 构字法研究的是一个字按照什么原则组成的,也就是研究构字的理据。汉字组成的研究有两个角度:溯源的研究和现状的研究。溯源的研究着眼于古字形,传统将汉字构字法分为四类(即所谓“六书”,一般认为“四体二用”):象形、指事、会意、形声(“二用”指转注、假借)。现状的研究则着眼于新字形,将构字法分为七类。第四节 现代汉字的构字法 溯源的研究和现状的研究在很多情况下是一致的,但是也有相当数量的字不一致。例如:“从、休、库、吠”,溯源的研究和现状的研究都是会意字;“裘、洲、枫、纨”,都是形声字。这是一致的例子。不一致的例子,如“日、月、山、水”,溯源的研究是象形字,而现状的研究是记号字;“江、河、柳、攀”,溯源的研究是形声字,现状的研究是半意符半记号字。第四节 现代汉字的构字法 一 独体表意字 由单独一个意符构成,从形体上能知道它的意义,这类字在现代汉字中很少。如:凹:低于周围 凸:高于周围 丫:像分杈形 一、二、三:是由原始记数符号流传下来的 按照传统的六书理论,这几个字都属于指事字。第四节 现代汉字的构字法 二 会意字 会意字是合体字,一般由两个意符组成。如:戒:表示双手持戈有所戒备。杳:日落在木下,表示幽暗。磊:表示石头众多。森:表示树木。掰:用两手分开。劣:从少从力,表示力弱。粜:从出从米,指买卖。灭:用一压住火 楞:从四方木。由三个意符构成。第四节 现代汉字的构字法 三、形声字 合体字中由意符和音符构成的字是形声字。形声字的音符是表音成分。区分两种形声字,一种是传统的形声字(也叫广义的形声字),指古代字书中的形声字,或者说是具有形声结构的字,如:江、河;另一种是现代汉字的形声字(也叫狭义的形声字),指意符表意,音符表音的形声字,如湖、榆。现代汉字中形声结构的字约占90%(据周有光统计,现代汉字中音符的有效表音率为39%)。按照狭义计算当然没有那么多。第四节 现代汉字的构字法 现代汉字中的形声字,音符和整字读音相同的如:懊懊:从心奥声,烦恼、悔恨。:从心奥声,烦恼、悔恨。洲洲:从水州声,大陆:从水州声,大陆 肤肤:从肉夫声,皮肤。:从肉夫声,皮肤。态态:从心太声,状态:从心太声,状态 株株:从木朱声,露出地面的树根、树干:从木朱声,露出地面的树根、树干 桩桩:从木庄声,木桩:从木庄声,木桩 有的形声字,字义古今不同。但是因为意符表意具有模糊性,有的意符还可兼通古今。如:“油油”从水由声,依说文指水名,现指油脂,油脂古称膏从水由声,依说文指水名,现指油脂,油脂古称膏 有的形声字的音符兼表意,如:娶娶:从女取声,指嫁娶,:从女取声,指嫁娶,“取取”兼表取得。兼表取得。驷驷:从马四声,指一车套的四匹马。:从马四声,指一车套的四匹马。“四四”兼表意。兼表意。懈懈:从心解声,指懈怠。:从心解声,指懈怠。“解解”兼表解散。兼表解散。第四节 现代汉字的构字法 四、半意符半记号字 这类字中有不少本来就是古代的形声字,由于音符不能准确表音,而字义古今没有很大的变化,就变成了半意符半记号字。如:布布:从巾父声,音符已经变得不能识别。:从巾父声,音符已经变得不能识别。急急:从心及声,经隶变,音符已经破坏。:从心及声,经隶变,音符已经破坏。霜霜:从雨相声,表天象的字多从雨。:从雨相声,表天象的字多从雨。醉醉:从酉卒声,醉是饮酒的结果,从酉的字与酒有:从酉卒声,醉是饮酒的结果,从酉的字与酒有 关。关。有的是由于汉字简化,使得音符不再表音。如:灯灯:繁体作燈,从火登声。:繁体作燈,从火登声。炉炉:繁体作爐,从火盧声。:繁体作爐,从火盧声。第四节 现代汉字的构字法 有的是古代的形声字,省去音符的一部分,因而不再准确表音。如:雪:说文从雨彗声。后彗省为彐,不再表音。有的是古代的象形字变化而成,一半是意符,一半是记号。如:栗:甲骨文栗,上部像栗树上的栗子,后讹变为西。泉:甲骨文泉,像流出泉水的泉穴,楷书变为从白从 水,白是记号。桑:甲骨文桑,上部像繁茂的枝叶。第四节 现代汉字的构字法 五 半音符半记号字 这一类主要来自古代的形声字,由于意符不再表意而形成。如:球球:从玉求声,本指一种美玉。后假借为:从玉求声,本指一种美玉。后假借为“毬毬”,意意 符符“玉玉”成为记号。成为记号。诛诛:从言朱声,本指用言语谴责,故从言。后变为:从言朱声,本指用言语谴责,故从言。后变为 诛杀。意符诛杀。意符“言言”成为记号。成为记号。第四节 现代汉字的构字法六 独体记号字 主要来自古代的象形字。由于字体的演变,古代的许多象形字已经不再象形。如:日、月、山、水、手、木、心、舟等等。说这些字变成了记号,是从形体上已经看不出所像为何物。当然,经过指点,有的字很容易联想它所像的东西。不过这就变成了溯源的分析。这些字是独体记号字,可是当它们用作偏旁进入合体字,就具有了意义,如“日”在“晴、明、旦、昏、晒、晖、晨、暗”中作为意符表示这些字和日光、明暗有关;说“日”是记号,是说从它现在的形体看不出像太阳,但是它作为一个字,有音有义,用作偏旁时保留了它的音义,这并不矛盾。第四节 现代汉字的构字法 有些独体记号字属于古代的假借字。这样的字经溯源也不能说明字形和字义的关系。如:我我:本像一种锯或刃形似锯的武器,假借为第一人称代词。:本像一种锯或刃形似锯的武器,假借为第一人称代词。而而:本像颊毛,假借为连词。:本像颊毛,假借为连词。有些独体记号字来自古代的指事字。如本、本、末、刃、寸末、刃、寸等。有些合体字经简化后成为独体字。如:乐乐:繁体作樂:繁体作樂 龙龙:繁体作龍。:繁体作龍。门门:繁体作門:繁体作門 书书:繁体作書。:繁体作書。也有的独体字是来自形声字,如:年年:从禾千声:从禾千声第四节 现代汉字的构字法 七 合体记号字 古代有些象形字,经过变化不再象形,成为合体记号字。如:角、龟、鹿、马、它、燕、鱼等本像它们所表示事物的形状角、龟、鹿、马、它、燕、鱼等本像它们所表示事物的形状 有的来自古代的形声字,当这些字的意符和音符都失去了作用,就成为合体记号字。如:骗:从马扁声,本指跃上马。后世主要表示欺骗。骗:从马扁声,本指跃上马。后世主要表示欺骗。特:从牛寺声,本指公牛。后世主要表示特殊,不同于一般特:从牛寺声,本指公牛。后世主要表示特殊,不同于一般 有的来自古代的会意字。如:射射:甲骨文:甲骨文“射射”像用手拉弓射发。后讹变为从身从寸。像用手拉弓射发。后讹变为从身从寸。委委:说文:说文:“委,委随也。从女从禾。委,委随也。从女从禾。”段注:段注:“随随 其所如曰委。其所如曰委。”至至:甲骨文像箭射至地。:甲骨文像箭射至地。形体变化已经看不出原意。第五节 汉字的信息处理一 中文信息处理 信息就是消息、情报,我们的生活任何时候都离不了信息。人类传播信息的第一媒体是有声语言,第二媒体是文字。信息传播的第三媒体是电磁波。通过电磁波,信息可以在瞬间传遍世界,人类社会进入了传声技术的新时期。人脑是高度发达的物质,它能对通过感官获得的信息进行各种加工处理,从中得到各种知识和智慧。20世纪,科学技术高速发展,信息量大增。电脑是人脑的延伸,可以节省人的脑力,完成许多人脑不能完成的工作。语言信息处理指“用计算机对自然语言的音、形、义等信息进行处理。即对字、词、句、篇章的输入、输出、识别、理解、生成等的操作与加工”。处理语言信息,主要通过文字。第五节 汉字的信息处理 二 汉字的输入 (一)非键盘输入(一)非键盘输入 1.OCR。就是光学字符识别技术,采用的工具是扫描仪。2.手写输入。专用笔在专门的手写板上书写。常用的汉王和慧笔软件中都带有这种手写板和笔。3.语音识别技术。处理者通过说话将需处理的内容输入电脑,现在尚未普及。第五节 汉字的信息处理(二)键盘输入法(二)键盘输入法 1.1.流水码。流水码。每个汉字编一个唯一的编码,一个编码对应一个汉字,如区位码、电报码等,适用于某些专业人员,如电报员、通讯员等。2.2.音码。音码。音码输入实际上一种拼音转变法,也就是输入拼音,由计算机自动转变为汉字。其实,用汉语拼音进行输入应该不能算是一种“汉字编码”,因为它是不必另行编制的,它与普通话语音完全一致,只要懂得汉语拼音,就可以直接用键盘操作。全拼双音、双拼双音、新全拼、新双拼、智能拼音等都属于音码,它们都是按照拼音规定来输入汉字的。3.3.形码。形码。是按汉字的字形(笔画、部件)来进行编码,又是一种将字根或笔画规定为基本的输入编码,再同这些编码组合成汉字的输入方法。最常用的形码有笔画码、五笔字型、表形码等。4.4.音形码或形音码。音形码或形音码。音形码以字音为主,以形为辅,用形来区别同音字。形的部分有人采取部首,有人取用汉字的角码。形音码以形为主,以音为辅,有的是把字分解为部件和笔画,再利用部件和笔画的读音帮助记忆。如支秉彝发明的“见字识码”。5.5.音形义混合码。音形义混合码。自然码是目前较常用的一种混合码。第五节 汉字的信息处理(三)智能拼音(三)智能拼音 虽然也是拼音,也有重码,但包括了自动记忆、自动忘却、自动造词、自动调整和低屏蔽等功能,使得输入速度很快。新全拼输入法提供的词汇达40000条。在新全拼输入法中,对于常用词组和汉字,键入拼音(有时只需键入声母)便可出现。对于系统中不存在的词组,按输入新词的方法,只要拼音输入一次便会自动记忆下来(最多可达9个汉字),下一次只要输入字的声母便可出现这个词,把造词融合在长期输入过程中。经常使用的词或字的位置可自动向前调整,低频词组可自动屏蔽,长期不用的词组可自动忘却。这样,通过长期使用智能化的新拼音输入法,系统内便全是与用户相关的词和字,从而大大提高了汉字输入的速度。第五节 汉字的信息处理 1.单字输入 完整输入:将字的全部拼音都健入。如:Kai:1开2揩3楷 4凯5慨6剀7垲 不完整输入:可以用来输入那些使用频率较高的单字。如:D:1的2地3得4大5吨6对7多 无论是完整输入还是不完整输入,随着某一个字使用频率的增加,该字在提示行中的位置会自动前移。第五节 汉字的信息处理 2.词组输入 完整输入:beijing 1北京2背景 不完整输入:可以省略词组中任意字的韵母。首字声母+末字声母,首字声母+末字声母+末字韵母,首字声母+首字韵母+末字声母,如:开放 kf 1开发 2开放 3克服 4咖啡 5看法 6开封 kfang 1开放 2空防 3客房 4库房 5空房 kaif 1开发 2开放 3开封 4开方 5开赴 6开饭第五节 汉字的信息处理(四)五笔字型(四)五笔字型 它把汉字的笔画归为横、竖、撇、点、折五种,将部件分为130个左右,部件组合成的结构分成左右型、上下型、杂合型。1基本字根及其排列 130个左右的基本字根分为五个区,每区内的基本字根又分为五个位置。在同一键位的几个基本字根中,选择一个具有代表性的字根,称为键名。这样平均每键26个字根;每键上的字根,其形态与键名相似;单笔基本字根的种类和数目与区位编码相对应。第五节 汉字的信息处理 2编码规则 (1)键面有 键名:将所在连打四下。如言、又、山。成字字根:报户口,加打第一、二、末笔画(不足四键,补空格键),如西、方、厂。(2)键面无 依照书写顺序(如新)、取大优先(如平、果)、兼顾直观(自)、能散不连、能连不散(于、天)的原则拆分字根。超过四码的:依次键入即可,如照。不足四码:字根键入完后,补打末笔字型识别码”。第五节 汉字的信息处理 (3)提高输入速度的各种输入法 简码输入:一级简码字:25个,敲一键,再敲一空格健。二级简码字:625个,敲前两码的键,再敲空格键。三级简码字:约4400个,省去最后一码的识别工作。词汇输入:双字词:分别取前两个字根构成词汇简码,如计算。三字词:前两个字各取一个字根,第三个字取前两个字根 作为编码,如操作员、解放军。四字词:每字取一字根作为编码,如程序设计。多字词:取一、二、二、末四字的第一个字根作为编码。如中华人民共和国。第五节 汉字的信息处理(五)汉字标准交换码汉字交换码是用于计算机之间信息交换的代码,位于一台机器的出口和另一台机器的入口之间。有了统一的汉字交换码,各种输入输出设备的设计就有了统一的根据,信息资源的共享也有了保证。汉字库的设计要以汉字标准交换码为根据。常用字和次常用字分为两个字库。由于字数太多,字库内采用两个字节来定位。第一个字节决定区位,第二个字节决定区号。第五节 汉字的信息处理中国大陆的标准交换码,是1981年3月国家标准局公布的信息交换用汉字编码字符集基本集,代号为GB2312-80。基本集收入通用字6763个,还有各种符号、字母682个,共有图形字符7445个。6763个通用字分为两级,第一级为常用字3755个,按照汉语拼音字母顺序排列;第二级为次常用字3008个,按照部首排列。代码表分为94区,每个区有94位,区的编号从1到94,位的编号也是如此。代码表中的任何一个图形符号的位置,用它所在的区号的位号来标志,区号和位号之间用短横相连。例如“场”的区号是10,位号是01,它的区位码就为1001;“郢”的区号是59,位号是11,它的区位就是5911。第五节 汉字的信息处理这种标准代码要直接用来输入汉字,必须像电报发报员那样的专门人才。因此,一般将其作为内部码,而将各种简易的编码方案作为输入编码,进行两级转换。基本集收字只有6763个,不能满足用字量多的用户的需要,因此需要研制辅助集。1987年3月27日,国家标准局发布了信息交换用汉字编码字符集第二辅助集(GB7589-87)和信息交换用汉字编码字符集第四辅助集(GB759087)。第二辅助集收汉字7237个,第四辅助集收7039个。这两集都是简化字集。有关部门正在研制第三、五辅助集,这三集是与基本集和第二、四辅助集相配合的繁体字集。第六节 字位及其突出方式 一 字位、字位变体 文字虽然是记录语言的符号,但它并不消极,而是积极地作用于语言,对语言的发展起一定的促进作用。它克服了语言的时空限制,使语言能够更好地为全民服务,推动了民族共同语的形成,促进了文学语言的形成和规范化。文字在记录语言的过程中,更是不局限于其工具功能,而是以其能动性努力地作用于它所记录的语言,以其不同的面貌强化它所传达的情感和意志。文字的不同面貌就涉及到字位了。字位指记录同一语义单位的不同书写形式。同音位一样,每个字位也可以有许多变体形式,如各种各样的手写体,同一字位的形状大小不同的体式等都是字位变体。字位变体没有区分概念意义的功能,但有人际功能和谋篇功能,例如可表示不同程度的正式性。印刷体般表示正式程度高的语篇;手写体则一般多表示正式程度低的语篇。古体字则可给语篇赋以古朴、庄严、肃穆的风格。第六节 字位及其突出方式 字位变体可分为常规形式和突出形式。常规形式指其一般情况下的表现形式,也称无标记字位符号,突出形式则指为了强调某种意义而采取的与一般不同的特殊形式。文字突出方式产生于三个区别性因素:符号标记、空间和顺序。符号标记包括各种类型、形状和大小的文字符号。从符号标记上讲,汉语的书面无标记字位符号是宋体,以及其他标准符号。其他的文字符号则主要是作为突出方式来使用的,如楷体。从空间上讲,在文字符号之间或上下左右所留的空间符合常规要求的是无标记的,如在段首几个字母的空位是无标记的,其他空间布局是突出形式。从顺序的角度来看,根据常规、按先后顺序排列的为无标记顺序,其他顺序可作为突出形式来使用。第六节 字位及其突出方式 由此,字位突出方式包括由特殊的字体、标点符号、首字下沉等所形成的突出手段。其失衡突出方式表现为某种字位符号的超规则或高频率出现,其失协突出方式表现为字位的非规则用法或略用。在字位系统中,有一些特殊的符号特征专门用于突出手段,如破折号、括号、首字下沉、大的字号等。另外,还有些字位突出方式出现在段落、段落群及整个语篇中。它们包括楷体、空间布局、黑体字等。除误拼词外,其他字体特征可视为超切分字位特征。其失衡突出表现为其在语篇中高频率或超规则的出现上;其失协突出则表现为其在语篇中的非规则性和转换用法上。第六节 字位及其突出方式 二 字位变体与平面设计 平面设计艺术兴起后,字体成为平面设计的对象和内容。文字的体态及排列组合的好坏,直接影响平面设计的视觉传达效果。字体设计是提高作品诉求力,赋予作品审美价值的一种重要构成技术。平面设计是将不同的基本图形,按照一定的规则在平面上组合成图案。尽管平面设计主要指标志设计、杂志广告设计、海报设计、贺卡设计、图书封面设计等,但反观一切书面文字作品,无论是报刊文章、产品说明书、一个带文字的flash画面、一个powerpoint文档、一个主页,还是一部专著、一封求职信,甚或一篇作文、一张便笺,它们其实也都是一种特殊的平面设计作品。文字设计精美的作品,都会让人爱不释手,其优美的形式,给人愉悦的同时,能将读者导向其表现的内容。文字设计主要体现在字体形态和版式编排,平面设计的独立性也正在于此。第六节 字位及其突出方式 (一)文字体态的选用和设计(一)文字体态的选用和设计 1字体选用 每一种字体,都有它自身的表情和表达效果。如黑体有醒目严肃的感觉,老宋有端庄刚直的表情;仿宋有清秀自由的意趣。草书虽因在造型上难为大众了解,又缺乏实用与易读性,不适用于一般文字设计用,但草书具有信赖、亲切、高雅等特性,用于感谢等需要表达内心情感波动时,也不失为好素材。正书(又称楷书)的笔迹有力,笔画清楚,易读性最高,是一般书籍信件最通行的标准字。行书易识好写,实用范围广。日用文书一般都用行书书写。印刷体则相当于老宋,具有端庄明确的感觉。手写体则相当于仿宋、行、草,有轻松活泼的体态。在现代的平面设计中,也常常用到古代字体。篆书有华贵古朴的风貌,其图形的抽象趣味在近代的篆刻上常被艺术化了,多应用于贺年卡、请帖、徽章、图案等设计,强调的是一种肃穆和吉庆的古雅味道。隶书因带有波势的装饰笔画,方中带圆,显得古雅、庄重,可表现传统的权威感,多用在广告设计里,公司、行号或展示会的全名设计(合成文字)常用隶书。第六节 字位及其突出方式 不同的字体还具有不同的视觉动向,例如,扁体字有左右流动的动感,长体字有上下流动的感觉,斜体字有向前或向斜流动的动感。因此在组合时,要充分考虑不同的字体视觉动向上的差