收藏 分享(赏)

语文词汇定量研究:现状和可资利用的成果.pdf

上传人:高**** 文档编号:1072854 上传时间:2024-06-04 格式:PDF 页数:5 大小:159.37KB
下载 相关 举报
语文词汇定量研究:现状和可资利用的成果.pdf_第1页
第1页 / 共5页
语文词汇定量研究:现状和可资利用的成果.pdf_第2页
第2页 / 共5页
语文词汇定量研究:现状和可资利用的成果.pdf_第3页
第3页 / 共5页
语文词汇定量研究:现状和可资利用的成果.pdf_第4页
第4页 / 共5页
语文词汇定量研究:现状和可资利用的成果.pdf_第5页
第5页 / 共5页
亲,该文档总共5页,全部预览完了,如果喜欢就下载吧!
资源描述

1、语文词汇定量研究:现状和可资利用的成果汉语词汇教学目标能够量化,已是一个不争的事实。自 1898 年德国语言学家 F.W.凯丁出版第一部根据统计材料编成的德语频率词典以来,各国语言学家、教育家都十分重视编写频率词典,从频率的高低来确定常用词,推进词汇的教学,提高学习效率。如美国的教育家兼心理学家 E.L.桑代克对英语词汇的频率做了大量的统计工作,在此基础上编写了教师两万词词书和教师三万词词书。后来人们又在此基础上将常用词分为最低限度词汇、常用词汇、次常用词汇、一般常用词汇等几个等级,供教学选用,把词汇教学纳入科学的轨道。汉语常用字词的研究,要说早则早矣。周宣王时的太史籀,为了教学童,编史籀篇。

2、秦朝李斯、赵高和胡毋敬又各自取材于史籀篇,改籀文为秦篆,分别编了仓颉篇爰历篇博学篇。汉代的民间先生又将这三部字书合并,题名为“仓颉篇”。此后汉武帝时司马相如编凡将篇,元帝时史游编急就篇,成帝时李长编元尚篇。它们开我国集中识字学词教学之先河。到后来大量涌现的诸如千字文三字经百家姓等蒙童韵语识字课本,其编写方法无不是脱胎于前者。千字文选择了 1000 个字,都是古书上常用的,基本上没有生僻字,只有个别字重复。三字经是 1140 字,用的都是极常见的字,讲的都是极通俗浅显的名物事理,用字有一定的重复。百家姓是 568 字,字数少,所列的字大多是儿童很容易理解的普通常见的姓,有个别复姓中的用字重复。三

3、本书合起来,总字数是2708 个,除去重复的字不算,单字是 1426 个。从字种比例看,“三、百、千”有 73.67%的字是现代汉语常用字,有 10.61%是现代汉语次常用字,两项合起来,有 84.27%的字在我们常说的 3500 个常用字范围内。单从字种比例看,“三、百、千”即使在今天仍然不失为优秀的识字课本。如果把这些蒙童韵语读物看成我国古代语文教育工作者在母语字词教学方面的数量范围追求的有益尝试的话,我国母语词汇教学量化实践的历史可谓长矣。当然,科学意义的词汇目标量化工作是要建立在词频统计工作基础上的。我国第一部汉语频率字典是陈鹤琴在 1928 年编成的语体文应用字汇,他分析了55447

4、8 个词,得出 4261 个常用字。但这还不是严格意义上的频率词典。对汉语词汇频率的统计研究,最早应算普通话三千常用词表。该词表为郑林曦先生所编,初稿本出版于 1959 年,收词 3624 个,增订本出版于 1987 年,收词 3996 个。这是我国第一本按汉语语法分词类排列的常用词表,原本主要是供学习普通话、编写普通话课本、读物时参考的。从学习者、使用者的反应来看,该词表确实收到了较好的社会效果。不过,该词表无论是初稿本还是增订本,都没有采取统计大量材料的方法,而采取选择和统计、检验相结合的方法。据编者介绍,词表编成后,曾利用各种性质的书报文章约130000 多字、50000 多词进行常用性

5、检验,结果证明,初稿本的词汇出现频率平均约为80%,增订本的词汇出现频率提高到 87%。另一项具有手工性质的劳动,是 1980 年前娄警予、马世一等教师,对当时试行的十册统编教材中的中学生应该理解掌握的常用词,作了比较详尽的调查和统计,一共理出6494 个常用词。他们认为这远远不够,因此,又按照现代汉语词典的顺序,挑出他们认为中学生应该学习掌握的词汇 6113 个。此外,他们认为现代汉语小词典所选的3000 条成语,绝大多数都是中学生应该学习和掌握的,而那套课本只出现了 814 个。据此,他们提出,中学语文应该教给学生的词汇,大约应是 15000 条左右(其中成语约 3000条,其他词语约 1

6、2000 条)。他们因此按音序列成了中学生常用词汇表,并提出“到底是多少,又应该包括哪些词汇”,需要“大家共同来研究”,他们只是“向全国热心于语文教学改革的同志们提供一个蓝本”。这是目前我们所知的新中国第一项直接面向学校教育的汉语词汇目标量化研究。这项研究肯定没有借助计算机,它的选词标准也不是建立在词频统计基础上的,因而就某一具体词语的当选与否来讲,其科学性肯定是差点儿。这项成果也没有在全国推广。但这项研究的巨大意义就在于,它是新中国语文教育史上第一项明确关于汉语词汇教学量化标准问题的研究。我国开展大规模的不同用途的汉语词频统计工作,是在计算机技术得到广泛应用以后。这些成果中比较具有全局意义的

7、直接面向学校和用作其他需要的各有数项,下面略作介绍:(一)直接面向学校的1.北京师范大学现代教育技术研究所部分研究人员同中文系部分汉语教师合作,利用两年多的时间,对全国统一使用的 19831984 年度的中小学语文教材(共 24 册)作了大规模的词频统计与分析。共输入 104 万字,约生成 4 万个词条。然后再利用计算机把词频值和方差值(即词在各种文体中的覆盖率)都达到某一界限的词全部选出来,确定为常用词。这项成果于 1985 年 7 月通过国家鉴定,并形成现代汉语词表三千常用词表八千常用词表一万常用词表和现代汉语构词字典等具体成果。这项研究的意义毋庸置疑,但是,它并没有提出中小学词语教学的量

8、化标准,而且,词频统计的取材范围只局限于当时的一套统编教材,这个选材面太窄了,明显不足以证明所选词语的“常用性”,统计结果受该教材的编辑思想和选文标准的局限是自然的。2.北京语言学院语言教学研究所从 1979 年 11 月开始至 1985 年 7 月止,历时 5 年零 8个月,对 4 类(报刊政论、科普、生活口语、文学作品)语体 179 种 180 万字的语料进行统计,共得到词条 31159 个,其中出现频率在 10 次以上的常用词,只有 8000 个。这 8000个词累计出现频率占全部语料总量的 95%强,其余 23159 个词的累计出现频率仅占全部语料的 5%弱。据此他们编成现代汉语频率词

9、典。这项成果还直接生成或影响了另外两项成果:一是国家对外汉语教学领导小组办公室汉语水平考试部,据此确立了汉语水平词汇与汉字等级大纲(1992)和汉语水平等级标准(1995)里的词汇量化标准 8821 个(亦说 8822 个)。一是国家语委据此编制了普通话水平测试大纲(修订本)(1994)“普通话(口语和书面语)常用词语”表一里的 8454 个常用词语。这项成果对对外汉语教学产生了比较大的影响,直到现在它还是人们讨论对外汉语词汇教学问题的依据,但是这项成果对国内中小学语文教学并没有产生直接影响。(二)用作其他需要的1.北京航空航天大学等 10 个单位,从 1981 年到 1986 年,历时 6

10、年,前后有数百人,进行了一项据他们自己称是“世界上迄今为止规模最大的”汉语词频统计。这次词频统计选材 3 亿汉字,编码输出 2000 万汉字(含标点符号),统计出词条达 7 万之多,统计材料覆盖 1919 年至 1982 年的四个时期,涉及社会科学和自然科学的 10 类学科。该项研究1986 年 6 月 30 日通过国家级鉴定,主要成果收集在刘源主编的现代汉语常用词词频词典里。2国家语委语用所现代汉语通用词课题组,在近 2 亿汉字语料的基础上,吸收国内外主要的词频统计成果,并运用新的抽样语料进行覆盖率检验,采集我国“社会生活各个方面、各行各业都通用”的现代汉语词汇。该项研究的首批成果现代汉语通

11、用词基本集已通过专家审定(1997),它收词 6 万多,其中一级词 5191 个,二级词 8792 个,共13893 个。现代汉语通用词基本集以外还有扩充集。扩充集以短语为主。3.许嘉璐、傅永和主持,清华大学、北京大学、国家语委语用所等十多个单位联合攻关完成的国家社科研究九五规划重大项目“信息处理用现代汉语词汇研究”,得到一个包含 158000 个字词的工作初表,然后再将这个表中的每个词置于 8 亿字左右的语料中作词频统计,最后采用“定性+定量”的处理策略(即运用各类语言学规则并参照统计数据),形成这个课题的核心成果之一信息处理用现代汉语分词词表。这个词表共收词 92843 个,其中一级常用词

12、 56606 个,二级常用词 36237 个。这项成果除了给出到目前为止有统计学依据的最大现代汉语常用词表外,特别值得我们注意的有两点:一是该词表的词语分类。整个词表分成 7 大分库:普通词库、带字母词库、专名库、常用接续库(即语法学上的短语)、成语库、俗语库以及单字词库。每库词语又根据频度分为一级常用、二级常用。这些数据对于我们制定语文词汇教学量表有重要参考价值。二是该词表还采取了一个技术性措施,即强制要求该表必须涵盖普通话常用三千词及汉语水平词汇与汉字等级大纲给出的汉语常用 8000 词,仅仅淘汰了极少量过时的词。这使我们更加有理由重视汉语“八千常用词”,即上文所说“8821”或“8454

13、”。以上三项成果,虽然都不是直接面向和服务于学校教育的,但它对于我们制定汉语词汇教学标准,考虑选词范围和选词量,是有重要参考价值的。参考文献:(1)倪宝元语言学与语文教育,上海教育出版社 1995 年。(2)徐梓、王雪梅蒙学便读,山西教育出版社 1991 年。(3)张志公传统语文教育初探,上海教育出版社 1962 年。(4)郑国民等小学语文常用读物的字种与字量研究“三、百、千”“四书”、古诗 80 首等六种读物的用字,语言文字应用2003 年第 4 期。(5)郑林曦普通话三千常用词表,文字改革出版社 1987 年。(6)张志公语文教学研究中学语文教学研究会会刊第一辑,教育科学出版社 1980 年。(7)何克抗、李大魁现代汉语三千常用词表,北京师范大学出版社 1987 年。(8)吕必松对外汉语教学概论(讲义)(续十),世界汉语教学1994 年第4 期。(9)北京语言学院语言教学研究室现代汉语频率词典,北京语言学院出版社1986 年。(10)刘照雄普通话水平测试大纲(修订本),吉林人民出版社 1994 年。(11)刘源现代汉语常用词词频词典,宇航出版社 1990 年。(12)国家语委语用所现代汉语通用词课题组(执笔)厉兵现代汉语通用词选词原则,语言文字应用1998 年第 2 期。(13)孙茂松等信息处理用现代汉语分词词表,语言文字应用2001 年第 4期。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 幼儿园

网站客服QQ:123456
免费在线备课命题出卷组卷网版权所有
经营许可证编号:京ICP备12026657号-3