前言
你可能会好奇,但凡念过小学的人,谁还不会用《新华字典》了,查字典无非就是去查一个字的音、形、义,有什么必要解读呢?会查,不等于真正懂它、了解它的价值,甚至因为不够了解,你都没有真正发挥出它的强大功用。
既然咱们大家都从小用它,你肯定也能想象,它的发行量很大,但你可能不知道的是,从年问世以来,不到70年时间,《新华字典》已经卖出了超过6亿册,不仅是真正的中国国民第一畅销书,而且是被吉尼斯世界纪录认定的“最受欢迎的字典”和“最畅销的书”。
关于这个问题,一般人最大的误解是,咱们中国世界人口第一,字典卖成全世界第一名,也顺理成章嘛。
但我要提醒你注意,不是所有的人口大国都有这样一部字典,另一个你熟悉的人口大国,至今还拥有全球超过三分之一的文盲。而中国是用了年的时间,完成了一次脱胎换骨的人口素质提升。
这是一个什么成绩?咱们稍微看几个数据体会一下:
辛亥革命前,清朝政府做过一次统计,当年全国在校学生数量最多也就多万,加上当时各省的简易识字班和私塾,再加上过去科举制下受过旧式教育的,中国粗通文墨的人,总数也就多万。当时中国人口数量大概是4亿,也就是说,识字率是1%左右,99%的人都是文盲。
而在年公布的全国第七次人口普查数据中,你猜中国的文盲率降到了多少?2.67%!完全是乾坤大挪移啊。同期的人口数量多了10亿,识字率上升到了97.33%。中国识字率的大面积提升,《新华字典》功不可没。
可以说,《新华字典》不仅仅是一部小学生字典,而是把自己深深嵌入了中国国民素质提升的百年工程中,这个工程任务艰巨而复杂,并且没有终点。
所以,我们需要重新理解《新华字典》的价值,它可不只是你看到的10个汉字的注音、字形和释义,它成为你今天看到的样子,既是解决中国社会具体挑战的结果,又与时俱进,因应社会发展不断迭代。至于冠绝全球的销量,咱们可以云淡风轻地说,那只是水到渠成的结果。
第一部分
咱们查字典,很多时候是去查一个字的意义和用法。最新版《新华字典》正文的第一个字是“吖”,(口字旁,右边一个“丫头”的“丫”)。有一种有机化合物,叫做吖嗪。《新华字典》对它的解释是:“有机化合物的一类,呈环状结构,含有一个或几个氮原子。”
这个解释,我拿我的小外甥女由之测试过,小朋友说,“指的是某种物质,形状是圆的。”当然了,这个字因为涉及化学专业知识,算《新华字典》的释义里难度大的。说明一下,由之是个七岁半的小朋友,即将升二年级。但我绝不是想说这个小朋友聪明,我是想请你记住一句话:《新华字典》是新中国第一部用白话文释义的汉语工具书。
白话文释义,这件事就是为了解决当时中国社会一个特别急迫的问题。
什么问题呢?文盲太多了。
让我们把时钟拨回到年,那时候,金克木先生刚刚到北京大学东方语言文学系当教授。他的一篇回忆文章里这么写:
人民解放军已经包围北平,我们在魏家的大厅中草拟新字典的构想。老式房屋内光线不强,我们在朦胧中高谈阔论,涉及英文中的约翰逊博士字典、牛津字典、韦伯斯特字典,以及黎锦熙主持多年未能成书的《中国大词典》等等,城外传来的炮火声仿佛给我们打击节拍。
那是年4月,北平围城之际,五位北大的教书先生,凑在一起,讨论的不是个人去留,而是编纂一本新字典,因为他们有一个信念:中国的未来系于儿童,危险在于无知。语言文字是普及教育的工具,字典是学习语言文字的工具。那些先生们谦逊地说,我们不会别的,只能咬文嚼字。而且,他们可不光是坐而论道,从那时候起,五位先生就开始定期聚会,讨论字典编纂的原则和方法。
所以,在那个时刻,谈论字典等于谈论中国的前途。积贫积弱,战乱多年的中国,怎样才能有前途,这是摆在当时中国人面前的一个巨大挑战。昌明教育,开启民智,肯定是解决方案之一。那它跟字典用白话文释义有什么关系?
中国有非常悠久的字典编纂传统,但古代的字典,并没有起到教育普及的作用。
古代中国最著名的两部字典,一部是东汉许慎的《说文解字》,另一部是清代的《康熙字典》。这两部字典,虽然前后相距年,但从字典形态来讲,本质上并没有差别,都是用文言文解释字义。
只要是活的语言,就是不断发展变化的,语音、词汇、语法都会变。但问题在于,从西汉独尊儒术开始,儒家经典文献使用的语言,也就是我们说的文言文,成了不可更改的万世楷模。所以,中国的科举制从隋朝确立,到清末废除,长达一千多年的时间里,读书人读书写文章,用的都是跟口语渐渐脱节的文言文。
到康熙年间,虽说官话已经相当接近我们今天的普通话了,但奉旨编撰的《康熙字典》仍然是用文言文解释意思。这意味着用字典的门槛非常高。
就拿一个特别简单的字“大”字来举例,《康熙字典》解释说“小之对也”。其实老百姓根本不这么说话。
再比如咱们很熟悉的家禽——鸡,《康熙字典》罗列了古代各种字典的解释,又是“知时畜也(知道时间的动物)”,又是“司晨鸟(掌管早晨的鸟,指雄鸡报晓)”,甚至还有“鸡大者蜀。蜀子雓未成鸡僆,绝有力奋(四川的鸡很大,还没成年的鸡,非常有力气)”。解释“鸡”举的例句是从史书《春秋》里摘来的:“鸡为积阳,南方之象,火阳精物,炎上,故阳出鸡鸣,以类感也(鸡聚积了阳气,属于南方,火属阳,所以太阳出来鸡会叫,是同类感应)”这些别说你不懂,就算是大学中文系毕业的人,看文字也不见得都懂。还真应了那句:你不说我挺明白的,你越说我越糊涂。
字典明明是应该帮助人理解字义的,《康熙字典》为什么要这么干?这是由当时字典的功用决定的。你可能不知道,字典在古代中国,不是普通的语文工具书,按照经史子集的传统图书分类,是归在经学类目下的,也就是说,它是专门用来注释儒家经典的。
所以,在清朝末年,不管是《说文解字》还是《康熙字典》,本来就不是给大众用的,只是为懂文言文的读书人、士大夫阶层服务。他们的比例,按照前面的估算,不超过人群的1%。这样的字典,反而成了一种文化壁垒,就像17、18世纪俄国贵族们学的拉丁文一样。
跟口语脱节的文言文,被认为拖了中国人启蒙的后腿,更拖了国家富强的后腿。这正是五四白话文运动的起因。白话文运动,说得直白一点,就是提倡口头怎么说,下笔就怎么写。
当时,鲁迅、巴金、茅盾写下了最早的一批白话小说、散文。但是,从语言学的角度来看,光有文学创作还不够,白话文运动真正实现目标,是白话文在严肃场合取得合法的、正统的地位。什么是严肃场合?就是公文、新闻、学术著作都拿白话文写,当然,字典也应该拿白话文释义。也只有用白话文释义,才能最大限度降低字典的门槛,让刚上学的儿童,或者文化水平低的人,那些占99%的大多数,能看得懂字典的解释。
在金克木他们最初的构想里,要编的新字典,就必须用白话文释义,而且举例也要用活的语言,而不是古书里来的。这么一来,字典才能从高不可攀的文化壁垒,变成每个人都用着趁手的扫盲拐杖。
到了年,硝烟散去,刚刚成立的新中国百废待兴。那时候,识字率比清末提高了一些,但全国80%的人仍然是文盲。扫除文盲,学习文化,是非常迫切的社会需求。教育家叶圣陶先生是当时出版总署副署长,他曾经在日记里写到:“农民经土改之后,要求识字……识字之后,自需看书,看书乃要求字典。部队中尤为急切。”急切到什么程度呢?叶先生的日记里写,东北军那边说了,如果有合适好用的小字典,他们马上需要20万册。
这个订货量,今天的任何一本畅销书作者,也都会很眼馋吧?
年,新中国第一版《新华字典》终于面世。它不光是白话文释义、编写例句,而且,考虑到当时的使用者文化水平确实很低,字典里还配了大量插图。字典还有附录,涉及生产生活一些重要常识。但是体量并不大,收了多汉字,比半块砖略大,携带方便,售价旧版人民币元,相当于当时两斤猪肉的价钱。
新字典对字义的解释,到底接地气到什么程度?前面说过《康熙字典》解释“母鸡”的“鸡”字,那叫一个晦涩难懂。你再翻翻《新华字典》,那个释义,真是让人拍案叫绝——“家禽,公鸡能报晓,母鸡能生蛋。”12个字,不管是60年前需要扫盲的老农,还是今天6岁的小学生,一下子就能懂。你可能觉得疑惑,这么说好像不太科学吧?但别忘了,一本用于扫盲识字的小字典,有它特定的读者和功用,比起追求所谓科学,说大白话让人懂更重要。这真是最好的知识服务。
所以,你就能理解,这本字典一下子就卖爆了,三个月内四次印刷,虽然版权页上标注的印量是50万册,但根据叶圣陶先生的日记,实际半年内销量差不多是万册。
一部小型工具书,因为本本分分地解决社会真实的、急迫的需求,就能有这么大的威力。
第二部分
说完了《新华字典》第一页第一个字的释义,现在,我们把字典往前翻翻。诶,你有没有注意过,在正文第一页之前,《新华字典》竟然还有多页,要知道,正文总共才页,前面的部分差不多是五分之一了。那多页是什么呢?
你也许有印象,主要是检字表,对,它既包括“汉语拼音音节索引”,也包括“部首检字表”。如果你手边有本同样体量的英文小词典,我敢打赌,正文前面不会超过10页。
为什么中文字典跟英文词典有这么大差别?因为汉语的检索特别难,简直是个千古难题。比拼音文字难度高好几个数量级。
拼音文字,就比如说英语,26个字母能拼出所有的词,检索非常简单,词典是按字母表顺序排列的,第一个字母相同的,就看第二个字母的顺序,以此类推,一个词很容易在词典里定位。只要会背字母表,查生词根本不需要学。
但你肯定还记得自己的小学,查《新华字典》是要专门学的。我请教过一位现在的小学语文老师,一样要专门学,虽然课堂上教是几节课,但整个小学阶段,只要学生字,都必须写出这个字的音节、部首和笔画,所以,查字典的技能是需要用整个小学阶段来巩固的,是必考内容。
这是咱们中国教育有意为难小学生吗?当然不是。
这是由汉字的特点决定的,汉字是全世界唯一仍然被广泛使用的语素文字。英文是拼音文字,文字的最小单位是字母,字母只表音不表意,26个字母解决一切拼写问题。而中文不一样,我们的文字最小单位通常是一个字,字既表音,也表形、表意,这就造成了中文的最小单位比英文大了好几个数量级。从古到今,汉字的总数量,大约在10万左右,就算是覆盖日常使用99.48%的常用汉字,也要3个。而最新版《新华字典》的收字数量是10多。
那么,问题就来了。这么多字收进字典,马上就涉及如何查找定位的问题,“查字典”的“查”字就是这么来的,语言学专业术语叫检索。用算法视角来看,这是一个经典的搜索问题。解决搜索问题的算法,包括顺序查找、排序算法和分类算法。这么多的字,肯定不能用顺序查找,也就是为查一个字,把几百页的字典挨个翻一遍。这就得考虑先用某种方法排序。
《新华字典》是怎么给字排序的呢?请记住这句话:《新华字典》是中国第一部按照汉语拼音排序的语文工具书。
既然是第一部,那它之前的中文字典是怎么排序的呢?
最主流的是部首排序,这就又得说到《说文解字》了,这部诞生于东汉的字典,第一次根据汉字的形体特点,用部首来排序。它的作者许慎总结了个部首,把多字排了进去,但凡同一个部首的字,都列在一起,偏重探讨字形和字义之间的关系。
许慎首创了汉字搜索的分类算法,先把字按照部首分类,比挨个数大大提高了搜索效率。但《说文解字》的个部首本身的排序,并没有什么规则,所以,一个字光是找到它在目录里的位置,也很花时间。《康熙字典》就进步多了,部首是按照笔画多少排序的,等于说综合运用了分类算法、排序算法和顺序查找。《新华字典》也沿用了《康熙字典》的部首检字法,正文前面那多页,主要就是部首检字表,而且,现在我们已经把部首归纳简化为个了。但你以为问题就彻底解决了吗?
来,咱们回忆一下怎么用部首查字典:得分四步走,先判断一个字的部首,是木字旁,还是三点水,是提手旁,还是竖心旁;第二步,按照部首的笔画数从部首目录找到它在检字表里的页码;第三步,数一数这个字除去部首剩下的笔画;最后一步,按照笔画数多少,在检字表这个部首下找到这个字,查出它的正文对应页码。你看,一个字,不但要判断部首,还得数两回数,在字典里三级跳,才能最终查到。你小时候会不会找到部首的页码却忘记了笔画数?反正我会。
不光是查起来很繁琐,而且有些字,比如“恐龙”的“龙”,“后面”的“后”,“大象”的“象”,“武术”的“武”,判断部首挺费劲。再或者有些字,部首你是找出来了,但剩下的笔画数得不对,一样找不到。花几分钟查一个字,并不夸张。
按照部首分类查这么费劲,还有没有更好的办法?能不能也像英文一样,按照读音来排序呢?
现在咱们用的《新华字典》,就是按照汉语拼音字母顺序排列的。一个字,只要你会用标准普通话读,很容易就根据字母顺序确定它的位置。
借助读音查字典,对于21世纪的你来说,可能“丝般顺滑”,但你可能想不到,走到这一步,我们中国人有多难,甚至比部首检字法更难。
首先,中国古代没有拼音,给字注音长久以来都是借助别的汉字,直到19世纪末西方现代语言学的引入,才加快了汉语注音问题的解决。年出现了注音字母。(注意,不是汉语拼音,它们不是你熟悉的拉丁字母,而是用汉字的偏旁部首改造的)年第一版《新华字典》,就是用这种方法注音,也是按照注音字母来排序的。就算是今天的《新华字典》里,每个字的汉语拼音旁边,也保留了注音字母。而我们今天人人都会的汉语拼音,则是又过了半个世纪,年才正式定型公布的。
《新华字典》的反应有多快?年5月出的字典,就迅速按照汉语拼音字母顺序,重新排了版。
但是,先别急着赞叹,字典改排顺序,虽然流程很繁琐,毕竟只是个机械工作,要真正能让更多人用上拼音检字法,还意味着一个超大型工程——推广普通话,也就是咱们的民族共同语。要知道中国有七大方言区,每个方言区,语音、词汇、语法都有差别,尤其是很多南方地区,一个县之内就有四五种互相无法交流的方言。这可不是国家发一版汉语拼音方案,老百姓就立刻能说普通话的。中国是又花了60多年的时间,才把普通话的普及率提高到了80%。
当然,国家推广普通话,可不只是为了方便大家查字典的。
农业社会,人的活动交往范围小,会说本地话就足够了,只有出去做官的人,才需要说官话。但到现代社会,随着人口流动的增加、人际交往的扩大,说着不同方言、不同语言的人打交道越来越多。美国学者乔纳森·普尔研究了个国家的数据,他的结论是,语言的相对统一跟经济发展有正相关关系。
同时,在任何一个多民族、多语言、多方言的国家,民族通用语的作用,也不只是方便交际,还会指向身份认同。
这是从大的方面来讲,具体到个人,也是如此。且不说当老师、考公务员普通话得过关,甚至我看过报道,调研北京农民工的情况,发现普通话熟练的人,比那些不熟练的,月收入能高出2-4成。所以,推广普通话,既是社会发展和民族认同的需要,同时也是个人发展的需要。这么一个国家系统工程,需要从教育、出版、传媒多个方向发力。
那《新华字典》又是怎么把自己嵌入这个系统工程里的呢?它不光是迅速把字典改成按汉语拼音音序排列,方便人根据读音快速给字定位,而且,立刻采用汉语拼音方案给汉字注音,提供了正音的标准。尤其重要的是,在广播电视这些有声传媒不发达的年代,跟着《新华字典》的拼音学普通话,大概是成本最低的方案了。一个发展中的大国,这个账不能不算。
采用汉语拼音注音排序,《新华字典》解决的不仅仅是自身检索难的问题,更是为普通话的推广立下了汗马功劳。随着基础教育的普及,中国人对《新华字典》的需求量也越来越大。
第三部分
解决了释义和检索问题,《新华字典》是不是就万事大吉了呢?
开头我提过,《新华字典》被吉尼斯世界记录认定为“最畅销的书”,你可能有点怀疑,不是有说是《圣经》的吗?其实《新华字典》这个“最畅销的书”还有个限定,准确地说是“最畅销的书(定期修订)”。你可别看不起这个“定期修订”,《圣经》是宗教经典,当然只会一锤定音;而《新华字典》的价值恰恰在于六十多年来,持续不断地修订。虽然你看到今天最新版的《新华字典》标着第12版,但这本字典真正的修订次数,其实是超过12次的。
《新华字典》的定期修订,不能理解成苹果手机推新款,推着你再消费一次。它仍然是在应对挑战,解决真实问题。
就拿最早的一个修订版来说,年12月才出了第一版,转眼到年8月就出了修订版,而且是一边疯狂加印着第一版,一边上马了第二版。这是怎么回事?
因为“出大事了”、“被退货了”——就因为年版是用注音字母排序检索的,书发到南方,比如苏州的新华书店,有读者要求退书,因为不会查。不光苏州,南方大部分地区都有这个问题,用北京音做的注音,说方言的老百姓用不了啊。那怎么办?不能怪读者水平低,赶紧修订呗。紧锣密鼓出了一版新的,这回按照大家熟悉的部首排列,而且顺便增加了多个单字。结果这一版面世,不到一年,就迅速印了7次,因为数量太大,印刷用的纸型都使坏了。
此后,《新华字典》的修订也从没消停过:国家颁布汉语拼音方案了,那就改成汉语拼音标音和排序。教育部开始在学校推行简化字了,那就出简体字版本。经济迅速发展,字的新用法、新的词语不断涌现,那就仔细斟酌收录进来。甚至,人们的环保观念发生了变化,解释野生动物的时候,就不再使用“肉能吃”“皮毛可用”。等到互联网技术兴起了,那就在内页附上