2007汉语新词语
作者: 侯敏,周荐主编
出版社:商务印书馆,2008
简介: 《2007汉语新词语》在技术方法上与以往的编年本有所不同。在新词语搜获上采用了在语料库中先由机器自动提取新词语候选,再由人工甄别、确认的方法。所用语料均来自国家语言资源监测语料库(包括平面媒体、有声媒体、网络媒体),2007年度语料共计1363747个文本文件,1236120162字符次,1007053180字次。自动提取主要采用的是词汇时空分布模型,在对全部语料(除了本年度,还包括往年的)进行全切分的基础上按年度统计,根据年使用率差提取出新词语候选,再对此集合进行垃圾过滤,得到新词语候选集,以备人工排查确认。最初得到新词语候选集近5万条,排除非词条目和专有名词等后,剩余1200余条,经过进一步查证核实,得到452条。为其编写释义、配备例句。2007年4月,又将这452条新词语附上提示性释义和例句放到新浪网上,面向社会广泛征求意见。最后又经专家审定,剔除偶发的、不易确定时间的以及品位低下的词语,剩下254条。这254条新词语连同提示性释义、例句和在国家语言资源监测语料库中出现的频次、文本数,在第三部语言生活绿皮书《中国语言生活状况报告2007》下编中向社会公布。将这部分词语与周荐教授及其团队所做的2007年度的新词语以及2004-2006年新词语合并起来,去除重复者,又经过若干调整,就构成了《2007汉语新词语》的初稿。《2007汉语新词语》分正文和附录两部分。正文中收的是2007年或2006年年底出现的新词语,共420条。附录收的是2004-2006年产生的新词语,共157条。书中体例与《2006汉语新词语》大体相同。不同的是,为方便读者研究,一些词条后增加了“相关词语”板块。 新词语编年本与新词语多年本不同,与规范型语文词典更不同。它的主要功能不在于规范、规定,而在于实录、描写。除了传播语文知识外,它还是一幅社会历史画卷,是那一年度的历史纪实,能够即时反映社会文化的变化;它又是一本社会新生概念、新生事物的教科书,帮助人们认识世界,帮助人们填平信息鸿沟;它还是一个词源库,具有词源查询和语言资源研究的功能。因此,在搜录词目时,在确认是新词语的前提下,我们本着“宽容、全面、前瞻”的原则,在宽严度的把握上,遵照的是吕叔湘先生“与其失之于严,毋宁失之于宽”的精神。冈此,在该编年本中,有些词语出现的频次较低,如“裸博”。也有一些词语不会有长久的生命力,如“纸馅包子”,但为了记录2007年的历史,我们也把它们收进来了。我们希望后人在回过头来审视这段历史时,能通过新词语编年本找到一个查询的路径。