我們每天都在說漢語,大量的詞匯在各種各樣的環(huán)境中頻繁使用,到底什么詞使用頻率高?無論是語言學(xué)家還是普通大眾往往全憑感覺。近日,商務(wù)印書館出版的《現(xiàn)代漢語常用詞表》(草案)面世,頭一回全面披露常用詞語家底:當(dāng)今社會,經(jīng)常使用的詞共有56008個。
這56008個常用詞中,包括單音節(jié)詞3181個,雙音節(jié)詞40351個,三音節(jié)詞語6459個,四音節(jié)詞語5855個,五音節(jié)和五音節(jié)以上詞語162個。
常用詞表誕生歷時10年
早在1998年7月,《現(xiàn)代漢語常用詞表》研制項目啟動,這是一個龐雜而艱難的項目,由國家語言文字工作委員會組織實施。該詞表是作為國家已經(jīng)公布的《現(xiàn)代漢語常用字表》等的配套規(guī)范,是我國語言文字規(guī)范化、語文教育和研究方面的基本建設(shè)項目。
課題組負(fù)責(zé)人李行健說:“大家知道現(xiàn)代漢語有常用字表,共收入常用字3500個;有通用字表,收入通用字7000個。但長期以來,一直沒有常用詞表,常用詞有多少?是哪些?一直是個謎!倍茝V常用詞,對于中小學(xué)語文教學(xué)、掃盲教育、漢語教育、中文信息處理和辭書編纂等都是急需的。
研制工作中大多是白發(fā)退休專家,他們不需要國家經(jīng)費,迎難而上。他們中有語言學(xué)家、有大學(xué)教授,今年74歲的李行健說:“完全是出于對語言的興趣和社會責(zé)任感,我們這些老頭兒才樂此不疲!笨墒钦l也沒想到,這一路走來,竟然走過了10年。增補、修訂,再增補、再修訂,最后才有了放在人們面前的《現(xiàn)代漢語常用詞表》。李行健介紹,常用詞檢測詞頻的語料庫有三種:一是國家語委研制的“現(xiàn)代漢語通用語料庫”核心語料庫,這個通用語料庫收有4500萬字語料,缺點是有的詞年代久遠(yuǎn),如今已不經(jīng)常使用。二是《人民日報》2001年至2005年約1.35億字的分詞標(biāo)注語料;第三種是廈門大學(xué)研制的現(xiàn)當(dāng)代文學(xué)作品語料庫,約7000萬字語料,總共2.5億字。
目前我們看到,在《現(xiàn)代漢語常用詞表》中使用頻率越高的詞排序越靠前,使用頻率越低的詞排序越靠后,這種降序排列讓人一目了然。李行健說,研制過程中采取了課題組獨創(chuàng)的“詞頻頻級排序法”。由于詞語的來源比較廣泛、各自不同,各種語料都有自己的覆蓋面和構(gòu)成特點,詞表中的詞語不能在每種語料中都得到全面顯現(xiàn)。比如,同一個詞,在三種語料庫中的詞頻就會不同,有的還差別很大。為了科學(xué)反映每個詞較真實的詞頻,采用了頻級的統(tǒng)計方法,即將每個詞語的三種語料的頻級之和除以三的辦法。這樣就能較好反映出一個詞現(xiàn)實生活中的綜合的常用度,在此基礎(chǔ)上,再由專家進行人工審核篩選,“也就是說,這些常用詞的出籠是客觀和有科學(xué)依據(jù)的。”
一個時代有一個時代的關(guān)鍵詞
從56008個常用詞中,我們很容易觸摸到我們所處這個時代的關(guān)鍵詞、熱點詞。
李行健舉例說,在熱點詞中,新中國成立前,“看相、抽簽、算命”,可能是相當(dāng)活躍的詞語,現(xiàn)在已不是常用詞了。解放初期,“土改、統(tǒng)購統(tǒng)銷、合作社、互助組”詞頻相當(dāng)高,如今在常用詞中已不見蹤影了。曾經(jīng)在“文革”中紅紅火火的詞,如“斗爭、階級、樣板戲、走資派、臭老九”等等很常用、很熱鬧的詞語,現(xiàn)在已經(jīng)退出了常用詞的舞臺,其生命力也隨之走向衰落了。
而如今,“法律、汽車、市場、資金、責(zé)任、成功、精神、文化、價值觀”等等則變成了出現(xiàn)頻率相當(dāng)高的常用詞。民間詞語收藏家黃集偉認(rèn)為,這些詞與老百姓的生活密切相關(guān),它所涉及的領(lǐng)域一定是社會的熱點,也一定是我們社會生活變化最快的那部分。比如“價值觀”,黃集偉就認(rèn)為,這個詞是常用的中性詞。改革開放后,我們現(xiàn)實生活中發(fā)生了很多價值觀的大討論,這個時代發(fā)生的許多爭論、爭吵,比如對與錯、道德與情感,種種社會矛盾等,總的來說都隱含著價值觀的不同。
詞匯是隨社會發(fā)展變化的,它是社會變化的一面鏡子。社會中出現(xiàn)新的事物,如“宇宙飛船、電視、手機、股票、證券”等等,人們就會創(chuàng)造出新詞來記錄反映它們。詞語使用的頻度決定于它同人們社會關(guān)系的程度,所以一個時代有不同的常用詞表。
新詞折射社會生活巨大變化
“真正的語言是活的,它潛伏或奔突于我們生活的方方面面,它不會像新聞那樣被正式發(fā)布,卻像血液一樣彌散在我們生活的每根血管中!秉S集偉說。正如此言,在《現(xiàn)代漢語常用詞表》中,大量與社會生活變遷同步的新詞,反映了社會點點滴滴的變化。
《現(xiàn)代漢語常用詞表》責(zé)任編輯余桂林和記者一起總結(jié)了涉及社會生活的方方面面變化的一些新詞。
反映政治生活變遷的有“三個代表、鄧小平理論、三農(nóng)”等。
1978年高考恢復(fù)后,與考試有關(guān)的詞匯多了起來,“自考、電大、函授、博士點、會考、考級”等等天天與大家見面。
隨著市場經(jīng)濟的發(fā)展,房地產(chǎn)業(yè)帶動起詞匯的飛速發(fā)展,“房市、商品房、期房、現(xiàn)房、房改、房貼、租房、房源、業(yè)主、二手房”等等,都是許多年前從未見過的新詞。
跟網(wǎng)絡(luò)有關(guān)的詞匯表現(xiàn)最為活躍,新詞呈逐年上升的趨勢!熬W(wǎng)吧、上網(wǎng)、互聯(lián)網(wǎng)、局域網(wǎng)、計算機網(wǎng)絡(luò)、網(wǎng)管、網(wǎng)卡、網(wǎng)絡(luò)化、網(wǎng)警、網(wǎng)絡(luò)游戲、網(wǎng)民、網(wǎng)頁、網(wǎng)站、網(wǎng)址、發(fā)帖”等,在過去簡直是聞所未聞。
跟金融有關(guān)的詞匯也很多,比如“銀行卡、信用卡、刷卡、按揭、理財、基金”等。
有關(guān)職業(yè)、身份的新詞非常多,如“白領(lǐng)、藍(lán)領(lǐng)、單身貴族、工薪族、上班族”,不過,這幾年時興的“金領(lǐng)、粉領(lǐng)”等還未收入,專家分析,可能是因為它們還不穩(wěn)定的原因。
和股票有關(guān)的詞語,比如“飄紅、飄綠、熊市、牛市、參股、股市、股利、股民、股息”等足有一大串。
隨著明星對社會生活的影響力加大,由明星生發(fā)出了諸多詞匯,如“丑星、歌星、球星、童星、舞星、笑星、新星、影星”等。
這些年,在新聞中出現(xiàn)頻率很高的詞匯,如“艾滋病、非典、禽流感”也是常用詞。
而一些大家熟悉的俗語,如“暴發(fā)戶、二百五、三陪”等也被收入其中。
“的”使用頻率最高
56008個常用詞中,“的”使用頻率最高。
民間詞語收藏家黃集偉集詞歷史足有10年,他認(rèn)為“的”這個語言文化現(xiàn)象很值得探究!霸诂F(xiàn)代漢語里,‘的’屬結(jié)構(gòu)助詞,我相信,經(jīng)過很多年,這個詞依然會是詞頻很高的詞!彼又庾x道,“的”字詞組也相當(dāng)常見,比如,打醬油的、撐船的、唱歌的,這時“的”代指人。
黃集偉曾注意到一個有趣的現(xiàn)象,江蘇作家程庸寫《官窯美人》,這部25萬字的長篇小說拒絕用“的”,一度為人關(guān)注。黃集偉認(rèn)為,生活中去掉“的”可以,但是會很不習(xí)慣,一定要換一種表達(dá)方式才行。比如,“這是一個漂亮的杯子”,去掉“的”就變成了“這個杯子很漂亮”。 而實際上表達(dá)的意思已經(jīng)走了樣。
過去許多語言學(xué)家如呂叔湘、王力等,也曾多次創(chuàng)導(dǎo)漢語言要簡潔生動,臺灣作家余光中曾作過測試,要看語言簡潔與否,只要看為文,通常20個字里只能出現(xiàn)一個“的”,超過兩個則是啰嗦。
但語言學(xué)家也認(rèn)為,可有可無的“的”完全可以不要,但“的”畢竟是一個很有用的助詞!冬F(xiàn)代漢語常用詞表》同其他詞表一樣,漢語中第一高頻詞就是“的”。助詞在漢語中表示的語法意義非常重要,如果不用“的”是不可能的,不是表達(dá)不清,就是表意混亂或產(chǎn)生歧義。
常用詞表將每5至10年修訂一次
李行健說,現(xiàn)代漢語常用詞將每5年至10年修訂一次,應(yīng)與時俱進。否則,常用詞表很容易邊緣化。
語言是不斷變化的,幾年之后,很多詞會從常用詞里隱退出來,又有許多表現(xiàn)穩(wěn)定的新詞會出現(xiàn),因此要密切跟蹤語言的發(fā)展!拔覀兇舜伟l(fā)布的《現(xiàn)代漢語常用詞表》,雖然詞語統(tǒng)計用了三種語料庫,但畢竟還有局限,收入的詞語也可能有缺漏,不可能一下做到盡善盡美。所以必須5至10年修訂一次。”
語言專家認(rèn)為,當(dāng)今社會語言處于飛速發(fā)展期,這與經(jīng)濟社會環(huán)境、新觀念、新思想、新事物不斷出現(xiàn)有關(guān)。與過去相比,因為有網(wǎng)絡(luò)的出現(xiàn),新詞的產(chǎn)生和傳播也更加迅猛,新詞往往開始在小圈子傳,但有不少詞很快在大眾范圍內(nèi)傳播!安贿^,大多數(shù)新詞僅是曇花一現(xiàn)。真正有生命力的新詞,需要時間的檢驗。”李行健說。
有人很關(guān)注《現(xiàn)代漢語常用詞表》中收了多少網(wǎng)絡(luò)詞。李行健說:“網(wǎng)絡(luò)詞語能否進入常用詞表,有兩道門檻必須逾越。首先它必須進入社會大眾的語言中,其次還要為人們廣泛使用具有很高的使用度,達(dá)到常用詞的標(biāo)準(zhǔn)后才可能進入詞表。如”網(wǎng)民、網(wǎng)吧、網(wǎng)址“等就經(jīng)過了上述過程才得以進入常用詞表的。
本報記者 路艷霞
銆?a href="/common/footer/intro.shtml" target="_blank">鍏充簬鎴戜滑銆?銆? About us 銆? 銆?a href="/common/footer/contact.shtml" target="_blank">鑱旂郴鎴戜滑銆?銆?a target="_blank">騫垮憡鏈嶅姟銆?銆?a href="/common/footer/news-service.shtml" target="_blank">渚涚ǹ鏈嶅姟銆?/span>-銆?a href="/common/footer/law.shtml" target="_blank">娉曞緥澹版槑銆?銆?a target="_blank">鎷涜仒淇℃伅銆?銆?a href="/common/footer/sitemap.shtml" target="_blank">緗戠珯鍦板浘銆?銆?a target="_blank">鐣欒█鍙嶉銆?/td> |
鏈綉绔欐墍鍒婅澆淇℃伅錛屼笉浠h〃涓柊紺懼拰涓柊緗戣鐐廣?鍒婄敤鏈綉绔欑ǹ浠訛紝鍔$粡涔﹂潰鎺堟潈銆?/font> |