首頁(yè) > 滾動(dòng) > 正文

編詞典:從卡片到語(yǔ)料庫(kù) 永遠(yuǎn)有源頭活水

2021-09-15 14:35:11 中國(guó)教育報(bào)

《現(xiàn)代漢語(yǔ)詞典》首任主編呂叔湘先生說(shuō):編詞典“要有人,要有物,就是物質(zhì)條件,還要有計(jì)劃和組織”。編詞典最重要的物就是資料。

作為一部主要收錄普通話(huà)詞匯的《現(xiàn)代漢語(yǔ)詞典》,在編寫(xiě)時(shí),遇到的難題之一就是沒(méi)有可借鑒的資料。以往的詞典以古漢語(yǔ)詞匯為主,因此一切都要白手起家。在資料收集方面,呂先生定下的方針是:書(shū)面與實(shí)際生活并重。一方面要從當(dāng)時(shí)的報(bào)紙雜志、現(xiàn)代文學(xué)作品和通俗讀物中收集,并規(guī)定有些書(shū)要一個(gè)詞不漏地窮盡收集;另一方面,特別強(qiáng)調(diào)要有系統(tǒng)地收集各行各業(yè)中流通的詞匯。呂叔湘先生曾讓語(yǔ)言所詞典室的同志到百貨大樓去收集商品名稱(chēng)。他解釋說(shuō):“為什么新詞新義,特別是口語(yǔ)里的新詞新義沒(méi)有受到編詞典的人重視呢?因?yàn)榫幵~典的人是‘讀書(shū)人’,對(duì)書(shū)本里的東西感興趣,對(duì)生活中的東西不感興趣,或者不太感興趣;對(duì)書(shū)齋中來(lái)的東西比較敏感,對(duì)市場(chǎng)上來(lái)的、車(chē)間里來(lái)的、田野里來(lái)的就不那么敏感。找詞匯只在著名作家、著名作品里找,一般報(bào)刊就不大理會(huì),至于什么手冊(cè)、傳單、廣告等等就更不在話(huà)下了。”正確的資料收集方針保證了《現(xiàn)漢》收詞的科學(xué)性、系統(tǒng)性、現(xiàn)代性。

同一個(gè)詞要在不同場(chǎng)合被收集多次,制成若干張卡片,才能證明被社會(huì)廣泛應(yīng)用,成為待選。在沒(méi)有計(jì)算機(jī)的年代,這項(xiàng)煩瑣細(xì)碎的工作完全靠編纂人員在日常生活中像螞蟻搬家似的逐漸積累。為編纂《現(xiàn)漢》,工作人員最終收集了100多萬(wàn)張卡片,這些都成為編纂《現(xiàn)漢》堅(jiān)實(shí)的語(yǔ)料基礎(chǔ),也是重要的歷史資料。

如果把自上世紀(jì)50年代《現(xiàn)漢》開(kāi)始編寫(xiě)以來(lái),編輯們收集的卡片裝進(jìn)柜子,卡片柜在百來(lái)號(hào)人開(kāi)會(huì)的大廳里擺上一圈還放不下。

如今,利用計(jì)算機(jī)語(yǔ)料庫(kù)收集資料、統(tǒng)計(jì)詞頻早已成為辭書(shū)編纂的必然選擇。但機(jī)器再靈,在某些方面也不能完全代替人的大腦和眼睛。時(shí)至今日,詞典室的同志們依舊是把這兩種手段結(jié)合起來(lái)。第6版修訂主持人、中國(guó)社科院原副院長(zhǎng)江藍(lán)生先生介紹說(shuō),在第6版修訂過(guò)程中,編者們利用語(yǔ)料庫(kù),持續(xù)監(jiān)控網(wǎng)絡(luò)時(shí)發(fā)現(xiàn),“電腦只能根據(jù)詞頻來(lái)進(jìn)行挑選,但‘語(yǔ)料庫(kù)’這種軟件的內(nèi)容選取往往不夠穩(wěn)定,不能取得均衡意義上的目標(biāo)詞匯”。因此,還要靠每個(gè)成員平時(shí)對(duì)閱讀材料的記錄與留心。事實(shí)上,從《現(xiàn)漢》第1版問(wèn)世以來(lái),收集新詞的工作從未停止。詞典室的同志們養(yǎng)成了職業(yè)習(xí)慣,仍然堅(jiān)持用手眼廣泛收集報(bào)紙、書(shū)刊、電視、廣播等媒體上的新詞新義,制成卡片,以備修訂所用。第5版修訂主持人之一的晁繼周先生說(shuō):“我們這些人讀書(shū)看報(bào)都要比一般人慢,一句話(huà)要拆成語(yǔ)素看。”每遇到新詞,詞典編輯室的同志們都會(huì)用紅筆圈出來(lái),將報(bào)紙剪貼或抄寫(xiě),制成卡片。最早參加《現(xiàn)漢》編寫(xiě)工作的孫德宣先生,直到89歲,還在家堅(jiān)持收集資料,做資料卡片。編輯們碰到一塊,談?wù)撟疃嗟囊彩亲罱l(fā)現(xiàn)的新詞。這正是從呂先生時(shí)代就一直堅(jiān)持的做法,是保證《現(xiàn)漢》在資料上永遠(yuǎn)有源頭活水的好傳統(tǒng)。

(作者系商務(wù)印書(shū)館漢語(yǔ)編輯中心編審)