CSC中文語義詞庫 (原名 CWB中文詞庫) 是自主研制的軟件系統(tǒng)。其核心是一個初具規(guī)模的中文詞庫。該詞庫目前收入了超過 190,000 的書面形式的詞條 (帶230,000 以上的義項) ,包括單詞、固定詞組、成語、一定比例的專名、少量在中文文獻(xiàn)中較常見的英文縮寫或含有字母的詞語,等等。該系統(tǒng)還在不斷發(fā)展之中。它也是一種較簡化的知識本體 (ontology) 或知識庫,有類似著名英文詞庫WordNet 的用途,可作為智能搜索、自然語言處理等領(lǐng)域的輔助資源。
主要特點
·對詞庫中的每個詞條,盡量給出與它關(guān)系比較密切的各種相關(guān)詞,例如同義詞、反義詞、上位詞、下位詞等等。目前詞庫中絕大多數(shù)詞有所屬的意義類別,130,000 以上的詞或義項有較準(zhǔn)確的同義詞,14,000 以上的詞或義項有反義或并列詞,多數(shù)詞條中還帶有其它相關(guān)詞,總共含有 2,100,000 以上個關(guān)系實例,主體內(nèi)容的文本形式超過 12,400,000 字符。整個詞庫在一些方面類似英文詞庫 WordNet,但兩者也有不少差別。與一些知識圖譜不同,這種語義庫比較側(cè)重通用的日常詞語或概念的描述。
·多種檢索途徑。能夠以詞形、讀音、意義為入口快速地查詞?赏ㄟ^意義上的聯(lián)系在詞條之間漫游?墒褂猛ㄅ浞:樵~。內(nèi)置的拼音輸入法能提高查詞的效率。
·多種顯示方式。可以按拼音、長度等順序顯示相關(guān)詞,可以用樹形顯示一些單詞中的上下位等關(guān)系的等級層次。
相關(guān)搜索:詞庫
進(jìn)入 CSC 系統(tǒng)并輸入詞之后出現(xiàn)如下窗口 (本手冊所舉的例子在該系統(tǒng)的某些版本中可能略有變化,恕不另外說明):
左上角是主詞窗口,其中的“電腦”稱為主詞。其右邊是義項號窗口和工具按鈕。中間占據(jù)最大面積的是相關(guān)詞窗口。其左邊是關(guān)系窗口。最下面是釋義窗口。
主詞窗口是一個下拉組合框,可在里面輸入要查閱的詞條。義項號窗口是下拉列表組合框,可選擇要顯示的義項。關(guān)系窗口列出主詞的當(dāng)前義項所具有的關(guān)系。關(guān)系的各種類型將在后面介紹。相關(guān)詞窗口顯示主詞的各種相關(guān)詞。釋義窗口顯示主詞或相關(guān)詞的釋義或提示信息,但目前這里經(jīng)常沒有內(nèi)容。
除了使用鼠標(biāo)外,還可以使用 Tab 或 Shift+Tab 鍵在各個窗口之間切換。關(guān)系窗口、相關(guān)詞窗口和釋義窗口構(gòu)成了切分窗口,可以用鼠標(biāo)拖動邊框或窗棱調(diào)整各窗格的大小。
目前界面不美觀,因為用戶通常只須調(diào)用數(shù)據(jù)而不需要這里的界面。