登錄

術(shù)語數(shù)據(jù)庫

百科 > 信息管理術(shù)語 > 術(shù)語數(shù)據(jù)庫

1.什么是術(shù)語數(shù)據(jù)庫[1]

  術(shù)語數(shù)據(jù)庫是指專門存儲名詞術(shù)語信息、詞語信息以及術(shù)語工作和語言規(guī)范工作成果的一種源數(shù)據(jù)庫,各種電子化辭書也包括在內(nèi)。

2.術(shù)語數(shù)據(jù)庫的分類[2]

  術(shù)語數(shù)據(jù)庫可根據(jù)不同標(biāo)準(zhǔn)分為不同類型:

  可以按目的分為:①用于術(shù)語標(biāo)準(zhǔn)化和術(shù)語協(xié)調(diào)的;②用于科技交流的。

  按用戶分為:①為翻譯工作者建立的;②為科技專家建立的;③為一般公眾建立的。

  按對語言態(tài)度分為:①起規(guī)范作用的;②純描述性的;③提供數(shù)據(jù)用的,等等。

  馮志偉先生有個分類:第一類是面向概念的術(shù)語數(shù)據(jù)庫;第二類是面向翻譯的術(shù)語數(shù)據(jù)庫;第三類是面向特定領(lǐng)域的術(shù)語數(shù)據(jù)庫。

3.術(shù)語數(shù)據(jù)庫的用途[3]

  術(shù)語庫有許多現(xiàn)實的和潛在的用途?,F(xiàn)實的用途主要有以下幾方面:

  (1)翻譯的輔助工具。如前所述,早期的術(shù)語庫就是為了翻譯人員服務(wù)的。目前,輔助翻譯仍是它的主要功能之一。將來,它還有可能成為機器翻譯的一種工具。

  (2)辭書編纂工具。一個學(xué)科領(lǐng)域若有一個高質(zhì)量的術(shù)語庫,有的專業(yè)詞典就可以直接從術(shù)語庫中派生出來,或者作為詞典的主要數(shù)據(jù)來源。而且,以后的詞典修訂再版工作也就再變得簡便多了。

  (3)信息檢索的工具。術(shù)語庫可以作為不同的數(shù)據(jù)庫和檢索系統(tǒng)的一種連接工具或中介,幫助用戶克服檢索語言方面的障礙。另外,還可以編制和管理敘詞表提供高質(zhì)量的數(shù)據(jù)源。

  (4)術(shù)語標(biāo)準(zhǔn)化的工具。術(shù)語庫中的信息來源于術(shù)語標(biāo)準(zhǔn)化活動,同時,又可以反過來支持有關(guān)機構(gòu)的標(biāo)準(zhǔn)化活動,便利術(shù)語的審定、協(xié)調(diào)等工作。

  術(shù)語庫的潛在用途主要表現(xiàn)在自然語言處理和知識工程方面。人們預(yù)測,匯集了術(shù)語學(xué)和術(shù)語標(biāo)準(zhǔn)化工作成果的術(shù)語庫,可提供有關(guān)概念的性質(zhì)、概念之間的關(guān)系、概念體系、概念網(wǎng)絡(luò)等知識類型。所以,它對自然語言理解、人工智能、專家系統(tǒng)等研究有潛在的應(yīng)用價值。比如,它可能成為一種有用的領(lǐng)域知識庫或語言知識庫,或者為自動標(biāo)引和自動分類提供一種良好的機器學(xué)習(xí)環(huán)境。

4.術(shù)語數(shù)據(jù)庫的內(nèi)容結(jié)構(gòu)[3]

  術(shù)語庫用數(shù)據(jù)庫方式管理各種術(shù)語信息。它的文檔結(jié)構(gòu)一般也是由主文檔和相應(yīng)各種索引文檔組成。為了不使術(shù)語庫的內(nèi)部管理與對外服務(wù)相沖突,有的術(shù)語庫還建立有兩種不同的主文檔:工作文檔和傳播文檔。

  主文檔的每條記錄都以特定的術(shù)語為描述對象。每個術(shù)語建一個記錄,詳細描術(shù)該術(shù)語的各種屬性。記錄內(nèi)容的詳細程度決定了術(shù)語庫的功能。術(shù)語記錄一般字段較多。在一般術(shù)語庫中較常見的數(shù)據(jù)項或字段有:術(shù)語名稱、術(shù)語定義(包括必要的圖表說明)、分類代碼、術(shù)語來源、學(xué)科領(lǐng)域標(biāo)記、詞頻、語言、詞性、上位詞、下位詞、同義詞、準(zhǔn)同義詞、同音異義詞、縮寫詞、外文對應(yīng)詞、音譯詞、層次編號、可靠性等級等。其中,可靠性等級是根據(jù)術(shù)語的標(biāo)準(zhǔn)化規(guī)范化程度來確定的。例如,來源于國際標(biāo)準(zhǔn)國家標(biāo)準(zhǔn)的,可靠性等級就高。

  要建造一個實用可靠的術(shù)語庫,需要具備許多條件。首先是要有高質(zhì)量的術(shù)語數(shù)據(jù)。這種數(shù)據(jù)應(yīng)主要來自各學(xué)科領(lǐng)域的術(shù)語標(biāo)準(zhǔn)化活動及其成果,如各種術(shù)語標(biāo)準(zhǔn)、命名規(guī)則、權(quán)威的百科辭典、經(jīng)典著作、成熟的專業(yè)教科書等。上述數(shù)據(jù)源提供的術(shù)語數(shù)據(jù)可能有不完全或不一致的地方,故需要組成專門的工作班子和專家咨詢機構(gòu),從事數(shù)據(jù)的檢查、補充、協(xié)調(diào)統(tǒng)一和審定工作?!浯危x擇好相適應(yīng)的硬件和軟件。計算機系統(tǒng)應(yīng)具有較大的存儲容量、較快的運算速度和輸入、輸出設(shè)備。應(yīng)用軟件必須能有力地支持術(shù)語庫的內(nèi)部編輯管理和對外服務(wù)。在滿足內(nèi)部管理需要方面,應(yīng)用軟件應(yīng)具有對術(shù)語數(shù)據(jù)的一致檢查、詞匯分析、語法分析、多重排序等功能。在滿足用戶的查詢需要方面,術(shù)語庫的主記錄應(yīng)設(shè)置較多的可檢字段,以便建立各種倒排檔,支持用戶從不同角度來查詢術(shù)語信息。一般來說,術(shù)語庫應(yīng)能支持下列不同的查詢和輸出:

  (1)特定的術(shù)語;

  (2)特定的術(shù)語類型;

  (3)特定的學(xué)科領(lǐng)域;

  (4)特定的技術(shù)系統(tǒng)或設(shè)備類型;

  (5)指定的錄入日期(檢索術(shù)語的新穎性);

  (6)特定的術(shù)語源;

  (7)特定的語言組合;

  據(jù)報道,有的術(shù)語庫還可與超級文本相結(jié)合,向用戶提供集圖文和聲音于一體的形象生動的術(shù)語信息。

評論  |   0條評論