登錄

術語數(shù)據(jù)庫

百科 > 信息管理術語 > 術語數(shù)據(jù)庫

1.什么是術語數(shù)據(jù)庫[1]

  術語數(shù)據(jù)庫是指專門存儲名詞術語信息、詞語信息以及術語工作和語言規(guī)范工作成果的一種源數(shù)據(jù)庫,各種電子化辭書也包括在內。

2.術語數(shù)據(jù)庫的分類[2]

  術語數(shù)據(jù)庫可根據(jù)不同標準分為不同類型:

  可以按目的分為:①用于術語標準化和術語協(xié)調的;②用于科技交流的。

  按用戶分為:①為翻譯工作者建立的;②為科技專家建立的;③為一般公眾建立的。

  按對語言態(tài)度分為:①起規(guī)范作用的;②純描述性的;③提供數(shù)據(jù)用的,等等。

  馮志偉先生有個分類:第一類是面向概念的術語數(shù)據(jù)庫;第二類是面向翻譯的術語數(shù)據(jù)庫;第三類是面向特定領域的術語數(shù)據(jù)庫。

3.術語數(shù)據(jù)庫的用途[3]

  術語庫有許多現(xiàn)實的和潛在的用途。現(xiàn)實的用途主要有以下幾方面:

  (1)翻譯的輔助工具。如前所述,早期的術語庫就是為了翻譯人員服務的。目前,輔助翻譯仍是它的主要功能之一。將來,它還有可能成為機器翻譯的一種工具。

  (2)辭書編纂工具。一個學科領域若有一個高質量的術語庫,有的專業(yè)詞典就可以直接從術語庫中派生出來,或者作為詞典的主要數(shù)據(jù)來源。而且,以后的詞典修訂再版工作也就再變得簡便多了。

  (3)信息檢索的工具。術語庫可以作為不同的數(shù)據(jù)庫和檢索系統(tǒng)的一種連接工具或中介,幫助用戶克服檢索語言方面的障礙。另外,還可以編制和管理敘詞表提供高質量的數(shù)據(jù)源。

  (4)術語標準化的工具。術語庫中的信息來源于術語標準化活動,同時,又可以反過來支持有關機構的標準化活動,便利術語的審定、協(xié)調等工作。

  術語庫的潛在用途主要表現(xiàn)在自然語言處理和知識工程方面。人們預測,匯集了術語學和術語標準化工作成果的術語庫,可提供有關概念的性質、概念之間的關系、概念體系、概念網(wǎng)絡等知識類型。所以,它對自然語言理解、人工智能專家系統(tǒng)等研究有潛在的應用價值。比如,它可能成為一種有用的領域知識庫或語言知識庫,或者為自動標引和自動分類提供一種良好的機器學習環(huán)境。

4.術語數(shù)據(jù)庫的內容結構[3]

  術語庫用數(shù)據(jù)庫方式管理各種術語信息。它的文檔結構一般也是由主文檔和相應各種索引文檔組成。為了不使術語庫的內部管理與對外服務相沖突,有的術語庫還建立有兩種不同的主文檔:工作文檔和傳播文檔。

  主文檔的每條記錄都以特定的術語為描述對象。每個術語建一個記錄,詳細描術該術語的各種屬性。記錄內容的詳細程度決定了術語庫的功能。術語記錄一般字段較多。在一般術語庫中較常見的數(shù)據(jù)項或字段有:術語名稱、術語定義(包括必要的圖表說明)、分類代碼、術語來源、學科領域標記、詞頻、語言、詞性、上位詞、下位詞、同義詞、準同義詞、同音異義詞、縮寫詞、外文對應詞、音譯詞、層次編號、可靠性等級等。其中,可靠性等級是根據(jù)術語的標準化規(guī)范化程度來確定的。例如,來源于國際標準國家標準的,可靠性等級就高。

  要建造一個實用可靠的術語庫,需要具備許多條件。首先是要有高質量的術語數(shù)據(jù)。這種數(shù)據(jù)應主要來自各學科領域的術語標準化活動及其成果,如各種術語標準、命名規(guī)則、權威的百科辭典、經(jīng)典著作、成熟的專業(yè)教科書等。上述數(shù)據(jù)源提供的術語數(shù)據(jù)可能有不完全或不一致的地方,故需要組成專門的工作班子和專家咨詢機構,從事數(shù)據(jù)的檢查、補充、協(xié)調統(tǒng)一和審定工作?!浯危x擇好相適應的硬件和軟件。計算機系統(tǒng)應具有較大的存儲容量、較快的運算速度和輸入、輸出設備。應用軟件必須能有力地支持術語庫的內部編輯管理和對外服務。在滿足內部管理需要方面,應用軟件應具有對術語數(shù)據(jù)的一致檢查、詞匯分析、語法分析、多重排序等功能。在滿足用戶的查詢需要方面,術語庫的主記錄應設置較多的可檢字段,以便建立各種倒排檔,支持用戶從不同角度來查詢術語信息。一般來說,術語庫應能支持下列不同的查詢和輸出:

  (1)特定的術語;

  (2)特定的術語類型;

  (3)特定的學科領域;

  (4)特定的技術系統(tǒng)或設備類型;

  (5)指定的錄入日期(檢索術語的新穎性);

  (6)特定的術語源;

  (7)特定的語言組合;

  據(jù)報道,有的術語庫還可與超級文本相結合,向用戶提供集圖文和聲音于一體的形象生動的術語信息。

評論  |   0條評論