登錄

語音識別

百科 > 信息技術 > 語音識別

1.什么是語言識別[1]

  語言識別是指計算機用有限的特征或規(guī)則對我們?nèi)粘I钪惺褂玫恼Z言符號進行運算,以辨認出它們是哪些字或詞的過程。

2.語言識別的發(fā)展

  語言識別的研究始于本世紀五十年代。開始時人們認識簡單,語聲既然有共振峰,在接收系統(tǒng)中設若干組共振線路,某一組輸出最大時就可判斷為某一語聲。但事實上并非如此簡單。這是因為一人在不同時間不同條件下,語言特征可能有相當大的變化,不同的人出入更大。當時識別裝置只能識別特定某人的少數(shù)幾個語言如0—9的數(shù)字。到70年代,由于電子計算機和計算技術的發(fā)展,這方面工作又活躍起來,至今研究的范圍已擴展到連續(xù)語言,大詞匯量,非特定人的范圍。但要做出一個這樣的實用系統(tǒng),技術發(fā)展似乎還不夠,需要更深入地了解人的語言產(chǎn)生機理和感知理論,及語言學中句法分析和語義分析等。

3.語言識別的分類

  語言識別可根據(jù)詞匯大小,講活人范圍,發(fā)音方式和環(huán)境等情況分作很多類。例如:

  1、詞匯量大小

  可分詞匯量小(1~20個詞),中等(20~l00個詞),大(100詞以上);

  2、講話人范圍

  分特定某個人、某些人;非特定的,男、女或兒童等;

  3、發(fā)音方式

  孤立字發(fā)音,連續(xù)發(fā)音;

  4、講話環(huán)境

  例如隔聲問、機房、公共場所;

  5、系統(tǒng)學習方式

  不學習,離線學習,不斷地學習。

  可見對語言識別系統(tǒng)的要求可以有很大的出入,因此系統(tǒng)的規(guī)模、大小、復雜性等出入也很大。

4.語言識別的應用

  1、語言打字機

  現(xiàn)在微計算機已普遍應用,多種文字的輸入、輸出,打印非常成功。如果裝上口語輸入設備,就可實現(xiàn)語言打字機等,將人們從手指操作中解放出來。

  2、控制機器人

  利用有限詞匯的語音識別系統(tǒng)就能達到聲控機器人的目的。例如在機器人搬運重物的場合,如果給機器人接上語音識別器,使機器人能聽懂諸如“向前”、“左轉”、“右轉”、“提起”、“放下”等一些有關的命令,那么人們可以坐在一邊,用口令控制機器人完成重物的搬運。

評論  |   0條評論