語音識別

1.什么是語言識別[1]

　　語言識別是指計算機用有限的特征或規(guī)則對我們?nèi)粘Ｉ钪惺褂玫恼Z言符號進行運算，以辨認出它們是哪些字或詞的過程。

2.語言識別的發(fā)展

　　語言識別的研究始于本世紀五十年代。開始時人們認識簡單，語聲既然有共振峰，在接收系統(tǒng)中設(shè)若干組共振線路，某一組輸出最大時就可判斷為某一語聲。但事實上并非如此簡單。這是因為一人在不同時間不同條件下，語言特征可能有相當大的變化，不同的人出入更大。當時識別裝置只能識別特定某人的少數(shù)幾個語言如0—9的數(shù)字。到70年代，由于電子計算機和計算技術(shù)的發(fā)展，這方面工作又活躍起來，至今研究的范圍已擴展到連續(xù)語言，大詞匯量，非特定人的范圍。但要做出一個這樣的實用系統(tǒng)，技術(shù)發(fā)展似乎還不夠，需要更深入地了解人的語言產(chǎn)生機理和感知理論，及語言學中句法分析和語義分析等。

3.語言識別的分類

　　語言識別可根據(jù)詞匯大小，講活人范圍，發(fā)音方式和環(huán)境等情況分作很多類。例如：

　　1、詞匯量大小

　　可分詞匯量小(1～20個詞)，中等(20～l00個詞)，大(100詞以上)；

　　2、講話人范圍

　　分特定某個人、某些人；非特定的，男、女或兒童等；

　　3、發(fā)音方式

　　孤立字發(fā)音，連續(xù)發(fā)音；

　　4、講話環(huán)境

　　例如隔聲問、機房、公共場所；

　　5、系統(tǒng)學習方式

　　不學習，離線學習，不斷地學習。

　　可見對語言識別系統(tǒng)的要求可以有很大的出入，因此系統(tǒng)的規(guī)模、大小、復(fù)雜性等出入也很大。

4.語言識別的應(yīng)用

　　1、語言打字機

　　現(xiàn)在微計算機已普遍應(yīng)用，多種文字的輸入、輸出，打印非常成功。如果裝上口語輸入設(shè)備，就可實現(xiàn)語言打字機等，將人們從手指操作中解放出來。

　　2、控制機器人

　　利用有限詞匯的語音識別系統(tǒng)就能達到聲控機器人的目的。例如在機器人搬運重物的場合，如果給機器人接上語音識別器，使機器人能聽懂諸如“向前”、“左轉(zhuǎn)”、“右轉(zhuǎn)”、“提起”、“放下”等一些有關(guān)的命令，那么人們可以坐在一邊，用口令控制機器人完成重物的搬運。

評論 | 0條評論

評論

經(jīng)理人分享

語音識別

目錄

1.什么是語言識別[1]

2.語言識別的發(fā)展

3.語言識別的分類

4.語言識別的應(yīng)用