登錄

語(yǔ)音識(shí)別

百科 > 信息技術(shù) > 語(yǔ)音識(shí)別

1.什么是語(yǔ)言識(shí)別[1]

  語(yǔ)言識(shí)別是指計(jì)算機(jī)用有限的特征或規(guī)則對(duì)我們?nèi)粘I钪惺褂玫恼Z(yǔ)言符號(hào)進(jìn)行運(yùn)算,以辨認(rèn)出它們是哪些字或詞的過(guò)程。

2.語(yǔ)言識(shí)別的發(fā)展

  語(yǔ)言識(shí)別的研究始于本世紀(jì)五十年代。開(kāi)始時(shí)人們認(rèn)識(shí)簡(jiǎn)單,語(yǔ)聲既然有共振峰,在接收系統(tǒng)中設(shè)若干組共振線(xiàn)路,某一組輸出最大時(shí)就可判斷為某一語(yǔ)聲。但事實(shí)上并非如此簡(jiǎn)單。這是因?yàn)橐蝗嗽诓煌瑫r(shí)間不同條件下,語(yǔ)言特征可能有相當(dāng)大的變化,不同的人出入更大。當(dāng)時(shí)識(shí)別裝置只能識(shí)別特定某人的少數(shù)幾個(gè)語(yǔ)言如0—9的數(shù)字。到70年代,由于電子計(jì)算機(jī)和計(jì)算技術(shù)的發(fā)展,這方面工作又活躍起來(lái),至今研究的范圍已擴(kuò)展到連續(xù)語(yǔ)言,大詞匯量,非特定人的范圍。但要做出一個(gè)這樣的實(shí)用系統(tǒng),技術(shù)發(fā)展似乎還不夠,需要更深入地了解人的語(yǔ)言產(chǎn)生機(jī)理和感知理論,及語(yǔ)言學(xué)中句法分析和語(yǔ)義分析等。

3.語(yǔ)言識(shí)別的分類(lèi)

  語(yǔ)言識(shí)別可根據(jù)詞匯大小,講活人范圍,發(fā)音方式和環(huán)境等情況分作很多類(lèi)。例如:

  1、詞匯量大小

  可分詞匯量小(1~20個(gè)詞),中等(20~l00個(gè)詞),大(100詞以上);

  2、講話(huà)人范圍

  分特定某個(gè)人、某些人;非特定的,男、女或兒童等;

  3、發(fā)音方式

  孤立字發(fā)音,連續(xù)發(fā)音;

  4、講話(huà)環(huán)境

  例如隔聲問(wèn)、機(jī)房、公共場(chǎng)所;

  5、系統(tǒng)學(xué)習(xí)方式

  不學(xué)習(xí),離線(xiàn)學(xué)習(xí),不斷地學(xué)習(xí)。

  可見(jiàn)對(duì)語(yǔ)言識(shí)別系統(tǒng)的要求可以有很大的出入,因此系統(tǒng)的規(guī)模、大小、復(fù)雜性等出入也很大。

4.語(yǔ)言識(shí)別的應(yīng)用

  1、語(yǔ)言打字機(jī)

  現(xiàn)在微計(jì)算機(jī)已普遍應(yīng)用,多種文字的輸入、輸出,打印非常成功。如果裝上口語(yǔ)輸入設(shè)備,就可實(shí)現(xiàn)語(yǔ)言打字機(jī)等,將人們從手指操作中解放出來(lái)。

  2、控制機(jī)器人

  利用有限詞匯的語(yǔ)音識(shí)別系統(tǒng)就能達(dá)到聲控機(jī)器人的目的。例如在機(jī)器人搬運(yùn)重物的場(chǎng)合,如果給機(jī)器人接上語(yǔ)音識(shí)別器,使機(jī)器人能聽(tīng)懂諸如“向前”、“左轉(zhuǎn)”、“右轉(zhuǎn)”、“提起”、“放下”等一些有關(guān)的命令,那么人們可以坐在一邊,用口令控制機(jī)器人完成重物的搬運(yùn)。

評(píng)論  |   0條評(píng)論