多媒體信息檢索
1.什么是多媒體信息檢索
多媒體信息檢索是根據(jù)用戶(hù)的要求,對(duì)圖形、圖像、文本、聲音、動(dòng)畫(huà)等多媒體信息進(jìn)行檢索,得到用戶(hù)所需的信息。
多媒體信息檢索系統(tǒng)有著廣闊的應(yīng)用前景,它將廣泛用于電子會(huì)議、遠(yuǎn)程教學(xué)、遠(yuǎn)程醫(yī)療、電子圖書(shū)館、藝術(shù)收藏和地球資源管理、天氣預(yù)報(bào)、時(shí)裝設(shè)計(jì)、智能群體決策、計(jì)算機(jī)支持協(xié)同工作、金融市場(chǎng)、軍事指揮系統(tǒng)、防汛指揮系統(tǒng)等方面。例如,數(shù)字圖書(shū)館將物理信息轉(zhuǎn)化為數(shù)字多媒體形式,通過(guò)網(wǎng)絡(luò)安全地發(fā)送給世界各地的用戶(hù);自然語(yǔ)言查詢(xún)和要領(lǐng)查詢(xún)對(duì)返回給用戶(hù)的信息進(jìn)行篩選,使相關(guān)數(shù)據(jù)更為簡(jiǎn)單和精確;聚集功能將查詢(xún)結(jié)果組織在使用戶(hù)能夠簡(jiǎn)單地識(shí)別相關(guān)的信息;摘要功能能夠?qū)Σ樵?xún)結(jié)果進(jìn)行主要觀(guān)點(diǎn)的概括,而使用戶(hù)不必查看全部文本就可以確定所查找的信息。
2.多媒體信息檢索的關(guān)鍵技術(shù)
多媒體信息檢索系統(tǒng)指能對(duì)以文本信息為代表的離散媒體和以圖像、聲音等為代表的連續(xù)媒體的內(nèi)容進(jìn)行檢索.為了達(dá)到較好的檢索效果,必須解決以下關(guān)鍵技術(shù)。
1.信息模型和表示
信息模型是使用基于計(jì)算機(jī)的符號(hào)結(jié)構(gòu)對(duì)應(yīng)用信息模型化.多媒體信息檢索信賴(lài)于多媒體信息的組織形成,多媒體信息組織的優(yōu)劣在一定程度上決定了其檢索效率的高低.常見(jiàn)的多媒體對(duì)象是構(gòu)造型的復(fù)合對(duì)象,其本身可用多種數(shù)據(jù)模型.主要模型有:超文本模型、文獻(xiàn)模型和信息元模型等。
2.檢索技術(shù)
對(duì)文本信息進(jìn)行全文檢索和自由文本查詢(xún)時(shí),用戶(hù)只需提交一個(gè)查詢(xún)請(qǐng)求,即可找到所有涉及該關(guān)鍵詞的文檔.自由文本查詢(xún)的結(jié)果是一個(gè)按照序列值排序的文檔列表,相關(guān)概率最大的排在最前面.該序列根據(jù)以“詞匯相似性”為基礎(chǔ)的概率公式計(jì)算得出.對(duì)圖像信息可以按照顏色、形狀、紋理以及在圖像中的位置對(duì)圖像進(jìn)行查找。
3.查詢(xún)語(yǔ)言
傳統(tǒng)的數(shù)據(jù)庫(kù)查詢(xún)語(yǔ)言SQL無(wú)法適應(yīng)多媒體信息的檢索,盡管ISO對(duì)SQL做了多次擴(kuò)充,特別是在SQL3中增加了面向?qū)ο蟮母拍詈凸δ?,并?duì)過(guò)程加以擴(kuò)充,但形式化地表達(dá)和實(shí)現(xiàn)用于多媒體檢索的SQL,仍是非常困難的。
基于內(nèi)容檢索以QBE(Query By Example)為代表.這類(lèi)檢索直接依賴(lài)于圖像理解、語(yǔ)音識(shí)別等模式識(shí)別技術(shù),首先進(jìn)行特征抽取,再計(jì)算其相似性.目前,計(jì)算機(jī)模式識(shí)別技術(shù)尚未完全成熟,且不存在通用、高效的算法,這是多媒體基于內(nèi)容檢索進(jìn)一步發(fā)展的主要障礙。
4.信息壓縮和恢復(fù)
將物理形式的資料轉(zhuǎn)化為數(shù)字信息,并進(jìn)行壓縮和轉(zhuǎn)化.多媒體信息載體由于采用了大量的圖像、聲音、影視,其數(shù)據(jù)量比傳統(tǒng)以文字為主的單一媒體要大數(shù)百倍.?dāng)?shù)據(jù)的壓縮為多媒體信息處理的一項(xiàng)關(guān)鍵技術(shù)。
5.信息存儲(chǔ)管理
存儲(chǔ)對(duì)象可以是文本、聲音、圖形、圖像的數(shù)字比信息.對(duì)每一種類(lèi)型的對(duì)象,可以定義它們的索引、查詢(xún)支持(目錄)信息.答謝存儲(chǔ)管理采用客戶(hù)/服務(wù)器模型,信息服務(wù)器管理數(shù)據(jù)(或目錄)的索引和查詢(xún),而對(duì)象服務(wù)器則用于管理(或收集)數(shù)字化的對(duì)象。
6.多媒體同步技術(shù)
多媒體同步技術(shù)就是解決如何展現(xiàn)多媒體的空間組合問(wèn)題.尤其在采用客戶(hù)/服務(wù)模式的系統(tǒng)中,各種媒體源源分布在不同的數(shù)據(jù)庫(kù)中,多媒體同步技術(shù)就是從不同的庫(kù)中,將數(shù)據(jù)按時(shí)間順序及空間緩沖區(qū)地址的安排,恰當(dāng)?shù)亟M合起來(lái)。