機械學(xué)習(xí)
1.什么是機械學(xué)習(xí)
所謂機械學(xué)習(xí)是一種單純依靠記憶學(xué)習(xí)材料,而避免去理解其復(fù)雜內(nèi)部和主題推論的學(xué)習(xí)方法。平時多稱為死記、死背或死記硬背。
由美國心理學(xué)家大衛(wèi)·奧蘇伯爾提出,與有意義學(xué)習(xí)相對的概念,指符號所代表的新知識與學(xué)習(xí)者認知結(jié)構(gòu)中已有的知識建立非實質(zhì)性的和人為的聯(lián)系。如學(xué)生僅能記住乘法口訣表,形成機械的聯(lián)想,但并不真正理解這些符號所代表的知識。
2.機械學(xué)習(xí)的主要問題[1]
對于機械學(xué)習(xí),需要注意3個重要的問題:存儲組織,穩(wěn)定性和存儲與計算之間的權(quán)衡。
(a) 存儲組織信息。顯然,只有當檢索一個項目的時間比重新計算一個項目的時間短時,機械學(xué)習(xí)才有意義,檢索的越快,其意義也就越大。因此,采用適當?shù)拇鎯Ψ绞?,使檢索速度盡可能地快,是機械學(xué)習(xí)中的重要問題。在數(shù)據(jù)結(jié)構(gòu)與數(shù)據(jù)庫領(lǐng)域,為提高檢索速度,人們研究了許多卓有成效的數(shù)據(jù)存儲方式,如索引、排序、雜湊等等,在機械學(xué)習(xí)中我們可以充分利用這些成果來實現(xiàn)我們的要求。
(b) 環(huán)境的穩(wěn)定性與存儲信息的適用性問題。在急劇變化的環(huán)境下機械學(xué)習(xí)策略是不適用的。做為機械學(xué)習(xí)基礎(chǔ)的一個重要假定是在某一時刻存儲的信息必須適用于后來的情況。然而如果信息變換得特別頻繁,這個假定就被破壞了。
(c) 存儲與計算之間的權(quán)衡。因為機械學(xué)習(xí)的根本目的是改進系統(tǒng)的執(zhí)行能力,因此對于機械學(xué)習(xí)來說很重要的一點是它不能降低系統(tǒng)的效率。比方說,如果檢索一個數(shù)據(jù)比重新計算一個數(shù)據(jù)所花的時間還要多,那么機械學(xué)習(xí)就失去了意義。
這種存儲與計算之間的權(quán)衡問題的解決方法有兩種。一種方法是估算一下存儲信息所要花費的存儲空間以及檢索信息時所花費的時間,然后將其代價與重新計算所花的代價比較,再決定存儲信息是否有利。另一種方法是把信息先存儲起來,但為了保證有足夠的檢索速度,限制了存儲信息的量,系統(tǒng)只保留那些最常使用的信息,“忘記”那些不常使用的信息。這種方法也叫“選擇忘卻”技術(shù)。
3.機械學(xué)習(xí)應(yīng)用舉例[1]
雖然機械學(xué)習(xí)是機器學(xué)習(xí)中最簡單的策略,但是正確使用這種策略卻能對提高應(yīng)用軟件系統(tǒng)的質(zhì)量起著重要作用。下面介紹吉林大學(xué)開發(fā)的建筑工程預(yù)算軟件系統(tǒng)中采用的機械學(xué)習(xí)策略。這種方法成功地解決了工程預(yù)算中較難處理的圖集問題。
建筑工程預(yù)算是建筑工程中一項困難而又重要的任務(wù),工作量大,要求高。過去用手工編制,要花費很多時間。一份3000m2的民用建筑,一個技術(shù)人員手工編制預(yù)算需要15天至20天,加上工料分析,取費計算等等,需要近一個月時間,而且容易出錯,影響預(yù)算的質(zhì)量,造成資金、人員和材料的浪費與損失。近年來,隨著電子計算機的普及應(yīng)用,許多單位研制了建筑預(yù)算系統(tǒng),減輕了建筑工程預(yù)算人員的繁重的腦力勞動,提高了工程預(yù)算的速度與準確性。
但是,建筑預(yù)算中的關(guān)鍵問題——工程量計算問題,卻始終沒有得到很好地解決。這個問題的困難之一在于現(xiàn)行使用的建筑工程設(shè)計圖紙上的數(shù)據(jù)與計算機要求的初始輸入數(shù)據(jù)之間存在著很大的差距,只有靠建筑工程人員分析觀察圖紙,形成計算機可接受的初始輸入,才能開始計算。造成工程量計算困難的第二個原因是設(shè)計圖紙中出現(xiàn)的大量的門窗及預(yù)制件型號。預(yù)算中,工程技術(shù)人員需要不斷查閱有關(guān)資料,決定這些預(yù)制件所需工時及材料。所采用的機械學(xué)習(xí)方法主要用來解決這一困難。
建筑工程中使用的門窗,大都采用國家或省市的標準設(shè)計,如JGMC—1—16—3是建工部規(guī)定的標準木窗,窗寬1米,高1.6米,此外還確定了窗的式樣,如該窗是亮子的,3開扇,中間固定,有小汽窗,根據(jù)這種標準設(shè)計圖紙,人們預(yù)先計算出建造一個這種窗子所需的木料,玻璃,油漆,合頁,鐵角,拉手,所需木工量,油工量等等。在建筑工程圖紙上,并不畫出具體的窗子和門,只標明窗子和門的型號,預(yù)算時,人們只要數(shù)出各種窗子和門分別有多少個,然后根據(jù)標準圖集查出每種窗子和門各需多少原材料及人工,即可求出建造門窗所需總的建筑材料及費用。
從問題的性質(zhì)來看,采用計算機檢索是最適宜不過了。但事情并不那么簡單,問題的難點在于門窗的標準型號太多。這些標準型號的門窗,按規(guī)定標準的部門及門窗的種類編成許多厚厚的標準圖集。雖然在工程預(yù)算程序內(nèi)部保存了大量的標準圖集,但仍不能滿足預(yù)算的實際需要,一旦遇見一個先前未裝入的新型號,系統(tǒng)只好暫時停止運行,把新型號門窗及有關(guān)數(shù)據(jù)裝入后再行計算,這樣算算停停,很不方便,而且使預(yù)算時間拖得很長。
建筑工程所用的門窗及預(yù)制構(gòu)件雖多,但也有其規(guī)律性。一般說來,一個建筑工程設(shè)計部門經(jīng)常使用某些型號,對另外一些型號卻較少涉及,一個工程項目通常只采用幾種或幾十種型號的門窗和預(yù)制件,并不是雜亂無章的。因此可采用機械學(xué)習(xí)方法解決這一問題。當程序運行中遇見未曾裝入的門窗型號或預(yù)制構(gòu)型號時,不是停下來待裝入后重新計算,而是向用戶提出詢問,根據(jù)用戶提供的數(shù)據(jù),程序算出一個窗子或門等標準構(gòu)件所需木材、玻璃、鐵角等材料及所需各工種工日數(shù),然后把計算的數(shù)據(jù)提供給預(yù)算系統(tǒng)繼續(xù)計算,并把門窗等標準構(gòu)件型號與所需材料及工日保存起來,以后再遇見同種型號的標準構(gòu)件,建筑工程系統(tǒng)只要通過檢索就能獲得數(shù)據(jù),可以順利進行下去,不再需要用戶干預(yù)。因為大多數(shù)工程項目為著采購、制造、運輸與管理上的方便,只采用幾種或幾十種的標準預(yù)制構(gòu)件,所以預(yù)算系統(tǒng)在詢問幾次之后,就不必再行詢問,直至計算得出最終預(yù)算結(jié)果,從而方便了用戶,縮短了運行時間。
這種預(yù)算方法的另一個優(yōu)點是具有廣泛的適應(yīng)性和自我完善能力,一個建筑設(shè)計部門通常與幾個門窗生產(chǎn)廠家與預(yù)制件廠家有業(yè)務(wù)聯(lián)系,因此通常采用某些型號的標準預(yù)制件。一旦這些型號的數(shù)據(jù)裝入計算機,系統(tǒng)就能在大多數(shù)情況下獨立完成預(yù)算。因此,上述采用的圖集處理方法不僅適用于吉林省,而且其它省份與建筑部門也可同樣采用,只要他們使用一段時間之后,系統(tǒng)所積累的型號就基本上能滿足他們的要求。因此便于推廣,而且使用的次數(shù)越多,積累的標準構(gòu)件型號越多,系統(tǒng)提出詢問的情況越少,計算的速度也越來越快。