登錄

統(tǒng)計(jì)數(shù)據(jù)處理

百科 > 統(tǒng)計(jì)數(shù)據(jù)處理

1.什么是統(tǒng)計(jì)數(shù)據(jù)處理

統(tǒng)計(jì)數(shù)據(jù)處理是指使用計(jì)算機(jī)對(duì)常規(guī)的統(tǒng)計(jì)報(bào)表、專項(xiàng)統(tǒng)計(jì)調(diào)查表和其他統(tǒng)計(jì)資料等載體上的數(shù)據(jù)進(jìn)行錄入(讀入)、審核編輯、匯總、制表、打印和計(jì)算等操作的過程。

2.統(tǒng)計(jì)數(shù)據(jù)處理的內(nèi)容

(1) 對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行采集、整理,并按一定的數(shù)據(jù)格式放入計(jì)算機(jī)。

(2)在數(shù)據(jù)輸入過程中,對(duì)原始統(tǒng)計(jì)數(shù)據(jù)進(jìn)行預(yù)審、編碼、邏輯檢查、修改、更新和簡單的算術(shù)運(yùn)算等。

(3) 對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行分類、合并、邏輯校正等操作。

(4) 對(duì)數(shù)據(jù)進(jìn)行分類匯總,以及制作各式綜合匯總表和過錄表。輸出各式打印表和種類數(shù)據(jù)文件。

3.統(tǒng)計(jì)數(shù)據(jù)處理的基本過程

統(tǒng)計(jì)資料是指反映大量社會(huì)經(jīng)濟(jì)現(xiàn)象的數(shù)量特征和規(guī)律性的數(shù)字資料。統(tǒng)計(jì)工作是搜集、整理和分析統(tǒng)計(jì)資料并進(jìn)行推論的工作??梢?,統(tǒng)計(jì)工作基本任務(wù)就是對(duì)統(tǒng)計(jì)資料的處理。

1.一般過程

根據(jù)統(tǒng)計(jì)學(xué)理論,我們知道統(tǒng)計(jì)數(shù)據(jù)處理過程一般分為:統(tǒng)計(jì)資料搜集、統(tǒng)計(jì)資料整理和統(tǒng)計(jì)資料分析及預(yù)測(cè)等三個(gè)階段。其中,統(tǒng)計(jì)資料搜集的目的是獲取與研究目的相關(guān)的大量原始、基層數(shù)據(jù);整理階段的處理對(duì)象是大量統(tǒng)計(jì)個(gè)體,是對(duì)個(gè)體的逐項(xiàng)處理;而分析研究階段的數(shù)據(jù)處理對(duì)象是統(tǒng)計(jì)總體,是在匯總基礎(chǔ)上對(duì)總體特征及規(guī)律的研究。

2.計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理過程

計(jì)算機(jī)數(shù)據(jù)處理過程是以計(jì)算機(jī)為中心的數(shù)據(jù)處理過程。它和手工、機(jī)械數(shù)據(jù)處理方式一樣,也包括三個(gè)階段,即:數(shù)據(jù)搜集→數(shù)據(jù)加工→數(shù)據(jù)輸出。

(1)數(shù)據(jù)處理的第一階段就是數(shù)據(jù)的搜集。搜集是指按一定的目的要求獲取原始統(tǒng)計(jì)資料的過程。數(shù)據(jù)處理質(zhì)量在很大程度上取決于搜集到的原始數(shù)據(jù)的完整性和真實(shí)性。統(tǒng)計(jì)數(shù)據(jù)搜集的手段很多,它既可以手工方式進(jìn)行,也可借助互聯(lián)網(wǎng)和計(jì)算機(jī)以自動(dòng)方式進(jìn)行。統(tǒng)計(jì)數(shù)據(jù)搜集方式有:統(tǒng)計(jì)報(bào)表制度、各種普查、抽樣調(diào)查、典型調(diào)查、重點(diǎn)調(diào)查等。

數(shù)據(jù)搜集核心是:數(shù)據(jù)的識(shí)別、采集和組織,即有目標(biāo)的選擇那些能反映事物運(yùn)動(dòng)過程屬性的數(shù)據(jù),將其及時(shí)、完整搜集起來并按一定層次加以組織。只有這樣才能清晰地反映事物活動(dòng)全過程。

(2)數(shù)據(jù)加工是數(shù)據(jù)處理的核心,一般包括數(shù)據(jù)編碼、錄入、審核、分組、匯總、計(jì)算、存貯、傳輸?shù)葍?nèi)容。

在計(jì)算機(jī)中,廣義的數(shù)據(jù)是指能被計(jì)算機(jī)處理的各種對(duì)象。為了使計(jì)算機(jī)能識(shí)別不同的數(shù)據(jù)并加以迅速處理,應(yīng)對(duì)數(shù)據(jù)進(jìn)行編碼,也就是通過一定的數(shù)字、符號(hào)來表達(dá)所得到的客觀事實(shí)。

據(jù)資料經(jīng)編碼分類后,由錄入人員將其輸入計(jì)算機(jī)。在數(shù)據(jù)組織中,很重要的工作是將數(shù)據(jù)輸入到計(jì)算機(jī),并按照規(guī)范的要求組成各種形式的數(shù)據(jù)庫,再由數(shù)據(jù)庫管理系統(tǒng)對(duì)其進(jìn)行管理。

數(shù)據(jù)審核是數(shù)據(jù)搜集的重要環(huán)節(jié)。所謂數(shù)據(jù)審核,就是對(duì)全部輸入數(shù)據(jù),設(shè)想其可能出現(xiàn)的差錯(cuò),并設(shè)法對(duì)其進(jìn)行檢驗(yàn)。對(duì)查出的有錯(cuò)誤的數(shù)據(jù),考慮改正和補(bǔ)救的方法等。

統(tǒng)計(jì)匯總就是按照數(shù)據(jù)的特征(數(shù)字或字母)或按照數(shù)據(jù)的某種屬性,將原始數(shù)據(jù)分成若干類型,并得出合計(jì)結(jié)果的處理過程。統(tǒng)計(jì)資料的匯總是統(tǒng)計(jì)資料整理的中心內(nèi)容。

數(shù)據(jù)處理過程必然要涉及到大量數(shù)據(jù)的存儲(chǔ)問題。計(jì)算機(jī)為存貯數(shù)據(jù)提供了各種存貯設(shè)備,如硬盤、軟盤、光盤、磁帶、閃存等。

計(jì)算機(jī)進(jìn)行數(shù)據(jù)傳輸可以分為機(jī)內(nèi)傳輸和機(jī)外傳輸。機(jī)內(nèi)傳輸主要是通過計(jì)算機(jī)的硬件和軟件進(jìn)行傳輸,如從光盤傳到內(nèi)存,從磁帶傳到內(nèi)存再傳到磁盤等;此外,還有一種傳輸是脫離主機(jī)直接在外部設(shè)備之間交換數(shù)據(jù),這稱為脫機(jī)傳輸。機(jī)外傳輸主要是通過通訊線路(共用或?qū)S镁€路)進(jìn)行的,一般稱為聯(lián)機(jī)系統(tǒng)。在聯(lián)機(jī)系統(tǒng)中數(shù)據(jù)發(fā)生一般是隨機(jī)的,需要及時(shí)進(jìn)行處理和輸出,這種方式也稱為鏈接傳輸。

(3)數(shù)據(jù)輸出是將加工后所得到的信息,通過各種方式輸出,以滿足統(tǒng)計(jì)業(yè)務(wù)工作或計(jì)算機(jī)管理工作的需要。輸出方式很多,如打印、顯示、圖樣、聲音等。

現(xiàn)代化管理要求對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行快速、適時(shí)、有效地處理,并且可以在部門、地區(qū)之間,甚至在國家之間進(jìn)行快速數(shù)據(jù)通訊,從而能及時(shí)為國民經(jīng)濟(jì)和領(lǐng)導(dǎo)部門的決策服務(wù)。這些要求,必須使用快捷、安全、準(zhǔn)確的輸出系統(tǒng)才能得以實(shí)現(xiàn)。目前,統(tǒng)計(jì)數(shù)據(jù)處理一般都是指計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理。如下圖是一個(gè)統(tǒng)計(jì)報(bào)表匯總系統(tǒng)的數(shù)據(jù)處理過程:

Image:圖統(tǒng)計(jì)報(bào)表匯總系統(tǒng)的數(shù)據(jù)處理過程.jpg

其中:“錄入”是對(duì)大量采集的數(shù)據(jù)進(jìn)行整理并按一定的格式輸入(或光電掃描、語音錄入、磁介質(zhì)數(shù)據(jù)格式轉(zhuǎn)換等)到磁介質(zhì)(硬盤、軟盤、磁帶、光盤等)中去;“審核”是對(duì)錄入(或傳輸入)的數(shù)據(jù)進(jìn)行正確性判斷,保證得到正確的數(shù)據(jù);“分組”是對(duì)錄入的數(shù)據(jù)按照統(tǒng)計(jì)的要求,對(duì)數(shù)據(jù)進(jìn)行分類、合并等操作;“制表”是對(duì)分組匯總后的數(shù)據(jù)按照統(tǒng)計(jì)表的格式加上標(biāo)題、題注、表側(cè)、表頂、表體、腳注等內(nèi)容。由圖可見,以上各環(huán)節(jié)都是在相應(yīng)的計(jì)算機(jī)程序下完成的。

3.計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理的特點(diǎn)

一般而言,統(tǒng)計(jì)數(shù)據(jù)整理屬于“海量數(shù)據(jù)處理”范疇,其特點(diǎn)是:“量大、高效、質(zhì)高、數(shù)據(jù)利用率高”。

“量大”,統(tǒng)計(jì)需處理的數(shù)據(jù)一般都是海量數(shù)據(jù),同時(shí),其數(shù)據(jù)處理需動(dòng)用的人力、物力也很大,數(shù)據(jù)處理的程序也較復(fù)雜;

“高效”,統(tǒng)計(jì)數(shù)據(jù)處理一般都有嚴(yán)格的時(shí)間限制,必須在規(guī)定的時(shí)間內(nèi)完成任務(wù)。同時(shí),由于處理的數(shù)據(jù)量大,還必須考慮到高效的數(shù)據(jù)錄入,高速的數(shù)據(jù)計(jì)算,計(jì)算機(jī)內(nèi)、外部存儲(chǔ)設(shè)備等的有效利用情況等;

“質(zhì)高”,統(tǒng)計(jì)數(shù)據(jù)處理必須做到科學(xué)、準(zhǔn)確、及時(shí),特別是反映社會(huì)經(jīng)濟(jì)現(xiàn)象的重要統(tǒng)計(jì)數(shù)據(jù);

“數(shù)據(jù)利用率高”,統(tǒng)計(jì)數(shù)據(jù)的處理還必須考慮數(shù)據(jù)的共享和進(jìn)一步深加工的需要,使處理后的數(shù)據(jù)能夠適應(yīng)不同層次、不同用戶的需要,以利于信息資源的有效利用。

計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理,為“獲取信息資源的最大化”提供了可能。如下圖是手工、計(jì)算機(jī)數(shù)據(jù)處理對(duì)信息增減的對(duì)比示意圖。

Image:統(tǒng)計(jì)數(shù)據(jù)處理的信息增減示意圖.jpg

利用計(jì)算機(jī),可以高效、廣泛搜集到各種統(tǒng)計(jì)數(shù)據(jù),并對(duì)大量采集到的數(shù)據(jù)進(jìn)行整理,按一定的格式存儲(chǔ)起來以利于數(shù)據(jù)共享;可以在數(shù)據(jù)加工階段發(fā)揮計(jì)算機(jī)數(shù)據(jù)處理的優(yōu)勢(shì),對(duì)原始統(tǒng)計(jì)資料進(jìn)行各種分組、集成和計(jì)算,盡可能多的挖掘出各種有用信息;可以在數(shù)據(jù)提供階段根據(jù)用戶的不同需要而輸出各種結(jié)果,滿足個(gè)性化的需求。與傳統(tǒng)手工統(tǒng)計(jì)數(shù)據(jù)處理方式相比較,計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理方式在獲取統(tǒng)計(jì)信息資源最大化方面有著明顯的優(yōu)勢(shì)。

4.計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理的方式

計(jì)算機(jī)統(tǒng)計(jì)數(shù)據(jù)處理方式通常有集中批處理和聯(lián)機(jī)實(shí)時(shí)處理系統(tǒng)。

(1)集中批處理是統(tǒng)計(jì)部門廣泛使用的一種處理方式。集中批處理是把一批統(tǒng)計(jì)數(shù)據(jù)處理任務(wù),包括統(tǒng)計(jì)數(shù)據(jù)及任務(wù)要求一起交給計(jì)算中心,統(tǒng)計(jì)數(shù)據(jù)處理專業(yè)人員按系統(tǒng)具備的數(shù)據(jù)處理能力,對(duì)這批數(shù)據(jù)處理任務(wù)的性質(zhì)和特點(diǎn)做出合理的安排,使計(jì)算機(jī)系統(tǒng)用最短的時(shí)間保質(zhì)、保量地完成這批任務(wù)。在集中批處理進(jìn)行的過程中,不需要其他用戶干預(yù)。由于批處理是把作業(yè)匯集在一起進(jìn)行處理,因此,處理效率比較高。

采用集中批處理方式,數(shù)據(jù)源就在機(jī)房或可將數(shù)據(jù)源匯集后在機(jī)房處理,且處理結(jié)果不必要實(shí)時(shí)返回,這種集中批處理方式也是通常所指的機(jī)房處理方式。

(2)實(shí)時(shí)處理是在數(shù)據(jù)產(chǎn)生的同時(shí),立即進(jìn)行處理,并在規(guī)定的時(shí)間內(nèi)返回處理的結(jié)果。實(shí)時(shí)處理已廣泛應(yīng)用在網(wǎng)上直報(bào)、網(wǎng)絡(luò)調(diào)查等統(tǒng)計(jì)工作中,也廣泛應(yīng)用于飛機(jī)票、車船票預(yù)約系統(tǒng)和銀行業(yè)務(wù)、交通控制、過程控制、生產(chǎn)管理,倉庫管理等領(lǐng)域。

采用實(shí)時(shí)處理,數(shù)據(jù)源一般是分散的,而且處理結(jié)果實(shí)時(shí)響應(yīng)。這時(shí)系統(tǒng)必然是多終端的聯(lián)機(jī)系統(tǒng),終端分布在各數(shù)據(jù)源,通過通信線路連接終端和主機(jī),這就是通常所指的聯(lián)機(jī)處理方式。一般的實(shí)時(shí)事物處理系統(tǒng)和經(jīng)營管理系統(tǒng)都采用這一方式。應(yīng)該指出,在聯(lián)機(jī)終端上也可以提交批處理作業(yè),而且聯(lián)機(jī)系統(tǒng)的基礎(chǔ)是計(jì)算機(jī)及通信網(wǎng)絡(luò)。

評(píng)論  |   0條評(píng)論