當前位置:編程學習大全網 - 編程語言 - 請簡述編制變量數列的方法!(統計學)

請簡述編制變量數列的方法!(統計學)

上壹頁  下壹頁  返回 

妳的位置:第三章 | 第三節|二、變量數列的編制

二、變量數列的編制

變量數列的編制比較復雜,因此有必要對變量數列的編制方法、編制步驟以及編制過程中需註意的問題進行探討。

(壹)陣列,求全距

首先對原始資料進行初步整理,即將各個變量值按大小順序排列,形成壹個陣列,並確定其全距R。全距是指資料中的最大值與最小值之差,能反映資料中各變量值波動的範圍大小。通過初步整理,可使我們大致了解該資料的某些特征和變動規律,從而為正確編制變量數列提供必要的依據。

(二)確定變量數列的形式

編制單項數列還是組距數列,主要取決於所研究變量的類型以及變量變動的幅度。對於連續變量,因其所描述對象的數量特征,在壹個區間內可以有無限多個數值,無法按壹定次序將其變量值壹壹列舉,所以只能編制組距數列。對於離散變量,則要根據其變量值的多少和變異幅度的大小來確定。如變量值較少以及變異幅度較小的,可編制單項數列;如變量值較多以及變異幅度較大的,應編制組距數列。具體如何分組,要結合分析目的及資料特點確定。

(三)確定組距和組數

組距的大小和組數的多少互為制約成反比關系。組距越大,組數就越少;組距越小,組數就越多。組數過少,容易把不同質的單位歸在壹個組內;組數過多,又容易把同質單位劃入到不同的組內。兩者都不符合分組的要求,都不能確切地反映總體的分布特征。因 此,確定組距和組數,應全面分析資料所反映的經濟內容、變量值的離散程度或集中趨勢以及數據多少等因素,要使組距能如實地反映出各組之間的數量界限,將同質單位歸入同壹組,而將不同質單位劃分為不同的組,準確、真實地揭示出總體的分布特征及規律性。

當變量值變動比較均勻,並且可能編制等距數列的條件下,其組距也可采用斯特奇斯公式求得。這是壹種假定總體各單位按其標誌分布趨於正態分布的條件下,根據總體單位數目近似確定分組數目並計算組距近似值的方法,是由經驗總結得來。計算公式為:

      組距(i)=    

 需要指出,根據經驗,由此公式求出的組數,當數據較少時,往往過多;當數據較多時,則往往過少。所以該公式只能作為參考之用。

組距數列有等距數列和異距數列兩種,選等距分組還是異距分組,應根據統計研究的任務和所研究現象變化的特點來決定。壹般而言,凡是現象的變動比較均勻的,宜采用等距分組。如按工資,按身高、體重,按零件尺寸誤差等分組。等距分組,由於各組組距相同,各組單位數(次數)只受標誌變量的影響,因此可直接比較各組的次數。同時,根據等距數列資料,便於直接繪制統計圖,計算各項綜合指標並進行對比分析。因此,應盡可能采用等距分組。但在社會經濟統計中,有些現象性質差異的變動並不均衡,往往波動很大,如急劇上升或下降,這就難以用等距分組的方法來劃分不同性質的組,從現象量的變化中反映出不同質的差別,這就必須采用異距分組。

采用異距分組編制的異距數列,由於各組次數要受組距大小不同的影響,為消除此影響,更確切地反映出各組次數的實際分布狀況,可計算次數密度或標準組距次數。

次數密度,就是單位組距內分布的次數,又稱為頻數密度。計算公式為:

              次數密度=

標準組距次數,即選定數列中某壹合適的組距作為標準組距,用標準組距除以各組組距,得各組組距折合為標準組距的系數,再將各組的折合系數分別乘各組的次數,即可得各組的標準組距次數。

次數密度與標準組距次數其實質是相同的,它們都是對異距數列進行分析的重要指標。兩者計算上的聯系表現為:標準組距次數等於次數密度與標準組距的乘積。

(四)確定組限

組距、組數確定後,需進壹步確定組限。組限應根據變量的性質來確定,更要有利於反映出總體各單位的實際分布特征。具體應考慮以下幾個方面。(1)組限最好采用整數表示,各組下限盡可能取所選定組距的倍數。(2)組限壹般不用負值表示,最小為零。(3)應使最小組下限不大於資料中的最小變量值,最大組上限不小於資料中的最大變量值。(4)對連續變量和離散變量組限的劃分和表示方法,在技術上有不同的要求。對連續變量,相鄰兩組的組限應重疊,並且習慣上按照“上限不在本組內,應歸入到下壹組”的原則處理與上限相同的變量值。

(五)計量各組單位數

通過手工匯總或電子計算機匯總,在變量分組確定以後,直接計量各組內總體單位數目,得出各組總體單位的分配次數或以組次數占總次數的比率形式,則變量數列的編制結束,根據變量數列可進行各種統計分析。

  • 上一篇:高分學編程,請問C、C++、JAVA、VB、QB、FOX、MATLAB之間的聯系有哪些,怎麽學好壹門編程語言呢?
  • 下一篇:中山大學網絡教育學院的心理學系
  • copyright 2024編程學習大全網