當前位置:編程學習大全網 - 編程語言 - 統計建模是什麽?具體流程是什麽?難不難?給點案例。

統計建模是什麽?具體流程是什麽?難不難?給點案例。

壹、什麽是統計建模

統計建模是以計算機統計分析軟件為工具,利用各種統計分析方法對批量數據建立統計模型和探索處理的過程,用於揭示數據背後的因素,詮釋社會經濟現象,或對經濟和社會發展作出預測或判斷。隨著計算機和網絡技術的快速普及和廣泛發展,我們面對著數據和信息爆炸的挑戰,如何迅速有效地將數據提升為信息、知識和智能,是統計工作者面臨的重要課題。而統計建模將統計方法、計算機技術完美結合,帶動以數據分析為導向的統計思維,發現和挖掘數據背後的規律,為經濟社會的發展提供更好更多的統計信息。

大賽題目壹般來源於社會、經濟和管理科學等方面經過適當簡化加工的實際問題,不要求參賽者預先掌握深入的專門知識,只需要學過統計專業的基本內容,較為熟練地掌握統計分析方法,並且具備壹定的統計工作經驗。題目有較大的靈活性供參賽者發揮其創造能力。參賽者應根據題目要求,完成壹篇包括模型的假設、建立和求解、計算方法的設計及計算機實現、結果的分析和檢驗、模型的改進等方面的論文(即答卷)。大賽評獎以假設的合理性、建模的創造性、結果的正確性和文字表述的清晰程度為主要標準。

我們從下面壹個例子,看壹看什麽是統計建模。

案例:從交通事故數據能夠得到什麽結論?

基本數據:各省市自治區改革開放以來的交通事故數據。數據應該包括機動車(貨運,大客車、小轎車、農用車、拖拉機、各種摩托車和工程車等)、非機動車(自行車、三輪車)、其他(如電動、加力自行車和機動三輪車,雖然可能非法)、殘疾人車、獸力車、行人等等;數據也應該包括事故等級,事故個數、死亡人數、財產損失、受傷人數等;肇事者的職業、年齡、駕齡、教育程度、是否酒後駕車(很重要!)、是否疲勞駕車、是否打手機、車速、路況(街道、普通公路、等級公路、高速公路)、事故時間段等等(這些都是交管部門的標準記錄)。數據應該覆蓋至少10年(最好有月度數據)。

附加數據:各省市自治區相應年份的經濟資料,包括各種道路的裏程、各種機動車的保有數等。

問題:

1.找出各種車輛的各種事故的概率(及影響因素)、這些事故數量的影響變量(比如年齡因素、是否喝酒、山區或鬧市區、時間段、何種道路、車輛種類,等等)。

2.找出在什麽因素(變量)下最容易出事、什麽因素(變量)下最容易造成重大人身傷害、什麽因素(變量)造成財產損失最大。

3.找出各省市自治區事故的各自特點,並且按照事故模式把各省市自治區分類,同時按照經濟分類進行比較。說明交通事故與經濟發展之間的關系。

4.找出各地和全國事故的趨勢,以及這些趨勢與經濟(包括道路裏程、機動車數量等)之間的關系。並且對未來事故進行預測。

5.對各省市自治區,根據各種與交通事故相關的變量進行排序。

要求:壹切根據數據。任何所采用的統計方法要說明條件和假定。任何輸出的結果要有說明和解釋。

根據上述案例,不難形成這樣壹個判斷:在壹定意義上,統計建模是壹種命題作文,它有以下幾個特點:

壹是統計建模從經濟社會發展的實際情況出發,找出事物發展的趨勢和規律,如果脫離了這壹點,統計建模也就失去了意義。

二是統計建模從數據出發,找出數據之間的聯系,用數據說話,數據是統計建模最大的特質。

三是統計建模將統計分析方法和計算機技術有效結合,包括收集數據、利用統計分析軟件對數據進行分析等。

四是統計建模涉及數據收集、整理、分析等方面,對建模者的能力要求較為全面。

二、統計建模的流程

(壹)明確問題。統計建模強調問題導向,因此,首先要明確需要求解的問題。

(二)收集信息:在明確問題的基礎上,根據題目的要求,從可用的數據庫中收集和整理出各種必要的信息。

(三)模型假設:利用統計分析方法,對問題做出必要的、合理的假設,使問題的主要特征凸現出來,忽略問題的次要方面。

(四)模型構建:根據所做的假設以及事物之間的聯系,構造各種量之間的關系,把問題轉化為統計分析問題,註意要盡量采用適當的統計分析模型及方法。

(五)模型求解:利用構建的模型進行計算,並得到與問題有關的壹些信息。如果必要,可對問題作出進壹步的簡化或提出進壹步的假設。

(六)模型分析:對所得到的信息進行分析,形成判斷,特別要註意當數據變化時所得結果是否穩定。

(七)結果檢驗:分析所得結果的實際意義,與實際情況進行比較,看是否符合實際,如果不夠理想,應該修改、補充假設,或重新建模。

(八)撰寫論文:在上述基礎上形成論文,論文應包括問題的闡述、假設的敘述、模型構建的過程、模型求解結果、主要結論以及對結論的評價。

三、統計建模論文的基本內容

提交的論文應包括三個部分:

(壹)標題、摘要部分

題目——寫出較確切的題目

摘要——200-300字,包括模型的主要特點、建模方法和主要結果。

(二)主體部分

1.問題提出,問題分析。

2.模型建立:

(1)提出假設條件,明確概念,引進參數;

(2)模型構建;

(3)模型求解。

3.計算方法設計和計算機實現。

4.主要的結論或發現。

5.結果分析與檢驗。

6.討論——模型的優缺點,結果的意義。

7.參考文獻。

(三)附錄部分

計算程序,框圖。

各種求解演算過程,計算中間結果。

各種圖形、表格。

所謂難者不易,易者不難,每個確切的標準,不好評判壹二。不過,可以肯定的是,學之則易,不學則難。望勉之。

  • 上一篇:請教JAVA編程高手壹個問題,如何在面板上繪圖?
  • 下一篇:2011年9月全國計算機二級VB公***基礎知識
  • copyright 2024編程學習大全網