當前位置:編程學習大全網 - 編程語言 - 基於鉆孔數據的可視化空間分析方法研究與實現:空間數據可視化

基於鉆孔數據的可視化空間分析方法研究與實現:空間數據可視化

摘 要:本文以鉆孔數據的空間分析入手,主要研究了空間數據挖掘模型的實現,提出適合鉆孔數據管理和分析的空間數據挖掘模型結構。通過趨勢面分析和空間聚類兩種空間分析方法探討了礦化段之間的相關性,定性分析了礦體的總體分布情況,對礦體的分布規律進行預測評估。

關鍵詞:鉆孔數據;空間數據挖掘;趨勢面分析; 聚類分析

1 引言

鉆井領域數據復雜, 既有定量測量的數據, 又有定性的文字描述, 它們量綱不壹、形式多樣。如何把這些反映不同特性的數據結合起來, 無冗余, 而又不漏失地反映井、礦的特性, 壹直是鉆井領域資料解釋的重點[1]。如何從龐大的數據庫中挖掘出需要的信息,並將這些信息通過空間分析轉化為直觀的知識呈現給用戶,將是本文探討的重點內容。

2 空間數據挖掘模型

空間數據挖掘(Spatial Data Mining,SDM),也稱基於空間數據庫的數據挖掘和知識發現(Spatial Data Mining and Knowledge Discovery),是指從空間數據庫中提取隱含的、用戶感興趣的知識、空間或其他有意義的模式[2] 。空間數據挖掘和知識發現的過程通常包括反復的試驗、決策設計和用戶定制,是多個步驟相互連接、反復進行人機交互的過程。Fayyad將知識發現的過程劃分為九個階段,如圖1所示。

圖1 空間數據挖掘(SDMKD)的主要階段[3]

Fig1 main phases of SDMKD

空間數據挖掘主要研究空間數據的概率分布模式、聚類和分類特征,屬性間的依賴關系特征等,它的任務是要發現大量的地理空間信息中所隱含的知識或規則。空間數據挖掘可發現的知識類型主要有:⑴空間關聯規則,即空間對象間相鄰、相連、***生、包含等關聯關系;⑵空間聚類規則,即特征相近的空間對象聚類的規則;⑶空間特征規律,即壹類或幾類空間對象的普遍特征;⑷空間區分規則指多類空間對象間的不同特征即可以用來區分對象[4]。本文基與鉆孔數據提出了壹種數據挖掘模型,

3 空間分析

空間分析是基於地理對象的位置形態特征的空間數據分析技術,其目的在於提取和傳輸空間信息。常用的空間分析方法有空間聚類、趨勢面分析、網絡分析、小波分析及空間自相關分析等等,本文從挖掘任務和挖掘方法的角度,著重介紹聚類分析和趨勢面分析兩種重要的分析方法。

3.1趨勢面分析

空間趨勢反映的是空間物體在空間區域上變化的主體特征,因此它忽略了局部的變異以揭示總體規律。描述空間趨勢是相當困難的問題,從理論上講,空間梯度均值可以作為描述空間趨勢的壹個參數,但因其不能從空間的角度反映趨勢,因此在實際當中很少使用。趨勢面是揭示面狀區域上連續分布現象空間變化規律的理想工具,也是實際當中經常使用的描述空間趨勢的主要方法。經過適當的預處理,非連續分布的現象在面狀區域上的空間趨勢亦可以用趨勢面來描述。

趨勢面分析適用於描述面狀區域上連續分布現象的空間趨勢,由於鉆孔數據是分布在三維空間中,所以有必要將三維鉆孔數據映射到壹個平面上,本文將這個投影值稱為礦化厚度,它的計算公式為:

c = ∑(l * k) * p (l-礦化段的長度,k-礦化段的礦化度,p-放大因子)。定義這個參數後,可以表示每口鉆井含礦情況的量化值,用此參數進行趨勢面分析,采用地圖學中的等值線方法對分析結果進行可視化,可直觀地表示出研究區域中的礦體分布趨勢。

式中:C為擬合指數,Zj為第j點的觀測值, 為第j點的趨勢值, 為全部觀測值的平均值。當C=100%時,表明趨勢值在所有觀測點上都與實際值吻合,但這種情況是很少的。當C=75%以上時,擬合誤差均在10%以下,這時可以認為趨勢面的擬合效果良好。

3.2聚類分析

空間聚類的目的是對空間物體的集群性進行分析,將其分為幾個不同的子群(類)。子群的形成是地理系統運作的結果,根據此可以揭示某種地理機制。對於離散的點群Pi ( i=1,2,…,n ),我們可以得到壹組描述點群位置的幾何數據(xi,yi,zi),亦可以有壹組統計變量的屬性數據ci =(ci1,ci2,…cim),空間聚類是基於幾何數據的聚類。同樣基於ci,也可以進行聚類分析,盡管可以采用相同的算法,但基於ci的聚類應視為非空間分析[4]。

進行空間聚類分析有壹個前提條件,就是點群具有壹定的集中趨勢。考慮到鉆孔數據在xy平面上是均勻分布的,但在三維空間中,礦化段在z軸方向具有集中分布的趨勢,實際聚類中應當充分考慮鉆井平面分布的均勻性,同時為了克服對初始選值敏感性的缺點,文中對聚類算法進行壹定的改進。在選擇初始值時結合礦化量的趨勢面分析結果,用趨勢面分析得到的極值點來確定K-MEANS算法的初始聚類中心,這樣不僅保持了K-均值算法快速收斂的特點,同時也使聚類的結果更符合實際的分布趨勢。其算法步驟如下:

1) 根據礦化量統計分析結果,找出礦化量平面上的極值*Sj 。

2) 合並相近的極值點*Sj ,得到初始的聚類中心Sj 。

3) 獲取聚類數目k ,置叠代誤差閾值emin = 0.00001(可根據需要設置)。

4) 根據聚類數目k,初始化聚類中心:

式中:Nj 為第j個聚類域中包含的樣本個數。

若|C j (t+1) - C j (t) |< emin , j = 1,2,…,k 則停止叠代,第t次叠代為聚類方案;否則 返回第四步。

通過該算法在對礦化段進行相關性分析時,可以參考趨勢面分析的結果,改變聚類參數來獲得與趨勢面分析更吻合的聚類效果。在趨勢面分析的基礎上,通過空間聚類分析得到各個鉆井之間的相關性,為進壹步的研究礦體分布和三維礦體模擬提供了先驗知識。

圖3 聚類數目為4的礦化段相關性分布圖

Fig3 Map for mineralized segment distribution with clustering of 4

4 結論

基於本文提出的數據挖掘模型,在Windows環境下,采用三十口鉆井數據,利用VC++和OPENGL開發出了基於鉆孔數據的三維空間數據挖掘系統。本系統對研究區域的礦體分布情況具有壹定的自動推理能力,避免了不必要的人工幹預 ,從而擴展了鉆孔數據建模的適用範圍和表現能力。但此方法仍然存在壹些不足 ,如對地質構造扭曲變形嚴重 ,存在復雜褶

皺及多種構造混合時建模效果有待改進;建模過程中沒有考慮必要的人機交互 ,各種地質資料、專家知識和工程經驗不能及時融入到實際建模流程中等。由於地質現象的高度復雜性和不確定性 ,上述問題將隨著研究和實際應用的深入而逐步得到解決。

參考文獻

[1] 雍世和, 洪有密. 測井資料綜合解釋與數字處理[M ]. 北京: 石油工業出版社, 1982.

[2] 劉毅勇,何雄,李金山等.空間數據挖掘:變數據為知識.計算機世界報,2005.8.15.

[3] 王凈. 空間數據挖掘和知識發現與地理可視化的集成.測繪通報,2005年第12期.

[4] 巨珺, 張虹. 空間數據挖掘方法分析. 福建電腦,2007年第3期.

[5] 郭仁忠.空間分析.高等教育出版社,北京,2001.10.

作者簡介

陳 昊(1985-),男,中國礦業大學資源與地球科學學院,碩士研究生。

  • 上一篇:海爾洗衣機質量如何
  • 下一篇:Maastercam編孔的程序怎樣設置呢
  • copyright 2024編程學習大全網