當前位置:編程學習大全網 - 編程語言 - 讀《大數據時代》心得體會

讀《大數據時代》心得體會

  讀《大數據時代》心得體會(壹)

 讀了《大數據時代》後,感覺到壹個大變革的時代將要來臨。雖然還不怎麽明了到底要徹底改變哪些思維和操作方式,但顯然作者想要?終結?或顛覆壹些傳統上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強烈震撼,不禁戰栗起來。

 ?在小數據時代,我們會假象世界是怎樣運作的,然後通過收集和分析數據來驗證這種假想。?隨著由假想時代到數據時代的過渡,我們也很可能認為我們不在需要理論了。?書中幾乎肯定要顛覆統計學的理論和方法,也試圖通過引用《連線》雜誌主編安德森的話?量子物理學的理論已經脫離實際?來?終結?量子力學。對此我很高興,因為統計學和量子力學都是我在大學學習時學到抽筋都不能及格的課目。但這兩個理論實在太大,太權威,太基本了,我想我不可能靠壹本書就能擺脫這兩個讓我頭疼壹輩子的東西。作者其實也不敢旗幟鮮明地提出要顛覆它們的論點,畢竟還是在前面加上了?很可能認為?這樣的保護傘。

 近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應該做到的就是要破和立,要改變自己的傳統,跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發展的大帽子。既然大數據是?通往未來的必然改變?,那我就必須?不受限於傳統的思維模式和特定領域裏隱含的固有偏見?,跟作者壹起先把統計學和量子力學否定掉再說。反正我也不喜歡、也學不會它們。

 當我們人類的數據收集和處理能力達到拍字節甚至更大之後,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性後,似乎真的可以拋棄以抽樣調查為基礎的統計學了。但是由統計學和量子力學以及其他很多?我們也很可能認為我們不再需要的?理論上溯,它們幾乎都基於壹個***同的基礎?邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理壹起給?不再需要?的話,就讓我很擔心了!

 《大數據時代》第16頁?大數據的核心就是預測?。邏輯是?描述時空信息?類?與?類?之間長時間有效不變的先後變化關系規則。兩者似乎是做同壹件事。可大數據要的?不是因果關系,而是相關關系?,?知道是什麽就夠了,沒必要知道為什麽?,而邏輯學四大基本定律(同壹律、矛盾律、排中律和充足理由律)中的充足理由律又?明確規定?任何事物都有其存在的充足理由。且邏輯推理三部分?歸納邏輯、溯因邏輯和演繹邏輯都是基於因果關系。兩者好像又是對立的。在同壹件事上兩種方法對立,應該只有壹個結果,就是要否定掉其中之壹。這就是讓我很擔心的原因。

 可我卻不能拭目以待,像旁觀者壹樣等著哪壹個?脫穎而出?,因為我身處其中。問題不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。

 其壹:量子力學搞了壹百多年,為了處理好混雜性問題,把質量和速度結合到能量上去了,為了調和量子力學與相對論的矛盾,又搞出壹個量子場論,再七搞八搞又有了蟲洞和羅森橋,最後把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機器。唯壹阻止那些?愛因斯坦?們?瞎胡鬧?的就是因果關系,因為爸爸就是爸爸,兒子就是兒子。那麽大數據會不會通過正視混雜性,放棄因果關系最後反而搞出時間機器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機器的根本區別在於人有邏輯思維而機器沒有。《大數據時代》也擔心?最後做出決策的將是機器而不是人?。如果真的那壹天因為放棄邏輯思維而出現科幻電影上描述的機器主宰世界消滅人類的結果,那我還不如現在就趁早跳樓。

 還好我知道自己對什麽統計學、量子力學、邏輯學和大數據來說都是門外漢,也許上面壹大篇都是在胡說八道,所謂的擔心根本不存在。但問題出現了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點迷津。

 所以想向《大數據時代》的作者提壹個合理化建議:把這本書繼續寫下去,至少加壹個第四部分?大數據時代的邏輯思維。

  讀《大數據時代》心得體會(二)

 信息時代的到來,我們感受到的是技術變化日新月異,隨之而來的是生活方式的轉變?我們這樣評論著的信息時代已經變為曾經。如今,大數據時代成為炙手可熱的話題。筆者在這說明信息和數據,只是試圖首先說明信息、數據的關系和不同,也試圖說明,為什麽信息時代轉變為了大數據時代?大數據時代帶給了我們什麽?

 信息和數據的定義。維基百科解釋:信息,又稱資訊,是壹個高度概括抽象概念,是壹個發展中的動態範疇,是進行互相交換的內容和名稱,信息的界定沒有統壹的定義,但是信息具備客觀、動態、傳遞、***享、經濟等特性卻是大家的***識。數據:或稱資料,指描述事物的符號記錄,是可定義為意義的實體,它涉及到事物的存在形式。它是關於事件之壹組離散且客觀的事實描述,是構成信息和知識的原始材料。數據可分為模擬數據和數字數據兩大類。數據指計算機加工的?原料?,如圖形、聲音、文字、數、字符和符號等。從定義看來,數據是原始的處女地,需要耕耘。信息則是已經處理過的可以傳播的資訊。信息時代依賴於數據的爆發,只是當數據爆發到無法駕馭的狀態,大數據時代應運而生。這是否是《大數據時代》壹書所未曾闡述的背景材料?

 在《大數據時代》壹書中,大數據時代與小數據時代的區別:1、思維慣例。大數據時代區別與轉變就是,放棄對因果關系的渴求,而取而代之關註相關關系。也就是說只要知道?是什麽?,而不需要知道?為什麽?。作者語言絕對,卻反思其本質區別。數據的更多、更雜,導致應用主意只能盡量觀察,而不是傾其所有進行推理?這也是明智之舉2、使用用途。小數據停留在說明過去,大數據用驅動過去來預測未來。筆者認為數據的用途意在何為,與數據本身無關,而與數據的解讀者有關,而相關關系更有利於預測未來。3、結構。大數據更多的體現在海量非結構化數據本身與處理方法的整合。大數據更像是理論與現實齊頭並進,理論來創立處理非結構化數據的方法,處理結果與未來進行驗證。4、分析基礎。大數據是在互聯網背景下數據從量變到質變的過程。筆者認為,小數據時代也即是信息時代,是大數據時代的前提,大數據時代是升華和進化,本質是相輔相成,而並非相離互斥。

 數據未來的故事。數據的發展,給我們帶來什麽預期和啟示?銀行業天然有大數據的潛質。客戶數據、交易數據、管理數據等海量數據不斷增長,海量機遇和挑戰也隨之而來,適應變革,適者生存。我們可以有更廣闊的業務發展空間、可以有更精準的決策判斷能力、可以有更優秀的經營管理能力?可以這些都基於數據的收集、整理、駕馭、分析能力,基於脫穎而出的創新思維和執行。因此,建設?數據倉庫?,培養?數據思維?,養成?數據治理?,創造?數據融合?,實現?數據應用?才能擁抱?大數據?時代,從數據中攫取價值,笑看風雲變換,穩健贏取未來。

  讀《大數據時代》心得體會(三)

 這本書裏主要介紹的是大數據在現代商業運作上的應用,以及它對現代商業運作的影響。

 《大數據時代》這本書的結構框架遵從了學術性書籍的普遍方式。也既,從現象入手,繼而通過對現象的解剖提出對這壹現象的解釋。然後在通過解釋在對未來進行預測,並對未來可能出現的問題提出自己看法與對策。

 下面來重點介紹《大數據時代》這本書的主要內容。

 《大數據時代》開篇就講了Google通過人們在搜索引擎上搜索關鍵字留下的數據提前成功的預測了20XX年美國的H1N1的爆發地與傳播方向以及可能的潛在患者的事情。Google的預測比政府提前將近壹個月,相比之下政府只能夠在流感爆發壹兩個周之後才可以弄到相關的數據。同時Google的預測與政府數據的相關性高達97%,這也就意味著Google預測數據的置信區間為3%,這個數字遠遠小於傳統統計學上的常規置信區間5%!而這個數字就是大數據時代預測結果的相對準確性與事件的可預測性的最好證明!通過這壹事以及其他的案例,維克托提出了在大數據時代?樣本=總體?的思想。我們都知道當樣本無限趨近於總體的時候,通過計算得到的描述性數據將無限的趨近於事件本身的性質。而之前采取的?樣本<總體?的做法很大程度上無法做到更進壹步的描述事物,因為之前的時代數據的獲取與存儲處理本身有很大的難度只導致人們采取抽樣的方式來測量事物。而互聯網終端與計算機的出現使數據的獲取、存儲與處理難度大大降低,因而相對準確性更高的?樣本=總體?的測算方式將成為大數據時代的主流,同時大數據時代本身也是建立在大批量數據的存儲與處理的基礎之上的。

 接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現過的相應的文字語句掃描並儲存在詞庫中,所以無論需要翻譯什麽,只要有聯系Google詞庫就會出現翻譯,雖然有的時候的翻譯很無厘頭,但是大多數時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數據時代對準確性的追求並不是特別明顯,但是相反大數據時代是建立在大數據的基礎住上的,所以大數據時代追求的是全方位覆蓋的數字測度而不管其準確性到底有多高,因為大量的數據會湮埋少數有問題的數據所帶來的影響。同時大量的數據也會無限的逼近事物的原貌。

 之後,維克托又預測了壹個在大數據時代催生的重要職業?數據科學家,這是壹群數學家、統計學與編程家的綜合體,這壹群人將能夠從獲取的數據中得到任何他們想要的結果。換言之,只要數據充足我們的壹切外在的與內在的我們不想讓他人知道的東西都見會在這壹群家夥的面前展現得淋漓盡致。所以為了避免個人隱私在大數據時代被這壹群人利用,維克托建議將這壹群人分為兩部分,壹部分使用數據為商業部門服務,而另壹群人則負責審查這壹些人是否合法的獲得與應用數據,是否侵犯了個人隱私。

 無論如何,大數據時代將會到來,不管我們接受還是不接受!

 我覺得《大數據時代》這本書寫的很好,很值得壹讀。因為會給我們很多啟發,比如妳在相關的社交網站發表的言論或者照片都很有可能被?數據科學家?們利用,從而再將相關數據賣給各大網店。不過,事實就是我們將會成為被預測被引誘的對象。所以說,小心妳在網上留下的痕跡。

 我喜歡這本書是因為它給我展現了壹個新的世界。

  讀《大數據時代》心得體會(四)

 利用周末,壹口氣讀完了塗子沛的大作《大數據》。這本書很好看,行文如流水,引人入勝。書中,妳讀到的不是大數據技術,更多是與大數據相關的美國政治、經濟、社會和文化的演進。作為壹名信息化從業者,讀完全書,我深刻感受到了在信息化方面中國與美國的各自特色,也看到了我們與美國的差距。有幾個方面的體會,但窺壹斑基本能見全貌。

 壹是政府業務數據庫公開的廣度和深度。近年來,隨著我國信息公開工作的推進,各級政府都在通過政府門戶網站建設積極推進網上政務信息公開,但我們的信息公開,現階段還主要是政府的政策、法律法規、標準、公文通告、工作職責、辦事指南、工作動態、人事任免等行政事務性信息的公開。當然,實時的政府業務數據庫公開也已經取得很大進步。在中國政府門戶網,可以查詢壹些公益數據庫,如國家統計局的經濟統計數據、環保部數據中心提供的全國空氣、水文等數據,氣象總局提供的全國氣象數據,民航總局提供的全國航班信息等;訪問各個部委的網站,也能查到很多業務數據,如發改委的項目立項庫、工商局的企業信用庫、國土資源部的土地證庫、國家安監總局的煤礦安全預警信息庫、各類工程招標信息庫等等。這是壹個非常大的進步,也是這麽多年電子政務建設所取得的成效和價值!但是,政務業務數據庫中的很多數據目前還沒有實現公開,很多數據因為部門利益和?保密?等因素,還僅限於部門內部人員使用,沒有公開給公眾;已經公開的數據也僅限於壹部分基本信息和統計信息,更多數據還沒有被公開。從《大數據》壹書中記錄的美國數據公開的實踐來看,美國在數據公開的廣度和深度都比較大。美國人認為?用納稅人的錢收集的數據應該免費提供給納稅人使用?,盡管美國政府事實上對數據的公開也有抵觸,但民願不可違,美國政府的業務數據越來越公開,尤其是在奧巴馬政府簽署《透明和開放的政府》文件後,開放力度更加大。DATA.GOV是美國聯盟政府新建設的統壹的數據開放門戶網站,網站按照原始數據、地理數據和數據應用工具來組織開放的各類數據,累積開放378529個原始和地理數據集。在中國尚沒有這樣的數據開放的網站。另外,由於制度的不同,美國業務信息公開的深度也很大,例如,網上公布的美國總統?白宮訪客記錄?公布的甚至是造訪白宮的各類人員的相關信息;美國的FedSpending網站,能夠逐條跟蹤、記錄、分析聯邦政府每壹筆財政支出。這在中國,目前應該還沒有實現。

 二是對政府對業務數據的分析。目前,中國各級政府網站所提供的業務數據基本上還是數據表,部分網站能提供壹些統計圖,但很少能實現數據的跨部門聯機分析、數據關聯分析。這主要是由於以往中國政務信息化的建設還處於部門建設階段。美國在這方面的步伐要快壹些,美國的DATA.GOV網站,不僅提供原始數據和地理數據,還提供很多數據工具,這些工具很多都是公眾、公益組織和壹些商業機構提供的,這些應用為數據處理、聯機分析、基於社交網絡的關聯分析等方面提供手段。如DATA.GOV上提供的白宮訪客搜索工具,可以搜尋到訪客信息,並將白宮訪客與其他微博、社交網站等進行關聯,提高訪客的透明度。

 三是關於個人數據的隱私。在美國,公民的隱私和自有不可侵犯,美國沒有個人身份證,也不能建立基於個人身份證號碼的個人信息的關聯,建立?中央數據銀行?的提案也壹再被否決。這壹點,在中國不是問題,每個公民有唯壹的身份信息,通過身份證信息,可以獲取公民的基本信息。今後,隨著國家人口基礎數據庫等基礎資源庫的建設,公民的社保、醫療等其他相關信息也能方便獲取,當然信息還是限於政府部門使用,但很難完全保證整合起來的這些個人信息不被泄露或者利用。

 數據是信息化建設的基礎,兩個大國在大數據領域的互相學習和借鑒,取長補短,將推進世界進入信息時代。我欣喜地看到,美國政府20XX年啟動了?大數據研發計劃?,投資2億美元,推動大數據提取、存儲、分析、***享、可視化等領域的研究,並將其與超級計算和互聯網投資相提並論。同年,中國政府20XX年也批復了?十二五國家政務信息化建設工程規劃?,總投資額估計在幾百億,專門有人口、法人、空間、宏觀經濟和文化等五大資源庫的五大建設工程。開放、***享和智能的大數據的時代已經來臨!

  我精心推薦

  • 上一篇:gtk拖放打開文件 在下想用Gtk實現類似於vc編程裏的WM_DROPFILES功能,請G
  • 下一篇:如何計算用戶走路步數和跑步距離
  • copyright 2024編程學習大全網