當前位置:編程學習大全網 - 編程軟體 - 如何使用python和R高效而優雅地處理大數據

如何使用python和R高效而優雅地處理大數據

1、從分類上,兩種語言各有優勢:

(1)python的優勢不在於運行效率,而在於開發效率和高可維護性。在數據的載入和分發,python是很高效的;如果是求壹些常用的統計量和求壹些基本算法的結果,python也有現成的高效的庫;如果是純粹自己寫的算法,沒有任何其他可借鑒的,什麽庫也用不上,用純python寫是自討苦吃。

(2)R 主要是統計學家為解決數據分析領域問題而開發的語言,R 語言的優勢則是在於:

統計學家和幾乎覆蓋整個統計領域的前沿算法(3700+ 擴展包);開放的源代碼(free, in both senses),可以部署在任何操作系統,比如 Windows, Linux, Mac OS X, BSD, Unix強大的社區支持;高質量、廣泛的統計分析、數據挖掘平臺;重復性的分析工作(Sweave = R + LATEX),借助 R 語言的強大的分析能力 + LaTeX 完美的排版能力,可以自動生成分析報告;方便的擴展性,包括可通過相應接口連接數據庫,如 Oracle、DB2、MySQL、同 Python、Java、C、C++ 等語言進行互調,提供 API 接口均可以調用,比如 Google、Twitter、Weibo,其他統計軟件大部分均可調用 R,比如 SAS、SPSS、Statistica等,甚至壹些比較直接的商業應用,比如 Oracle R Enterprise, IBM Netezza, R add-on for Teradata, SAP HANA, Sybase RAP。

2、關於如何優雅地處理,則是壹項藝術家的工作,如果有看過TED演講的話,可以看到很多可視化的數據分析結果,這些都是非常cool的。

3、綜上所述,首先,要針對特定的問題分清楚問題的核心,和研究的方法;然後,挑選合適的工具,進行分析;最後,則是通過藝術家般的想象力,通過數據可視化表達清楚。

  • 上一篇:儀表盤顯示速度是什麽意思?
  • 下一篇:如何快速學好CNC真空吸盤夾具加工技術
  • copyright 2024編程學習大全網