當前位置:編程學習大全網 - 編程語言 - 數據編程語言有哪些?

數據編程語言有哪些?

1、Python語言

如果妳的數據科學家不使用R,他們可能就會徹底了解Python。十多年來,Python在學術界當中壹直很流行,尤其是在自然語言處理(NLP)等領域。因而,如果妳有壹個需要NLP處理的項目,就會面臨數量多得讓人眼花繚亂的選擇,包括經典的NTLK、使用GenSim的主題建模,或者超快、準確的spaCy。同樣,說到神經網絡,Python同樣遊刃有余,有Theano和Tensorflow;隨後還有面向機器學習的scikit-learn,以及面向數據分析的NumPy和Pandas。

還有Juypter/iPython――這種基於Web的筆記本服務器框架讓妳可以使用壹種可***享的日誌格式,將代碼、圖形以及幾乎任何對象混合起來。這壹直是Python的殺手級功能之壹,不過這年頭,這個概念證明大有用途,以至於出現在了奉行讀取-讀取-輸出-循環(REPL)概念的幾乎所有語言上,包括Scala和R。

Python往往在大數據處理框架中得到支持,但與此同時,它往往又不是“壹等公民”。比如說,Spark中的新功能幾乎總是出現在Scala/Java綁定的首位,可能需要用PySpark編寫面向那些更新版的幾個次要版本(對Spark Streaming/MLLib方面的開發工具而言尤為如此)。

與R相反,Python是壹種傳統的面向對象語言,所以大多數開發人員用起來會相當得心應手,而初次接觸R或Scala會讓人心生畏懼。壹個小問題就是妳的代碼中需要留出正確的空白處。這將人員分成兩大陣營,壹派覺得“這非常有助於確保可讀性”,另壹派則認為,我們應該不需要就因為壹行代碼有個字符不在適當的位置,就要迫使解釋器讓程序運行起來。

2、R語言

? 在過去的幾年時間中,R語言已經成為了數據科學的寵兒——數據科學現在不僅僅在書呆子壹樣的統計學家中人盡皆知,而且也為華爾街交易員,生物學家,和矽谷開發者所家喻戶曉。各種行業的公司,例如Google,Facebook,美國銀行,以及紐約時報都使用R語言,R語言正在商業用途上持續蔓延和擴散。

R語言有著簡單而明顯的吸引力。使用R語言,只需要短短的幾行代碼,妳就可以在復雜的數據集中篩選,通過先進的建模函數處理數據,以及創建平整的圖形來代表數字。它被比喻為是Excel的壹個極度活躍版本。

R語言最偉大的資本是已圍繞它開發的充滿活力的生態系統:R語言社區總是在不斷地添加新的軟件包和功能到它已經相當豐富的功能集中。據估計,超過200萬的人使用R語言,並且最近的壹次投票表明,R語言是迄今為止在科學數據中最流行的語言,被61%的受訪者使用(其次是Python,39%)。

3、JAVA

? Java,以及基於Java的框架,被發現儼然成為了矽谷最大的那些高科技公司的骨骼支架。 “如果妳去看Twitter,LinkedIn和Facebook,那麽妳會發現,Java是它們所有數據工程基礎設施的基礎語言,”Driscoll說。

Java不能提供R和Python同樣質量的可視化,並且它並非統計建模的最佳選擇。但是,如果妳移動到過去的原型制作並需要建立大型系統,那麽Java往往是妳的最佳選擇。

4、Hadoop和Hive

壹群基於Java的工具被開發出來以滿足數據處理的巨大需求。Hadoop作為首選的基於Java的框架用於批處理數據已經點燃了大家的熱情。Hadoop比其他壹些處理工具慢,但它出奇的準確,因此被廣泛用於後端分析。它和Hive——壹個基於查詢並且運行在頂部的框架可以很好地結對工作。

  • 上一篇:初中物理興趣小組活動記錄怎麽寫
  • 下一篇:以前馳名的保定八大廠都是哪幾個廠?這幾個廠現在的情況如何?
  • copyright 2024編程學習大全網