應用級數據分析師通常需要掌握各種數據分析工具,把業務模型映射到數據分析工具上,從而得到數據分析的結果。數據分析工具比較多,比如Excel就是壹個傳統的數據分析工具,另外還有Minitab、LINGO、JMP等,要想全面掌握這些工具的使用需要具備壹定的數學基礎和統計學基礎。通常做BI的數據分析師還需要進壹步掌握數據庫的基礎知識,但是難度往往並不大。
研發級數據分析師就需要掌握編程知識了,在數據分析領域R、Python、C、MATLAB等語言都有廣泛的應用,目前通過Python等語言來完成數據分析也是壹個比較常見的做法。其實MATLAB也是壹個在數據分析領域占據重要位置的軟件(語言),MATLAB功能非常強大。
在大數據時代,通過機器學習的方式實現數據分析是壹個比較常見的方式,而Python語言則是壹個比較常見的選擇,壹方面Python語言簡單易學,另壹方面Python語言具備豐富的庫支持,比如Numpy、Scipy、Matplotlib、Sympy、pandas等都是比較常見的庫,這些庫的使用會極大的降低算法實現的難度。