數據科學與大數據技術,強調交叉學科特點,以大數據分析為核心,以統計學、計算機科學和數學為三大基礎支撐性學科,培養面向多層次應用需求的復合型人才。
大數據開設課程
數學分析、高等代數、普通物理數學與信息科學概論、數據結構、數據科學導論、程序設計導論、程序設計實踐、離散數學、概率與統計、算法分析與設計、數據計算智能、數據庫系統概論、計算機系統基礎、並行體系結構與編程、非結構化大數據分析等。
大數據的學習階段第壹階段:大數據前沿知識及hadoop入門,大數據前言知識的介紹,課程的介紹,Linux和unbuntu系統基礎,hadoop的單機和偽分布模式的安裝配置。
第二階段:hadoop部署進階。Hadoop集群模式搭建,hadoop分布式文件系統HDFS深入剖析。使用HDFS提供的api進行HDFS文件操作。Mapreduce概念及思想。
第三階段:大數據導入與存儲。mysql數據庫基礎知識,hive的基本語法。hive的架構及設計原理。hive部署安裝與案例。sqoop安裝及使用。sqoop組件導入到hive。
第四階段:Hbase理論與實戰。Hbase簡介。安裝與配置。hbase的數據存儲。項目實戰。
第五階段:Spaer配置及使用場景。scala基本語法。spark介紹及發展歷史,spark stant a lone模式部署。sparkRDD詳解。
第六階段:spark大數據分析原理。spark內核,基本定義,spark任務調度。sparkstreaming實時流計算。sparkmllib機器學習。sparksql查詢。