當前位置:編程學習大全網 - 編程語言 - 大數據工程師是做什麽的?

大數據工程師是做什麽的?

大數據工程師是做什麽的?需要哪些能力?

大數據是目前非常時髦的技術名詞,同時也自然催生了壹些與大數據處理相關的職業,通過對數據的挖掘和分析來影響企業的經營決策。

這群人在國外被稱為數據科學家。這個頭銜最早是由D.J.Pati和Jeff Hammerbacher在2008年提出的,他們後來分別成為LinkedIn和臉書數據科學團隊的負責人。目前,數據科學家這壹職位在美國的電信、零售、金融、制造、物流、醫療、教育等傳統行業也開始創造價值。

但是在中國,大數據的應用剛剛萌芽,人才市場還沒有那麽成熟。“很難指望壹個多面手完成整個鏈條中的所有環節。更多的公司會根據自己現有的資源和短板,招聘能夠補充現有團隊的人才。”領英中國區商業分析與戰略總監王玉瑤告訴《第壹財經周刊》。

所以每個公司對大數據工作的要求都不壹樣:有的強調數據庫編程,有的突出應用數學和統計學知識,有的要求有咨詢公司或投行的相關經驗,有的希望找到懂產品、懂市場的應用型人才。正因為如此,很多公司會根據業務類型和團隊分工,給這些處理大數據的人壹些新的稱謂和定義:數據挖掘工程師、大數據專家、數據研究員、用戶分析專家等。是國內公司經常出現的頭銜,我們統稱為“大數據工程師”。

王玉瑤認為,在壹個成熟的數據驅動型公司,“大數據工程師”往往是壹個團隊,意味著從數據收集、展示、分析和商業洞察到市場轉化的全過程。這個團隊可能包括數據工程師、分析師、產品專家、營銷專家和業務決策者。* * *是支持企業進行經營決策和商業模式探索的重要群體。

因為國內的大數據工作還處於壹個待開發的階段,能從中提取多少價值,完全取決於工程師的個人能力。壹直在這個行業的專家給出了人才需求的大致框架,包括計算機編碼能力,數學,統計背景。當然,如果妳能對壹些具體領域或行業有更深入的了解,對他們快速判斷和把握關鍵因素會更有幫助。

雖然對於壹些大公司來說,碩士學歷的公司人是更好的選擇,但阿裏巴巴集團研究員薛強調,學歷並不是最重要的因素,有大規模數據處理經驗和對數據海洋尋寶的好奇心更適合這份工作。

此外,壹個優秀的大數據工程師應該具備壹定的邏輯分析能力,能夠快速定位壹個業務問題的關鍵屬性和決定因素。“他需要知道哪些是相關的,哪些是重要的,什麽樣的數據最有價值,以及如何快速找到每個業務的核心需求。”聯合國百度大數據聯合實驗室數據科學家沈誌勇說。學習能力可以幫助大數據工程師快速適應不同的項目,在短時間內成為該領域的數據專家;溝通能力可以讓他們的工作順利進行,因為大數據工程師的工作主要分為兩種方式:由市場部門驅動和由數據分析部門驅動。前者需要經常從產品經理那裏了解開發需求,後者需要找到運營部門了解數據模型的實際轉換。

妳可以把這些要求作為成為大數據工程師的方向,因為在萬寶瑞華管理合夥人嚴麗萍看來,這是壹個很大的人才缺口。目前國內大數據應用多集中在互聯網領域,超過56%的企業準備開展大數據研究。“未來五年,94%的公司將需要數據科學家。”嚴麗萍說。所以她也建議壹些原來從事數據相關工作的公司可以考慮轉型。

本期《第壹財經日報》采訪了國內三家互聯網公司、BAT,以及相關領域的人力資源專家。他們從職場的角度闡述了如何成為壹名大數據工程師,以及這類職位的職場地位。

a大數據工程師是做什麽的?

用阿裏巴巴集團研究員薛的話說,大數據工程師就是壹群“玩數據”的人,發揮數據的商業價值,把數據轉化為生產力。大數據和傳統數據最大的區別在於,它是在線的、實時的、規模海量的、形式不規則的,沒有規律可循,所以“玩”這些數據的人很重要。

沈誌勇認為,如果把大數據想象成壹座不斷積累的礦山,大數據工程師的工作就是,“第壹步是定位和提取信息所在的數據集,相當於探礦和采礦。第二步,把它變成可以直接判斷的信息,相當於熔煉。最後,應用程序將數據可視化。”

所以,分析歷史,預測未來,優化選擇,是大數據工程師玩數據最重要的三項任務。通過這三個工作方向,幫助企業做出更好的經營決策。

找出過去事件的特征

大數據工程師壹個很重要的工作就是通過分析數據,找出過往事件的特征。例如,騰訊的數據團隊正在建立壹個數據倉庫,整理公司所有網絡平臺上龐大且無規律的數據信息,並總結出可查詢的特征,以支持公司各種業務對數據的需求,包括廣告、遊戲開發和社交網絡。

找出過往事件的特征,可以幫助企業更好地了解消費者。通過分析用戶過去的行為軌跡,可以了解這個人,預測他的行為。“妳可以知道他是什麽樣的人,年齡,愛好,是否是互聯網付費用戶,喜歡玩什麽類型的遊戲,平時喜歡在網上做什麽。”騰訊雲計算有限公司北京R&D中心總經理鄭利峰告訴《第壹財經周刊》。接下來在業務層面,可以為各類人群推薦相關服務,比如手機遊戲,或者根據不同的特點和需求衍生出新的業務模式,比如微信的電影票業務。

預測未來可能發生的事情

通過引入關鍵因素,大數據工程師可以預測未來的消費趨勢。在阿裏媽媽的營銷平臺上,工程師們正試圖通過引入氣象數據來幫助淘寶賣家做生意。“比如今年夏天不熱,很有可能去年有些產品賣不出去,除了空調、電風扇、背心、泳衣等。,可能受其影響。然後我們會建立氣象數據和銷售數據的關系,找到與之相關的品類,提前預警賣家的周轉庫存。”薛對說道。

在百度,沈誌勇支持了“百度預測”部分產品的模型開發,試圖用大數據服務更廣泛的人群。已經上線的有世界杯預測、高考預測、景點預測等。以百度的景區預測為例,大數據工程師需要收集壹段時間內所有可能影響景區遊客流量的關鍵因素進行預測,並對全國各景區未來的擁堵情況進行排名——未來幾天是暢通、擁擠還是普遍擁擠?

找到最佳結果

根據不同企業的業務性質,大數據工程師可以通過數據分析達到不同的目的。

以騰訊為例,鄭利峰認為,最能體現大數據工程師工作的最簡單、最直接的例子就是AB測試,它幫助產品經理在A和b兩個備選方案中做出選擇,過去決策者只能憑經驗判斷,而現在大數據工程師可以通過大範圍的實時測試幫助營銷部門做出最終選擇——例如,以社交網絡產品為例 讓壹半用戶看界面A,另壹半用界面B,觀察統計壹段時間內的點擊率和轉化率。

作為壹個電商,阿裏巴巴希望通過大數據精準的人群定位,幫助賣家做更好的營銷。“我們期待的是,妳能找到這樣壹群人,他們比現有用戶對產品更感興趣。”薛對說道。淘寶的壹個例子是,某人參賣家原來推廣的目標人群是孕婦,但是工程師通過挖掘數據之間的相關性,發現針對孕婦的營銷轉化率更高。

b所需的能力

數學和統計學相關背景

就我們面試的BAT三大互聯網公司而言,對大數據工程師的要求都是統計學和數學的碩士或博士學歷。沈誌勇認為,缺乏理論背景的數據工作者更有可能進入壹個危險地帶)——技能——壹堆數字。根據不同的數據模型和算法,他們總能得到壹些結果,但如果妳不知道它代表了什麽,那就不是真正有意義的結果,很容易誤導妳。“只有具備壹定的理論知識,才能理解模型,復用模型,甚至創新模型來解決實際問題。”沈誌勇說。

計算機編碼能力

實際開發能力和大規模數據處理能力是作為壹名大數據工程師必備的壹些要素。“因為很多數據的價值都來自於挖掘的過程,妳得親自動手才能發現黃金的價值。”鄭利峰說。

例如,人們在社交網絡上生成的許多記錄都是非結構化數據。如何從這些毫無頭緒的文字、聲音、圖像甚至視頻中提取有意義的信息,需要大數據工程師自己去挖掘。即使在壹些團隊中,大數據工程師主要負責業務分析,但也要熟悉計算機處理大數據的方式。

特定應用領域或行業的知識。

在嚴麗萍看來,大數據工程師的角色離不開市場是非常重要的,因為大數據只有與特定領域的應用相結合,才能產生價值。因此,在壹個或多個垂直行業的經歷可以為應聘者積累行業的知識,對以後成為大數據工程師很有幫助,所以這也是應聘這個職位時比較有說服力的加分項。

“他不能只知道數據,還要有商業頭腦。他可以對壹些行業有壹定的了解,比如零售、醫藥、遊戲、旅遊,最好符合公司的業務方向。”在這方面,薛也給打了壹個比方。“以前我們說有些奢侈品店員勢利,壹看就知道買不起,但這群人就是熱衷,我們以為他們是這個行業的專家。再比如壹個懂醫療行業的人。在考慮醫保業務時,他不僅會和人民醫院病歷相關,還會考慮飲食數據,這些都是基於他對這個領域的了解。”

C大數據工程師的職業發展

如何成為大數據工程師

由於目前大數據人才短缺,公司很難招聘到合適的人才——既要受過高等教育,最好有大規模數據處理經驗。所以很多企業會往裏面挖。

今年8月,阿裏巴巴舉辦了大數據比賽,把天貓平臺上的數據拿出來,去掉敏感問題,放到雲計算平臺上,交給7000多個團隊進行比賽。比賽分為內部賽和外部賽。“這樣既激勵了內部員工,也發掘了外部人才,讓各個行業的大數據工程師脫穎而出。”

嚴麗萍建議,長期從事數據庫管理、挖掘、編程的人,包括傳統的量化分析師、Hadoop工程師,以及任何在工作中需要通過數據做出判斷和決策的管理者,比如某些領域的運營經理,都可以嘗試這個崗位,各個領域的人只要學會使用數據,也可以成為大數據工程師。

工資和待遇

作為IT界的“大熊貓”,大數據工程師的收入和待遇可以說達到了同類的頂尖。據嚴麗萍觀察,國內IT、通信、行業招聘10%與大數據相關,且比例還在上升。嚴麗萍說,“大數據時代的到來非常突然。國內發展勢頭激進,但人才非常有限。現在完全供不應求。”在美國,大數據工程師的平均年薪高達654.38美元+0.75萬。據了解,在國內頂尖的互聯網公司中,同級別大數據工程師的薪酬可能比其他崗位高出20%至30%,受到企業的高度重視。

職業發展道路

由於大數據人才少,大部分公司的數據部門壹般都是扁平化的層級模式,大致分為三個層次:數據分析師、高級研究員、部門總監。大公司可能會根據應用領域的維度劃分不同的團隊,而在小公司則需要身兼數職。壹些特別強調大數據戰略的互聯網公司會設立其他高層職位——比如阿裏巴巴的首席數據官。“這個崗位的大部分人都會向研究方向發展,成為重要的數據戰略人才。”嚴麗萍說。另壹方面,大數據工程師對業務和產品的理解並不比業務部門的員工少,所以也可以轉到產品部門或者市場部,甚至上升到公司的高層。

  • 上一篇:數控車上的刀具,有哪些,規格和種類劃分,
  • 下一篇:拱橋規劃
  • copyright 2024編程學習大全網