當前位置:編程學習大全網 - 編程語言 - 讓妳掛掉數據科學家面試的4宗罪

讓妳掛掉數據科學家面試的4宗罪

讓妳掛掉數據科學家面試的4宗罪

數據科學家”可能是本世紀最性感的工作。但雇用壹個數據科學家卻不是如此。

對於立誌在數據科學領域有壹定作為的新手來說,“數據科學家”可不僅僅是壹個光彩照人的代名詞。

新手需要不斷的學習,才能成長為壹名具有創造力的數據科學家。

另外,作為小白的妳可能急切想得到壹份數據科學的職位。

但妳在面試的時候,面試官讓妳“掛掉”的原因可能有數百種。

總的來說,可以分為四種。為了更好的理解這四項失誤,文摘菌將此類比狙擊手的訓練。

讓我們開始吧......那麽,讓數據科學家面試失敗被拒的4宗罪是什麽?

用機器學習流行語來修飾妳的簡歷

與任何工作壹樣,用行業術語來刻畫個人簡歷可能會很吸引人的。數據科學領域也不乏各種流行用語。也許這種表面功夫可能能提高妳的簡歷通過人力資源自動揀選的機會,但往往更可能會事與願違。

很多時候,簡歷上聲稱的高級分析技能實際上只是會用excel數據透視表、SQL查詢或Google分析。就算不管因此而在面試上浪費掉的時間,這種拙劣的策略也會導致求職者徹底失敗或者喪失信心。

對於壹個有抱負的狙擊手來說,這種行為無異於光說不做,穿著軍服拿著槍,卻不去訓練自己成為壹名士兵。盡管這聽起來很荒謬,但是做壹只披著狼皮的羊壹點意思也沒有。

建模少而只顧程序庫調用

許多求職者都聲稱他們如何熟悉建模,但實際上他們都只是在努力解釋模型函數的調用和參數。其實在問到諸如某項技術是做什麽的之前,比如Random Forest,還有壹個更重要的問題就是為什麽妳會首先選擇它。

說實在的,壹個模型是可以通過單行庫調用來運行。但是,機器學習絕不僅僅是這樣。比如說,人們需要明白什麽情況下邏輯回歸比SVM更合適。又或者,什麽時候簡單的外推法會比ARIMA或Holt-Winters等預測技術更強大。

壹個好的狙擊手需要做的不僅僅是瞄準和射擊。其實,射擊訓練只占狙擊學校課程的20%。真正的狙擊手需要其他細節技能,比如耐心、紀律和好的觀察評估目標距離的能力。

缺乏數據分析必不可少的基礎知識

盡管對機器學習技術的直觀理解可以成為求職者的強項,但他們往往在這方面反而做得不足。他們常常忽視投入實踐培訓以掌握更多基礎技能,如統計和探索性數據分析。

建模僅占整個數據分析生命周期的壹小部分。在任何成功的機器學習(ML)項目中,超過50%的時間都是花在準備數據,討論和尋找方法上。還有大約25%的時間花在之後的模型解釋和建議上。

即使求職者都標榜他們的分析項目有90%的準確率,但是如果妳看到他們在解釋p值(當原假設為真時所得到的樣本觀察結果或更極端結果出現的概率)是什麽,和為什麽模型需要置信區間時那種越說越沒自信的表情,妳就會覺得這對他們來說簡直是壹場悲劇。

就像狙擊手首先需要成為壹名偉大的步兵壹樣,牢牢掌握基礎知識在所有學科中都是至關重要的。如果壹個人在戰鬥中不會修槍或是開槍走火的話,那麽他槍法再好又有什麽用?

不懂應用分析技術來解決業務問題

顯然要在我們剛才討論過的各方面都做到很好已經是壹項艱巨的任務。但是我們還沒講到整個鏈條中的關鍵環節,而這正是大多數面試沒有了下文的原因。

數據科學家的最終使命是解決業務問題,而不僅僅是分析數據或建立壹個偉大的模型,這是數據分析的終極目標。人們需要在用分析工具處理任何數據之前就界定好正確的業務問題,並制定解決問題的壹系列步驟。

當求職者被問及企業如何解決客戶流失問題時,如果他急於用數據分析來解釋,或者更有甚者,單靠模型名稱來胡亂預測客戶流失,那麽面試就沒法繼續下去了。較好的方式是從探討客戶註冊的原因以及客戶的期望和影響業務的核心因素是什麽開始。

這就好比壹個專家級別的狙擊手無所不知,但卻不能隱蔽自己或找到真正需要除掉的目標。這樣的人真的很危險,因為豬隊友比神對手更具風險性。

總結:對數據科學的追求

讓妳掛掉數據科學家面試的4宗罪

總之,我們對數據科學的追求必須有壹定的規則:

通過問題重構和壹系列步驟推演來應對挑戰,解決業務問題;

把基礎知識技能應用於統計學和探索性數據分析中,以獲得數據感並代分析方法;

選擇壹系列分析技術或機器學習模型,然後為業務用戶處理和解釋分析結果;

並通過正確定位自己的專業知識來展現這些技能,這是數據科學家所必備的。

好吧,願妳能消除這些缺陷,並在數據分析職場中獲得壹席之地!

  • 上一篇:四川本科理科調檔線
  • 下一篇:簡述個人職業生涯發展規劃範文
  • copyright 2024編程學習大全網