當前位置:編程學習大全網 - 遊戲軟體 - 假期新手練習Ph

假期新手練習Ph

適合新手練習的項目Python機器學習練完妳就牛了!

Python機器學習

再多的理論也不能代替動手實踐。

教科書和課程會讓妳誤以為精通,因為材料就在妳面前。

但當妳嘗試去應用它時,可能會發現它比看起來更難。而

「項目」可幫助妳快速提高應用的ML技能,同時讓妳有

機會探索有趣的主題。

此外,妳可以將項目添加到妳的投資組合中,從而更輕松

地找到工作,找到很酷的職業機會,甚至協商更高的薪水

1、機器學習角鬥士

我們親切地稱其為「機器學習角鬥士」,但它並不新鮮。

這是圍繞機器學習建立實用直覺的最快方法之壹。

目標是采用開箱即用的模型並將其應用於不同的數據集。

這個項目很棒有3個主要原因:

首先,妳將建立模型與問題擬合的直覺。哪些模型對缺失

數據具有魯棒性?哪些模型可以很好地處理分類特征?是

的,妳可以翻閱教科書來尋找答案,但是通過實際操作您

會學得更好。

Python機器學習

其次,這個項目將教妳快速制作原型的寶貴技能。在現實

世界中,如果不簡單地嘗試它們,通常很難知道哪種模型

表現最好。

最後,本練習可以幫助妳掌握模型構建的工作流程。例如

,妳將開始練習……

清理數據

將其拆分為訓練/測試或交叉驗證集

預處理

轉型

特征工程

因為妳將使用開箱即用的模型,妳將有機會專註於磨練這

些關鍵步驟。

查看sk learn(Python) 或caret(R) 文檔頁面以獲取說明

。妳應該練習回歸、分類和聚類算法。

教程:

·Python:sklearn-sklearn包的官方教程

·使用Sci kit-Learn預測葡萄酒質量――訓練機器學習模

型的分步教程

Python機器學習

·R:caret-由caret包的作者提供的網絡研討會

數據源

·UCI機器學習存儲庫--350多個可搜索的數據集, 涵蓋

幾乎所有主題。您壹定會找到您感興趣的數據集。

·Kag gle數據集--Kag gle社區上傳的100多個數據集。

這裏有壹些非常有趣的數據集, 包括Pokemon Go產卵地

點和聖地亞哥的墨西哥卷餅。

·data.gov―-美國政府發布的開放數據集。如果您對社

會科學感興趣,可以去看看。

2、玩錢球

在《點球成金》壹書中,對於初學者來說,有很多有趣的

機器學習項目。例如,您可以嘗試…·

·體育博彩……根據每場新比賽前的可用數據預測盒子得

分。

·人才球探……使用大學統計數據來預測哪些球員將擁有

最好的職業生涯。

Python機器學習

·綜合管理......根據他們的優勢創建球員集群,以建立壹

個全面的團隊。

體育也是練習數據可視化和探索性分析的絕佳領域。妳可

以使用這些技能來幫助您決定要在分析中包含哪些類型的

數據。

數據源

·體育統計數據庫―-體育統計和歷史數據,涵蓋了許多

職業運動和壹些大學運動。幹凈的界面使網頁抓取更容易

·Sports Reference-另壹個體育統計數據庫。界面更雜

亂, 但可以將單個表格導出為CSV文件。

·cric sheet.org-國際和IPL板球比賽的逐球數據。提供

IPL和T 20國際比賽的CSV文件。

3、預測股票價格

對於任何對金融感興趣的數據科學家來說,股票市場就像是糖

果樂園。

首先,您有多種類型的數據可供選擇。您可以找到價格、基本

面、全球宏觀經濟指標、波動率指數等……不勝枚舉

其次,數據可能非常精細。您可以輕松獲取每家公司按天(甚

至按分鐘)的時間序列數據,從而讓您創造性地思考交易策略

Python機器學習

最後,金融市場通常具有較短的反饋周期。因此,您可以

快速驗證您對新數據的預測。

妳可以嘗試的壹些適合初學者的機器學習項目示例包括…

·量化價值投資……根據公司季度報告的基本面指標預測

6個月的價格走勢。

·預測……在隱含波動率和實際波動率之間的差值上構建

時間序列模型,甚至是循環神經網絡。

·統計套利……根據價格走勢和其他因素找到相似的股票

,並尋找價格出現分歧的時期。

明顯的免責聲明:建立交易模型來練習機器學習很簡單。

讓他們盈利是極其困難的。這裏沒有任何財務建議,我們

不建議交易真錢。

教程

·Python:sklearnforInvesting-將機器學習應用於投資

的YouTube視頻系列。

·R:Quantitative Trading with R-使用R進行量化金融

的詳細課堂筆記。

數據源

Python機器學習

·Quand l-提供免費(和優質) 金融和經濟數據的數據市

場。例如,您可以批量下載3000多家美國公司的日終股

票價格或美聯儲的經濟數據。

·Quanto pian-量化金融社區, 為開發交易算法提供免費

平臺。包括數據集。

·US Fundamentals Archive-5000多家美國公司的5年

基本面數據。

4、教神經網絡閱讀筆跡

神經網絡和深度學習是現代人工智能的兩個成功案例。它

們在圖像識別、自動文本生成甚至自動駕駛汽車方面取得

了重大進展。

要涉足這個令人興奮的領域,您應該從可管理的數據集開

始。

M NIST手寫數字分類挑戰賽是經典的切入點。圖像數據通

常比「平面」關系數據更難處理。M NIST數據對初學者很

友好,並且小到可以放在壹臺計算機上。

手寫識別會挑戰妳,但它不需要高計算能力

首先,我們建議使用下面教程中的第壹章。它將教妳如何

從頭開始構建神經網絡, 以高精度解決M NIST挑戰。

Python機器學習

教程

·神經網絡和深度學習(在線書籍)--第1章介紹了如何在

Python中從頭開始編寫神經網絡, 以對來自M NIST的數字進

行分類。作者還對神經網絡背後的直覺給出了很好的解釋。

數據源

·M NIST-M NIST是美國國家標準與技術研究院收集的兩個數

據集的修改子集。它包含70,000個帶標簽的手寫數字圖像

5、調查安然

學習項目示例

·異常檢測…...按小時繪制和接收電子郵件的分布圖,並嘗試檢

測導致公***醜聞的異常行為。

·社交網絡分析…在員工之間建立網絡圖模型以找到關鍵影響

者。

·自然語言處理……結合電子郵件元數據分析正文消息,以根據

電子郵件的目的對電子郵件進行分類。

數據源

·安然電子郵件數據集--這是由CMU托管的安然電子郵件存

檔。

·安然數據描述(PDF) -對安然電子郵件數據的探索性分析, 可

以幫助您獲得基礎。

  • 上一篇:南京南京完整版
  • 下一篇:怎樣把電腦桌面文件圖標改成自己想改的樣式?
  • copyright 2024編程學習大全網