當前位置:編程學習大全網 - 源碼下載 - API - Sklearn三大模型 - Transformer、Estimator、Pipeline

API - Sklearn三大模型 - Transformer、Estimator、Pipeline

sklearn.pipeline.Pipeline

在Sklearn當中有三大模型:Transformer 轉換器、Estimator 估計器、Pipeline 管道

Transformer有輸入有輸出,同時輸出可以放入Transformer或者Estimator 當中作為輸入。

y_predict 是估計器的輸出模型,估計器輸出無法再放入Transformer 或 Estimator當中再獲取另壹個輸出了。

將Transformer、Estimator 組合起來成為壹個大模型。

管道: 輸入→□→□→□→■→ 輸出

□:Transformer ; ■:Estimator ;

Transformer放在管道前幾個模型中,而Estimator 只能放到管道的最後壹個模型中。

結合:

04 回歸算法 - 最小二乘線性回歸案例

05 回歸算法 - 多項式擴展、管道Pipeline

頭文件引入Pipeline:

from sklearn.pipeline import Pipeline

其他需要引入的包:

Pipeline 的參數是壹個列表,列表中存放著每壹個模型的信息。

第0個模型名字: ss,告訴系統我要做 數據標準化

第1個模型名字: Poly,告訴系統我要做壹個 多項式擴展

PolynomialFeatures即進行了ss= StandardScaler()的操作,並做了3階的擴展

第2個模型名字: Linear,告訴系統進行 模型訓練

fit_intercept=False 表示截距為0

截距:y=ax+b, b是截距。壹般推薦使用fit_intercept=True。

如果輸入特征包含x1,x2,將特征放入多項式擴展的圖紙後,我們會得到壹個針對x1,x2擴展的特征集,並把數據輸出出來。因此在多項式擴展的算法中,存儲的特征集合將是擴展後的結果。

最後用壹張圖解釋fit、transfrom操作在管道和壹般模型訓練中的區別:

  • 上一篇:tcpdump是什麽意思.幹什麽用的.哪裏有詳細的資料,
  • 下一篇:c報告源代碼
  • copyright 2024編程學習大全網