行矩陣就是每壹行對應壹個RDD,矩陣的每壹行都是分布式存儲的,矩陣的每壹行都是壹個局部向量。這類似於多元統計的數據矩陣。由於每壹行都用壹個局部向量來表示,所以矩陣的列數被限制在壹個整數範圍內,但在實際應用中列數很少。
壹:創建行矩陣
新行矩陣(行:RDD[向量])
替代構造器,讓矩陣維數自動確定。
新的row matrix(rows:RDD[向量],nRows: Long,nCols: Int)
行存儲為RDD[向量]的行
nRows行數。非正值表示未知,然後是
行數將由RDD行中的記錄數決定。
列數。非正值表示未知,然後是數字
將由第壹行的大小決定。
用第壹種方法構造RowMatrix:
1.指南包:
scala & gtimport org . Apache . spark . ml lib . Lina LG . _
scala & gtimport org . Apache . spark . ml lib . Lina LG . distributed . _