Python中使用Shape函數來查看數據表的維度,即行數和列數。可以使用info函數查看數據表的整體信息,使用dtype函數返回數據格式。Lsnull是Python中檢查空值的函數。它可以檢查整個數據表或單行。返回的結構是壹個邏輯值,如果它包含空值,則返回true,如果不包含空值,則返回false。
第二,數據清洗
Python可以清理數據,Python中處理空值的方法比較靈活。Dropna函數可以用來刪除數據表中包含空值的數據,或者fillna函數可以用來填充空值。在Python中,dtype是查看數據格式的函數,對應的函數是astype,用於更改數據格式,Rename是更改列名的函數,drop_duplicates是刪除重復值的函數,replace是替換數據的函數。
第三,數據提取
提取數據時,主要使用三個函數:loc、iloc和ix。Loc函數按標簽提取,iloc按位置提取,ix可以同時按標簽和位置提取。除了按標簽和位置提取數據外,還可以根據具體條件提取,比如壹起使用loc和isin函數。
第四,數據篩選
Python數據分析也可以用於數據過濾。Python中用loc函數來完成篩選功能,Excel中的sumif和countif函數也可以用sum和count函數來實現。使用的主要函數有groupby和pivot _ tableGroupby是壹個分類匯總的函數,用法比較簡單。groupby根據列名出現的順序進行分組。