day4 pandas学习
%pip install openxyxl
找一个自己觉得有意思的文件。我找的是成绩单来玩。
这节学的比较耗时了,大概用了60分钟。
import pandas as pd
data2 =pd.read_csv(r'D:\python代码区\代码随想录挑战-调试区\python训练营\1_计算类专业分流学生成绩排名.csv')
#print(data)
#print(type(data))
#print(data.isnull())
#print(data.head(3))
data =pd.read_excel(r'D:\python代码区\代码随想录挑战-调试区\python训练营\1_计算类专业分流学生成绩排名.xlsx')
#print(data2)
#print("!!!!")
#相等的
#print(data.equals(data2))
#每个元素筛查是否相等
#print(data==data2)
#print(data.info())
#print(data.shape)
#print(data.columns)
#print(data.describe())
#print(data2['学分加权平均分'].median())
#print(data.dtypes)
#print(data.info())
#print(data['学分加权平均分'])
#print(data.isnull().sum())
#print(data.dtypes)
#print(data['学分加权平均分'].isnull().sum())
way=3
if way==1:print(type(data['学分加权平均分']))median_score=data['学分加权平均分'].median()#print(median_score)data['学分加权平均分'].fillna(median_score,inplace=True)
#print(data.isnull().sum())
#当然也可以采用众数替换。
if way==2:print(type(data['学分加权平均分']))mode_score=data['学分加权平均分'].mode()print("look:",type(mode_score))print(mode_score[0])data['学分加权平均分'].fillna(mode_score[0],inplace=True)
print(data.isnull().sum())
#print(type(data.isnull()))
#print(data.columns)
#print(data.dtypes)
print(type(data.columns))
c=data.columns.tolist()
print(type(c))
for i in c:if data[i].dtype !='object':if data[i].isnull().sum()>0:mean_val=data[i].mean()data[i].fillna(mean_val,inplace=True)
print(data.isnull().sum())
print(data.dtypes)
@浙大疏锦行
python训练营介绍