DataFrame的缺失数据判断和处理(2)

 时间:2024-09-22 04:18:01

Python是目前最流行最简单用途最广泛的编程语言,大数据时代最应拉悟有仍该学习的一门编程语言。其中,数据分析的库p锾攒揉敫andas是Python最经典的库之一。现在我们看一下DataFrame的缺失值如何判断和处理。

工具/原料

python

anaconda,spyder

DataFrame,Series

方法/步骤

1、前提:加载numpy、pandas、和Series,DataFrame。生成一个含有缺失值的DataFrame(8*4),命名为df1,如图

DataFrame的缺失数据判断和处理(2)

DataFrame的缺失数据判断和处理(2)

2、使用thresh参数过滤缺失值。df1.dropna(thresh=3)表示至少有3个不是缺失值,df1.dropna(thresh=4)表示至少有4个不是缺失值,如图所示

DataFrame的缺失数据判断和处理(2)

3、使用fillna方法替换缺失值。df1.fillna(0)表示将所有的缺失值替换为常数0;df1饱终柯肢.fillna({'b':1,'c':2,'d'稆糨孝汶;:3})表示将‘b’列缺失值替换为1,‘c’列缺失值替换为2,‘d’列缺失值替换为3,(字典可以根据key确定哪一列填充),如图

DataFrame的缺失数据判断和处理(2)

4、使用method方法进行插值。df1.fillna(method='bfill'拘七呷憎)表示对缺失值进行后向填充,df1.fillna(method='bfill媪青怍牙',limit=2)表示对缺失值进行后向填充,同时至多填充2行,如图所示

DataFrame的缺失数据判断和处理(2)

5、除了填充常数,及填充前后数据,其实还可以填充均值或者最大值等描述性统计。df1.fillna(df1.mean())和df1.fillna(df1.max())分别表示填充每列的均值和最大值,如图

DataFrame的缺失数据判断和处理(2)

6、如果需要把原来的DataFrame缺失值直接替换掉(修改了原DataFrame),那么需要使用参数inplace=True即可,如图

DataFrame的缺失数据判断和处理(2)

研一新生如何快速发论文 PPT演示文档如何插入V形箭头 怎么完成一篇论文 word大纲级别怎么设置? 采购管理流程图怎么制作
热门搜索
上海世博会图片 骂人图片带字 海市蜃楼的图片 豆瓣电影评分排行 什么是灰指甲图片