Python数据分析—数据更新

在对海量数据进行分析的过程中,可能需要增加行和列,也可能会删除一些行和列。

今天介绍数据分析的第五课,教大家如何在python中对数据框进行一些更新操作

本文目录
  1. 在数据框最后追加一行

  2. 在数据框中插入一列

  3. 删除数据框中的行

  4. 删除数据框中的列

  5. 删除满足某种条件的行


注意:本文沿用数据分析一课Python数据分析—数据建立】里的数据框date_frame


 1   在数据框最后追加一行

假设要在原数据框中增加一行,可先定义该行对应的字典,具体语句如下:
new_row = {'ID':['1000009'],           'name':['唐诗诗'],           'gender':['女'],           'age':[21],           'height':[1.68]          }
注意:格式要和原数据框一致。
把新增行用append函数追加到原数据框中去,具体语句如下:
new_row1 = pd.DataFrame(new_row)  date_frame.append(new_row1)
得到结果如下:


 2   在数据框中插入一列
既然可以在数据框中加入行,那么也可以在数据框中加入列。可以用insert函数在数据框中任意位置加入一列。
比如我想在数据框的第一列插入新的列,可以在python中运行如下语句:
date_frame.insert(0, 'calss', ['class1','class1','class1','class1','class2','class2','class2','class2','class2'])
得到结果如下:

其中,.insert中的0表示新插入列所在的位置,'calss'表示新加列名称,['class1',...,'class2']表示新加列的内容,注意新加列要和原数据框的长度一致。

既然可以在数据框中加入行和列,那么也可以在数据框中删除行和列首先来看下在数据框中删除行。


 3   删除数据框中的行
可以用drop函数删除某一行,也可以删除多行。
首先来看下删除第一行的具体代码:
date_frame.drop([0])
得到结果如下:

.drop([0])表示删除索引号为0(第一行)的行。要删除其它行可以把0改成对应行的索引号。
接着来看下删除第一行和第五行的具体代码:
date_frame.drop([0,4])
得到结果如下:

.drop([0,4])表示删除索引号为0和4的行,实际代表第一行和第五行。
需删除更多的行,可以参照删除两行的代码。


 4   删除数据框中的列
同样可以用drop函数来删除列。先来看下删除name列的具体代码:
date_frame.drop(columns = 'name')date_frame.drop('name', axis = 1)  #axis = 1表示对列进行操作
得到结果如下:

如果想删除name列和gender列,可以输入如下代码:
date_frame.drop(columns = ['name','gender'])date_frame.drop(['name','gender'], axis = 1)
得到结果如下:

删除多列的代码,同样可以参照删除两列的代码。


 5   删除满足某种条件的行
假设要删除所有年龄大于18岁的记录,可以在python中输入如下语句:
date_frame.drop(index = (date_frame.loc[(date_frame.age>18)].index))
得到结果如下:

其中,.loc[(date_frame.age>18)].index表示取年龄大于18的索引。

至此,在python中对数据框进行更改操作已介绍完毕,大家可以动手练习一下,思考一下还可不可以对数据框进行别的操作

往期回顾:
3D星空图
3D星空图V2版
520表白代码合集
用python绘制皮卡丘

娱乐圈排行榜动态条形图绘制

扫一扫关注我

19967879837

投稿微信

请使用浏览器的分享功能分享到微信等