Python数据分析—数据排序

在对海量数据进行分析的过程中,可能需要对数据进行排序操作。

本节教大家如何在python中对数据框进行一些排序操作

本文目录
  1. 总结sort_values函数的用法

  2. 按年龄对行进行升序排列

  3. 按年龄对行进行降序排列

  4. 按年龄升序身高降序排列数据框

  5. 对列进行排序


注意:本文沿用数据分析一课Python数据分析—数据建立】里的数据框date_frame


 1   总结sort_values函数的用法

python中默认按行索引号进行排序,如果要自定义数据框的排序,可以用sort_values函数进行重定义排序。
下面对sort_values中几个常用的参数进行讲解,它的具体语法如下:
sort_values(by=[列表],ascending=[True or False], axis=(1 or 0))
其中by后面为要排序的列,可以是一列,也可以是多列。表示首先按第一列,再依次按后面的列进行排序。
ascending=True表示按升序排列,否则为降序排列,默认按升序排列。
axis=1表示对列排序,为0表示对行排序,默认对行排序。

 2   按年龄对行进行升序排列

若想按年龄升序排列数据框,可在python中输入如下语句:
date_frame.sort_values(by = ['age'])
得到结果如下:

其中by=['age']表示按年龄排序,默认是升序排列,所以不需要指定ascending的值。

 3   按年龄对行进行降序排列

若想按年龄降序排列数据框,可在python中输入如下语句:
date_frame.sort_values(by = ['age'], ascending = False)
得到结果如下:


 4   按年龄升序身高降序排列数据框
若想按年龄升序身高降序排列数据框,可在python中输入如下语句:
date_frame.sort_values(by = ['age','height'], ascending = [True,False])
得到结果如下:

ascending中的第一个True表示先对年龄进行升序排列,第二个False表示若年龄相同,再根据身高降序排列。


 5   对列进行排序
对列排序,第一种办法是重定义列的顺序进行排序。
假设列的顺序按学号、姓名、年龄、身高、性别进行排序,可以在python中输入如下语句:
date_frame[['ID','name','age','height','gender']]
得到结果如下:

第二种办法是利用axis=1对列进行排序,不过这种排序需要某一行的值是同种类型的,可以比较。
假设我抽取原数据框中的age和height列,具体语句如下:
date_frame[['age','height']]
得到结果如下:

对这两列按第三行的数值进行排序,具体语句如下:
date_frame[['age','height']].sort_values(by = [3], axis=1)
得到结果如下:

由于ascending参数没有指明,默认为升序,所以排序后height列排在age列的前面。

至此,在python中对数据框进行排序操作已介绍完毕,大家可以动手练习一下,思考一下还可不可以对数据框进行别的操作

往期回顾:
3D星空图
3D星空图V2版
520表白代码合集
用python绘制皮卡丘

娱乐圈排行榜动态条形图绘制

扫一扫关注我

19967879837

投稿微信

请使用浏览器的分享功能分享到微信等