加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

Python数据分析-看了这篇文章,数据清洗你也就完全掌握了

发布时间:2019-09-12 06:25:11 所属栏目:教程 来源:哗啦圈的梦
导读:副标题#e# 所有做数据分析的前提就是:你得有数据,而且已经经过清洗,整理成需要的格式。 不管你从哪里获取了数据,你都需要认真仔细观察你的数据,对不合规的数据进行清理,虽然不是说一定要有这个步骤,但是这是一个好习惯,因为保不齐后面分析的时候发

12、使用“非”条件进行筛选

  1. df_inner.loc[(df_inner[‘city’] != ‘beijing’), [‘id’,’city’,’age’,’category’,’gender’]].sort([‘id’]) 

13、对筛选后的数据按city列进行计数

  1. df_inner.loc[(df_inner[‘city’] != ‘beijing’), [‘id’,’city’,’age’,’category’,’gender’]].sort([‘id’]).city.count() 

14、使用query函数进行筛选

  1. df_inner.query(‘city == [“beijing”, “shanghai”]’) 

15、对筛选后的结果按prince进行求和

  1. df_inner.query(‘city == [“beijing”, “shanghai”]’).price.sum() 

数据排序

按照特定列的值排序:

  1. df_inner.sort_values(by=[‘age’]) 

按照索引列排序:

  1. df_inner.sort_index() 

升序

  1. df_inner.sort_values(by=[‘age’],ascending=True) 

降序

  1. df_inner.sort_values(by=[‘age’],ascending=False) 

合并匹配:

merge

  1. 1.result = pd.merge(left, right, on='key') 
  2. 2.result = pd.merge(left, right, on=['key1', 'key2']) 
  3. 3.result = pd.merge(left, right, how='left', on=['key1', 'key2']) 
  4. 4.result = pd.merge(left, right, how='right', on=['key1', 'key2']) 
  5. 5.result = pd.merge(left, right, how='outer', on=['key1', 'key2']) 

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读