Python数据分析-看了这篇文章，数据清洗你也就完全掌握了

发布时间：2019-09-12 06:25:11 所属栏目：教程来源：哗啦圈的梦

导读：副标题#e# 所有做数据分析的前提就是：你得有数据，而且已经经过清洗，整理成需要的格式。不管你从哪里获取了数据，你都需要认真仔细观察你的数据，对不合规的数据进行清理，虽然不是说一定要有这个步骤，但是这是一个好习惯，因为保不齐后面分析的时候发

12、使用“非”条件进行筛选

df_inner.loc[(df_inner[‘city’] != ‘beijing’), [‘id’,’city’,’age’,’category’,’gender’]].sort([‘id’])

13、对筛选后的数据按city列进行计数

df_inner.loc[(df_inner[‘city’] != ‘beijing’), [‘id’,’city’,’age’,’category’,’gender’]].sort([‘id’]).city.count()

14、使用query函数进行筛选

df_inner.query(‘city == [“beijing”, “shanghai”]’)

15、对筛选后的结果按prince进行求和

df_inner.query(‘city == [“beijing”, “shanghai”]’).price.sum()

数据排序

按照特定列的值排序：

df_inner.sort_values(by=[‘age’])

按照索引列排序：

df_inner.sort_index()

升序

df_inner.sort_values(by=[‘age’],ascending=True)

降序

df_inner.sort_values(by=[‘age’],ascending=False)

合并匹配：

merge

1.result = pd.merge(left, right, on='key') 
2.result = pd.merge(left, right, on=['key1', 'key2']) 
3.result = pd.merge(left, right, how='left', on=['key1', 'key2']) 
4.result = pd.merge(left, right, how='right', on=['key1', 'key2']) 
5.result = pd.merge(left, right, how='outer', on=['key1', 'key2'])

（编辑：西安站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

4/8

首页

尾页