加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-27 07:35:37 所属栏目:教程 来源:程序员ACE
导读:副标题#e# 常遇到两类朋友。一类是会爬虫但不知道如何进一步做数据分析的,一类是平常用 Excel 做分析但不太会用 Python 分析的。如果和你很像,那下面这篇系统长文会很适合你,建议先收藏。 Excel 是数据分析中最常用的工具,本文通过 Python 与 excel 的

在前面的代码后增加 price 字段以及 sum 函数,按筛选后的结果将 price 字段值进行求和,相当于 excel 中 sumifs 的功能。

  1. #对筛选后的数据按price字段进行求和 
  2. df_inner.loc[(df_inner['age'] > 25) | (df_inner['city'] == 'beijing'), 
  3. ['id','city','age','category','gender','price']].sort(['age']).price.sum() 
  4.   
  5. 19796  

使用“非”条件进行筛选,城市不等于 beijing。符合条件的数据有 4 条。将筛选结果按 id 列进行排序。

  1. #使用“非”条件进行筛选 
  2. df_inner.loc[(df_inner['city'] != 'beijing'), ['id','city','age','category','gender']].sort(['id']) 
一文看懂怎么用 Python 做数据分析

在前面的代码后面增加 city 列,并使用 count 函数进行计数。相当于 excel 中的 countifs 函数的功能。

  1. #对筛选后的数据按city列进行计数 
  2. df_inner.loc[(df_inner['city'] != 'beijing'), ['id','city','age','category','gender']].sort(['id']).city.count() 

还有一种筛选的方式是用 query 函数。下面是具体的代码和筛选结果。

  1. #使用query函数进行筛选 
  2. df_inner.query('city == ["beijing", "shanghai"]') 
一文看懂怎么用 Python 做数据分析

在前面的代码后增加 price 字段和 sum 函数。对筛选后的 price 字段进行求和,相当于 excel 中的 sumifs 函数的功能。

  1. #对筛选后的结果按price进行求和 
  2. df_inner.query('city == ["beijing", "shanghai"]').price.sum() 
  3. 12230 

这是第三篇,介绍第 7-9 部分的内容,数据汇总,数据统计,和数据输出。

一文看懂怎么用 Python 做数据分析

07 数据汇总

第七部分是对数据进行分类汇总,Excel 中使用分类汇总和数据透视可以按特定维度对数据进行汇总,python 中使用的主要函数是 groupby 和 pivot_table。下面分别介绍这两个函数的使用方法。

分类汇总

Excel 的数据目录下提供了“分类汇总”功能,可以按指定的字段和汇总方式对数据表进行汇总。Python 中通过 Groupby 函数完成相应的操作,并可以支持多级分类汇总。

一文看懂怎么用 Python 做数据分析

Groupby 是进行分类汇总的函数,使用方法很简单,制定要分组的列名称就可以,也可以同时制定多个列名称,groupby 按列名称出现的顺序进行分组。同时要制定分组后的汇总方式,常见的是计数和求和两种。

  1. #对所有列进行计数汇总 
  2. df_inner.groupby('city').count() 
一文看懂怎么用 Python 做数据分析

可以在 groupby 中设置列名称来对特定的列进行汇总。下面的代码中按城市对 id 字段进行汇总计数。

  1. #对特定的ID列进行计数汇总 
  2. df_inner.groupby('city')['id'].count() 
  3. city 
  4. beijing 2 
  5. guangzhou 1 
  6. shanghai 2 
  7. shenzhen 1 
  8. Name: id, dtype: int64 
  9.  
  10. Read more: http://bluewhale.cc/2017-04-21/use-python-for-data-analysis-like-excel-3.html#ixzz5rvDOLa9f 

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读