加入收藏 | 设为首页 | 会员中心 | 我要投稿 西安站长网 (https://www.029zz.com.cn/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 教程 > 正文

一文看懂怎么用Python做数据分析

发布时间:2019-06-27 07:35:37 所属栏目:教程 来源:程序员ACE
导读:副标题#e# 常遇到两类朋友。一类是会爬虫但不知道如何进一步做数据分析的,一类是平常用 Excel 做分析但不太会用 Python 分析的。如果和你很像,那下面这篇系统长文会很适合你,建议先收藏。 Excel 是数据分析中最常用的工具,本文通过 Python 与 excel 的

与数据分组相反的是对数值进行分列,Excel 中的数据目录下提供“分列”功能。在 python 中使用 split 函数实现分列。

一文看懂怎么用 Python 做数据分析

在数据表中 category 列中的数据包含有两个信息,前面的数字为类别 id,后面的字母为 size 值。中间以连字符进行连接。我们使用 split 函数对这个字段进行拆分,并将拆分后的数据表匹配回原数据表中。

  1. #对category字段的值依次进行分列,并创建数据表,索引值为df_inner的索引列,列名称为category和size 
  2. pd.DataFrame((x.split('-') for x in df_inner['category']),index=df_inner.index,columns=['category','size']) 
一文看懂怎么用 Python 做数据分析
  1. #将完成分列后的数据表与原df_inner数据表进行匹配 
  2. df_inner=pd.merge(df_inner,split,right_index=True, left_index=True) 
一文看懂怎么用 Python 做数据分析

05 数据提取

第五部分是数据提取,也是数据分析中最常见的一个工作。这部分主要使用三个函数,loc,iloc 和 ix,loc 函数按标签值进行提取,iloc 按位置进行提取,ix 可以同时按标签和位置进行提取。下面介绍每一种函数的使用方法。

按标签提取(loc)

Loc 函数按数据表的索引标签进行提取,下面的代码中提取了索引列为 3 的单条数据。

  1. #按索引提取单行的数值 
  2. df_inner.loc[3] 
  3. id 1004 
  4. date 2013-01-05 00:00:00 
  5. city shenzhen 
  6. category 110-C 
  7. age 32 
  8. price 5433 
  9. gender female 
  10. m-point 40 
  11. pay Y 
  12. group high 
  13. sign NaN 
  14. category_1 110 
  15. size C 
  16. Name: 3, dtype: object 

(编辑:西安站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

推荐文章
    热点阅读