pandas (一)

打印 上一主题 下一主题

主题 553|帖子 553|积分 1659

1 Pandas序列Series

1.1 根据列表生成序列 Series
  1. X=[1,3,6,4,9];X
  2. weight=[67,66,83,68,70];weight
  3. sex=['女','男','男','女','男'];sex
  4. S1=pd.Series(X);S1
  5. S2=pd.Series(weight);S2
  6. S3=pd.Series(sex);S3
复制代码

1.2 序列合并concat
  1. pd.concat([S2,S3],axis=0) # 0维,附加到序列后面
  2. pd.concat([S2,S3],axis=1) # 1维,附加到新的一列
复制代码

1.3 序列切片
  1. S1[2]
  2. S3[1:4]
复制代码

2 Pandas数据框DataFrame

2.1 空数据框DataFrame
  1. pd.DataFrame()
复制代码
2.2 根据列表创建数据框columns index
  1. pd.DataFrame(X)
  2. # 创建一个列名为`weight`,索引为`A` `B` `C` `D` `E`的数据框
  3. pd.DataFrame(weight,columns=['weight'],index=['A','B','C','D','E'])
复制代码

2.3 根据字典创建数据框
  1. df1=pd.DataFrame({'S1':S1,'S2':S2,'S3':S3});df1
复制代码
  1. # 索引来自列表`X`
  2. df2=pd.DataFrame({'sex':sex,'weight':weight},index=X);df2
复制代码

2.4 增加数据框列
  1. df2['weight2']=df2['weight']**2;df2
复制代码

2.5 删除数据框列del
  1. del df2['weight2'];df2
复制代码

2.6 缺失值处理 isnull() isnull().sum() dropna()
  1. df3=pd.DataFrame({'S2':S2,'S3':S3},index=S1);df3
  2. df3.isnull() # 缺失值则返回 True,否则返回 False
复制代码
  1. df3.isnull().sum() # 返回每列中包含的缺失值个数
复制代码
  1. df3.dropna() # 直接删除含有缺失值的行,多变量谨慎使用 不改变df3
复制代码

2.7 数据框排序
  1. df3.sort_index() # 按index排序
  2. df3.sort_values(by='S3') # 按S3列值排序
复制代码


免责声明:如果侵犯了您的权益,请联系站长,我们会及时删除侵权内容,谢谢合作!

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
回复

使用道具 举报

0 个回复

正序浏览

快速回复

您需要登录后才可以回帖 登录 or 立即注册

本版积分规则

麻花痒

金牌会员
这个人很懒什么都没写!

标签云

快速回复 返回顶部 返回列表