首页 > 技术文章 > 玩一玩pandas--基础

bk9527 2020-02-23 20:40 原文

1. 要用到的几个基本模块

 import pandas as pd

    from pandas import Series

    from pandas import DataFrame

2. Series

    Series是一种类似于一维数组的对象,由下面两个部分组成:    

        values : 一组数据(ndarray类型);

        index : 相关的数据索引标签

  2.1 两种创建方式

    (1) 由列表或numpy数组创建(默认索引为0到N-1的整数型索引, 可重新修改)

        

        

 

    (2) 由字典创建:不能在使用index.但是依然存在默认索引

 

   

 

  2.2 Series的索引和切片

    可以使用中括号取单个索引(此时返回的是元素类型),或者中括号里一个列表取多个索引(此时返回的是一个Series类型)

    索引: 

    (1) 显示索引

        - 使用index中的元素作为索引值(即自己制定的index,为显示索引)

 

 

        - 使用s.loc[](推荐):注意,loc中括号中放置的一定是显示索引

  

   (2) 隐式索引

 

  - 使用整数作为索引值

- 使用 iloc[](推荐):注意,iloc中括号中放置的一定是隐式索引

  

 

 切片

 (1) 显示切片

 

   

 (2) 隐式切片

  

 

 

  2.3 给Series增加行

  

 

 

  2.4 Series的一些属性

  

  2.5 Series的常用方法

  (1) 读取前N个

  

 

 

   (2) 去重 (不改变原来的Series)

  

 

 3. DataFrame

 

 

 

 

 

 

 

 

 

 

 

  

 

推荐阅读