pandas是基于numpy构建的,使得以Numpy为中心的应用变得更加简单方便。
一、关于pandas的安装
安装pandas必须首先安装numpy库,然后使用pip可以直接安装 pandas, pip install pandas。
二、pandas数据结构介绍
2.1、Series
pandas的基本数据结构是Series和DataFrame。Series也就是序列,是一种类似一维数组的对象以及一组与之相关的数据标签(index)组成。数据形式为:索引在左,值在右边,如果没有指定index,默认为0到n-1。
例子:
1.使用默认index
import pandas as pd a=pd.Series([1,2,3])
结果:
0    1
1    2
2    3
2.创建带有index的Series
b=pd.Series([3,2,4],index=[‘a‘,‘b‘,‘c‘]) print(b)
结果:
a    3
b    2
c    4
dtype: int64
2.2、DataFrame
DataFrame是一个表格型数据结构,类似二维数组,相当于多个带有同样index的Series组合,每个Series带有唯一表头,用来标识不同的Series
c=pd.DataFrame([[1,2,3],[4,5,6]],columns=[‘a‘,‘b‘,‘c‘]) print(c)
   a  b  c
0  1  2  3
1  4  5  6
三、pandas读写数据
3.1、pandas提供了一些用于将表格数据读取为DataFrame对象的函数,本人最常用的是读取exel文件,但默认的pandas不能直接读写excel,所以首先需要安装读,写(xlrd,xlwt)库才可以实现excel的读写。安装方式:pip install xlrd
pip install xlwt
3.2、pandas写数据
pandas提供了to_csv的方式
原文:http://www.cnblogs.com/qianboping/p/6266067.html