摘要:通过简单例子,了解功能。以此作为基点,在工作中不断深入
1.设置需要显示的行列宽度(显示的最大列数和最大行数,其余部分用.....表示)
设置显示多少行多少列 import pandas as pd import numpy as np pd.set_option(‘max_columns‘,5,‘max_rows‘,5) df = pd.read_csv(‘20190708.csv‘) print(df) ‘‘‘ pd.set_option(‘max_columns‘,3,‘max_rows‘,3) Unnamed: 0 ... circ_mv 0 0 ... 142940.1406 ... ... ... ... 3608 3608 ... 466813.2600 [3609 rows x 19 columns] pd.set_option(‘max_columns‘,5,‘max_rows‘,5) Unnamed: 0 ts_code ... total_mv circ_mv 0 0 603639.SH ... 443175.0623 142940.1406 1 1 600130.SH ... 294144.0000 294144.0000 ... ... ... ... ... ... 3607 3607 600017.SH ... 947301.3975 947301.3975 3608 3608 601038.SH ... 774878.1000 466813.2600 [3609 rows x 19 columns] ‘‘‘
2.提取df索引,并对索引操作
import pandas as pd import numpy as np pd.set_option(‘max_columns‘,5,‘max_rows‘,5) df = pd.read_csv(‘20190708.csv‘) print(df) column_ = df.columns index_ = df.index data_ = df.values print(column_) print(index_) print(data_) print(type(column_)) ##<class ‘pandas.core.indexes.base.Index‘> print(type(column_.values)) ##class ‘numpy.ndarray‘ print(type(column_.tolist()))##<class ‘list‘>
说明:
1.列索引提取出来的数据类型都是Index对象<class ‘pandas.core.indexes.base.Index‘>
通过column_.values获得## <class ‘numpy.ndarray‘>数组类
通过column_.tolist()获得##<class ‘list‘> 列表类
2.行索引与列索引类似
3.访问索引内的值
print(column_.values[1]) ##ts_code同数组取值一样
print(index_.tolist()[1]) ## 1 同list取值一样
4.重命名行列索引
df.index = index_list ##新的行名列表直接赋值
df.columns = column_list
说明:局部行改名,可以先提取行索引,转化成列表,更改对应名称,之后执行df.index = index_list操作。
也可以通过df.rename(index=idx_rename,columns=col_rename),其中idx_rename、col_rename是字典{“旧名”:新名}
3.df取值的方式
3.1基于标签(索引).loc
3.2基于位置 (整数).iloc
原文:https://www.cnblogs.com/liuhuacai/p/12075134.html