首页 > 其他 > 详细

pandas学习

时间:2017-05-11 18:09:00      阅读:326      评论:0      收藏:0      [点我收藏+]

1.读入数据

#-*- coding:utf-8 -*-
import numpy as np
import pandas as pd
df_data = pd.read_csv(filename,sep=\t,header=False,names=[distance,pid,time,fee])
#http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_csv.html

2.ix

df_data.ix[df_data[carpool]==1,discount] = 1-df_data[discount_fee]/df_data[total_fee]

df_sofa[‘start_gird‘] = df_sofa[[‘start_lat‘,‘start_lng‘]].apply(lambda x:get_HexCellKey(x[0],x[1]),axis=1)

3.DataFrame

time_split = pd.DataFrame((x.split( ) for x in data.bubble_time),index=data.index,columns=[day,h])

4.cut

bins_p = [0, 30, 40, 60, 80, 400]
group_names_p = [10, 30, 40, 60, 80]
data[price] = pd.cut(data[total_fee], bins_p, labels=group_names_p)

5.sort_values

data=data.sort_values(by=[pid,time],ascending=True)

pandas学习

原文:http://www.cnblogs.com/rongxxx/p/6842035.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!