首页 > 编程语言 > 详细

python自动化办公系列03_单个以及批量处理excel文件

时间:2020-05-29 21:53:17      阅读:48      评论:0      收藏:0      [点我收藏+]

先贴上数据集,

链接:https://pan.baidu.com/s/1ttv7NwbRmfVPcj2iBHTAfg
提取码:zg5v

下面是关于如何计算每个销售额以及总销售的代码。

import os
import pandas as pd

os.chdir("C:\\Users\\yuyuk\\data science\\data analysis and description\\py_excel")
name= "专项户外运动装备&冰爪.xlsx"
df = pd.read_excel(name)
df.head()
df["销售额"] = df["转化率"] * df["访客数"] * df["客单价"]
df_sum = df.groupby("品牌")["销售额"].sum().reset_index()
df["行业"] = name.replace(".xlsx","")

不同的单个excel计算销售额,只需要将name名字换下就好。
-------------------------------------------------------------------------------------
以下是计算所有表,总的销售额。
import os 
import pandas as pd
import time

start_time = time.time()
result = pd.DataFrame()

#循环遍历表格结果
for name in os.listdir():
    df = pd.read_excel(name)
    df["销售额"] = df["访客数"] * df["转化率"] * df["客单价"]
    df_sum = df.groupby("品牌")["销售额"].sum().reset_index()
    df_sum["行业"] = name.replace(".xlsx","")
    result = pd.concat([resutl,df_sum])
    
final = result.groupby("品牌")["销售额"].sum().reset_index().sort_values("销售额",ascending=False)
pd.set_option("display.float_format",lambda x: "%.2f" %x)
print(df_sum.head())
df_sum.describe()

end_time = time.time()
during_time = end_time - start_time
print(during_time)

 

python自动化办公系列03_单个以及批量处理excel文件

原文:https://www.cnblogs.com/yuyukun/p/12989537.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!