数据集为:
材料 刀具 能耗
金 菜刀 100
银 柴刀 98
铜 水果刀 74
金 铅笔刀 81
铜 菜刀 120
金 水果刀 99
import numpy as np import pandas as pd from sklearn.linear_model import LinearRegression from sklearn import preprocessing df = pd.read_csv(‘1.csv‘,encoding = ‘gbk‘) df
cailiao = pd.get_dummies(df[‘材料‘]) #对材料进行onehot编码 daoju = pd.get_dummies(df[‘刀具‘]) #对刀具进行onehot编码 onehot = pd.concat([cailiao,daoju], axis=1) #用连接函数将数据合并 df = onehot.iloc[:,0:7].join(df) #将onehot数据加入原数据集 df.drop([‘材料‘,‘刀具‘],axis=1,inplace=True) #删除掉材料刀具这两列数据 df #打印
原文:https://www.cnblogs.com/roscangjie/p/11233669.html