首页 > 其他 > 详细

对无相关性的样本特征进行onehot编码

时间:2019-07-23 19:52:55      阅读:152      评论:0      收藏:0      [点我收藏+]

数据集为:

材料 刀具 能耗
金 菜刀 100
银 柴刀 98
铜 水果刀 74
金 铅笔刀 81
铜 菜刀 120
金 水果刀 99

 

import numpy as np
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn import preprocessing
df = pd.read_csv(1.csv,encoding = gbk)
df

技术分享图片

cailiao = pd.get_dummies(df[材料])   #对材料进行onehot编码
daoju = pd.get_dummies(df[刀具])     #对刀具进行onehot编码
onehot = pd.concat([cailiao,daoju], axis=1)    #用连接函数将数据合并
df = onehot.iloc[:,0:7].join(df)               #将onehot数据加入原数据集
df.drop([材料,刀具],axis=1,inplace=True)   #删除掉材料刀具这两列数据
df         #打印

技术分享图片

 

对无相关性的样本特征进行onehot编码

原文:https://www.cnblogs.com/roscangjie/p/11233669.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!