首页 > 其他 > 详细

scikit-learn学习

时间:2015-03-25 13:31:58      阅读:314      评论:0      收藏:0      [点我收藏+]
载入数据

在scikit-learn之中,可以使用库中固有的数据,如著名的花朵数据。载入方式如下:

from sklearn import datasets #引入scikit-learn中的数据集
iris = datasets.load_iris() #载入花朵数据

如果想要导入自己的数据的话,可以利用numpy协助。假如你要导入的数据是M行N列。

import numpy as np

f = open("filename.txt")#填入文件路径

f.readline()  # skip the header会自动跳过表头

data = np.loadtxt(f)#得到纯矩阵

X = data[:, 1:]  # select columns 1 through end对矩阵之中的数据进行选择

Y= data[:, 0]   # select column 0, the stock price同上

数据如果是libsvm格式的话,可以这么做

from sklearn.datasets import load_svmlight_file
X_train, y_train = load_svmlight_file("/path/to/train_dataset.txt")#注意路径的正确性
X_train.todense()#将稀疏矩阵转化为完整特征矩阵

scikit-learn学习

原文:http://www.cnblogs.com/chengxuyuanxiaowang/p/4365214.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!