SKlearn各个模块解释

 时间:2024-10-23 14:23:47

1、train_test_split:设置训练、测试数据集的数据量分配。功能:从样本中随机的按比例选取train data和test data。调用形式为:X_train, X_test, y_train, y_test = cross_validation.train_test_split(train_data, train_target, test_size=0.4, random_state=0)test_size是样本占比。如果是整数的话就是样本的数量。random_state是随机数的种子。不同的种子会造成不同的随机采样结果。相同的种子采样结果相同。fromsklearn.cross_validationimporttrain_test_split 在sklearn版本为0.18以上时,会报一下错误:需要把以上引用改为:from sklearn.model_selection import train_test_split即可。

SKlearn各个模块解释

2、如何创建分类器对象、用训练数据进行拟合分类器模型、用训练好的模型进行预测。>>>fromsklearn.svmimportSVC#导入svm的svc类(支持向量分类)>>>clf=SVC()#创建分类器对象>>>clf.fit(X,y)#用训练数据拟合分类器模型SVC(C=1.0,cache_size=200,class_weight=None,coef0=0.0,decision_function_shape=None,degree=3,gamma='auto',kernel='rbf',max_iter=-1,probability=False,random_state=None,shrinking=True,tol=0.001,verbose=False)>>>clf.predict([[-0.8,-1]])#用训练好的分类器去预测[-0.8,-1]数据的标签

  • Python编程:怎么使用time模块sleep()方法
  • 如何使用java打印出一个三角形
  • 解决python提示 No module named 'requests'
  • 利用python编程求解两个复数的和
  • VS2019如何更改文档默认选项
  • 热门搜索
    有关国庆节的手抄报 有关阅读的手抄报 环境手抄报 珍爱生命手抄报图片 唐山世园会手抄报 珍爱生命手抄报资料 童话手抄报内容 关于西游记的手抄报 国防手抄报 小学手抄报大全