决策树
决策树
决策树是一种基本的分类与回归方法,是最经常使用的数据挖掘算法之一。
决策树模型呈树形结构,在分类问题中,表示基于特征对实例进行分类的过程。它可以认为是 if-else 规则的集合,也可以认为是定义在特征空间与类空间上的 条件概率分布。
决策树学习通常包括 3 个步骤:特征选择、决策树的生成和决策树的修剪。
决策树学习的损失函数通常是正则化的极大似然函数,决策树学习属于监督学习,可以认为是学习一个分类规则。
from sklearn.datasets import load_iris
from sklearn import tree
import numpy as np
iris = load_iris()
clf = tree.DecisionTreeClassifier(min_samples_leaf=15)
clf = clf.fit(iris.data, iris.target)
# 决策树模型为:先左后右,先上后下 负数表示没有
print("树结构-左节点:"+str(clf.tree_.children_left))
print("