专栏名称: 算法爱好者
算法是程序员的内功!伯乐在线旗下账号「算法爱好者」专注分享算法相关文章、工具资源和算法题,帮程序员修炼内功。
目录
相关文章推荐
arXiv每日学术速递  ·  告别FPN局限!PLUSNet三模块协同:H ... ·  3 小时前  
arXiv每日学术速递  ·  告别FPN局限!PLUSNet三模块协同:H ... ·  3 小时前  
九章算法  ·  TikTok再获90天“续命期”!但内部传言 ... ·  昨天  
算法爱好者  ·  黄仁勋:AI 将创造更多就业机会 ·  4 天前  
罗文益  ·  算法推荐,就是今天普通人的风口 ·  2 天前  
罗文益  ·  算法推荐,就是今天普通人的风口 ·  2 天前  
51好读  ›  专栏  ›  算法爱好者

分类算法之决策树

算法爱好者  · 公众号  · 算法  · 2017-05-14 22:26

正文

请到「今天看啥」查看全文



3.1、摘要


在前面两篇文章中,分别介绍和讨论了 朴素贝叶斯分类 贝叶斯网络两种分类算法 。这两种算法都以贝叶斯定理为基础,可以对分类及决策问题进行概率推断。在这一篇文章中,将讨论另一种被广泛使用的分类算法——决策树(decision tree)。相比贝叶斯算法,决策树的优势在于构造过程不需要任何领域知识或参数设置,因此在实际应用中,对于探测式的知识发现,决策树更加适用。


3.2、决策树引导


通俗来说,决策树分类的思想类似于找对象。现想象一个女孩的母亲要给这个女孩介绍男朋友,于是有了下面的对话:


女儿:多大年纪了?

母亲:26。

女儿:长的帅不帅?

母亲:挺帅的。

女儿:收入高不?

母亲:不算很高,中等情况。

女儿:是公务员不?

母亲:是,在税务局上班呢。

女儿:那好,我去见见。


这个女孩的决策过程就是典型的分类树决策。相当于通过年龄、长相、收入和是否公务员对将男人分为两个类别:见和不见。假设这个女孩对男人的要求是:30岁以下、长相中等以上并且是高收入者或中等以上收入的公务员,那么这个可以用下图表示女孩的决策逻辑(声明:此决策树纯属为了写文章而YY的产物,没有任何根据,也不代表任何女孩的择偶倾向,请各位女同胞莫质问我^_^):



上图完整表达了这个女孩决定是否见一个约会对象的策略,其中绿色节点表示判断条件,橙色节点表示决策结果,箭头表示在一个判断条件在不同情况下的决策路径,图中红色箭头表示了上面例子中女孩的决策过程。


这幅图基本可以算是一颗决策树,说它“基本可以算”是因为图中的判定条件没有量化,如收入高中低等等,还不能算是严格意义上的决策树,如果将所有条件量化,则就变成真正的决策树了。


有了上面直观的认识,我们可以正式定义决策树了:


决策树(decision tree)是一个树结构(可以是二叉树或非二叉树)。其每个非叶节点表示一个特征属性上的测试,每个分支代表这个特征属性在某个值域上的输出,而每个叶节点存放一个类别。使用决策树进行决策的过程就是从根节点开始,测试待分类项中相应的特征属性,并按照其值选择输出分支,直到到达叶子节点,将叶子节点存放的类别作为决策结果。







请到「今天看啥」查看全文