机器学习之——决策树信息增益比计算[附加计算程序]

news/2024/9/30 13:29:50

0 前言

  • 本文主要介绍决策树信息增益比的计算,并给出例子帮助读者理解。
  • 读者需要具备:信息熵、条件熵、信息增益 相关知识。
  • 本文使用数据集:游玩数据集 1.1节。

1 信息增益比计算公式

image

2 信息增益比计算

2.1 gR(play,outlook)的计算

根据信息增益(跳转)相关知识,得出:

  • 特征outlook对数据集D的信息增益g(D,outlook)就等同于g(play,outlook),这里play是最终分类的属性。
    先计算分子:g(play,outlook),有如下计算过程:
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|outlook)=(4.0/14)* 0.0000+(5.0/14)* 0.9710+(5.0/14)* 0.9710=0.6935
    g(play,outlook)=H(play)-H(play|outlook)=0.9403-0.6935=0.2467
    H(play)的计算方法请参考:信息熵。
    H(play|outlook)的计算方法请参考:条件熵。

  • 根据分母HA(D)的公式,不难看出其就是某个随机变量D的信息熵。
    故有HA(D)等同于H(D),即随机变量D的信息熵,在本例题等同于H(play)。
    计算分母:HA(D)=H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,outlook)。
    根据公式gR(play,outlook)=g(play,outlook) / H(play) = 0.2467 / 0.9403=0.2624

2.2 gR(play,temperature)的计算

  • 计算分子g(play,temperature)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403
    H(play|temperature)=(4.0/14)* 0.8113+(4.0/14)* 1.0000+(6.0/14)* 0.9183=0.9111
    g(play,temperature)=H(play)-H(play|temperature)=0.9403-0.9111=0.0292

  • 计算分母H(play)。
    H(play)=-(5/14)log2(5/14)-(9/14)log2(9/14)=0.9403

  • 计算gR(play,temperature)。
    gR(play,temperature)=g(play,temperature) / H(play)=0.0292 / 0.9403=0.0311

3 计算程序

程序

4 结语

如有错误请指正,禁止商用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.ryyt.cn/news/55866.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈,一经查实,立即删除!

相关文章

财务知识-什么是计提

什么是计提计提就是“计算”和“提取”,用通俗的方式来讲就是把一些即将发生却没有实际发生,没有实际支付的出现的一部分,像将他们计算出来,进行提取,计入相关的费用和成本,这样操作后,可以更利于我们了解企业的真实利润。为什么要做计提根据企业会计准则,现在大部分的…

在diff的过程中,什么是就地复用

首先,先简单介绍一下什么是diff,在react或者vue框架中。组件更新时,不会直接去操作DOM,而是首先更新虚拟dom。比如一次更新中,更新了10次数据,那么反应到页面上,就会更新10次dom。这是很浪费性能的,所以虚拟dom就产生了,把10从更新,聚集到一块,统一更新一次虚拟dom,…

浙江省建设人才远程继续教育平台刷课脚本-JavaScript编写

脚本 学习网站:https://zj.zjjsrc.cn/web/web_toUserSignUp.page 脚本地址:浙江省建设人才远程继续教育平台刷课脚本: https://greasyfork.org/zh-CN/scripts/506406-浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本 教程 1.插件安装(以Microsoft Edge浏览器为例)打…

浙江省住房和城乡建设行业继续教育刷课脚本-JavaScript编写

脚本 学习网站:https://zj.zjjsrc.cn/web/web_toUserSignUp.page 脚本地址:浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本: https://greasyfork.org/zh-CN/scripts/506406-浙江省住房和城乡建设行业专业技术人员继续教育-刷课脚本 教程 1.插件安装(以Microsoft Ed…

博客园-awescnb插件-geek皮肤优化-表情配置

💖简介 博客园-awescnb插件-geek皮肤下,表情配置及优化 🔗链接官方配置:https://www.yuque.com/awescnb/user/rycpvv#KwRr4官方配置文档在线Emoji:https://tool.itzd.cn/在线获取Emoji表情🔧配置 🌟配置项:emoji字段 类型 描述 默认值enable Boolean 是否启用 true…

CAS简介

CAS定义 CAS,是Compare and Swap的简称,实现并发算法是常用到的一种技术,在这个机制中有三个核心的参数。1.主内存中存放的共享变量的值:V(一般情况下这个V是内存的地址值,通过这个地址可以获得内存中的值)。 2.工作内存中共享变量的副本值,也叫预期值:A。 3.需要将共…

【网络安全 | Java代码审计】Code-Breaking Puzzles-javacon

未经许可,不得转载。源码:https://www.leavesongs.com/media/attachment/2018/11/23/challenge-0.0.1-SNAPSHOT.jar,下载至桌面。 考察知识点:SpEL注入 正文 执行命令运行环境: java -jar C:\Users\86177\Desktop\challenge-0.0.1-SNAPSHOT.jar浏览器访问localhost:8080使…