>>P 产品中心 Product center
> 滑轨屏 标准模块 > 滑轨屏 成套产品 > 滑轨屏 高端定制 > 开合门 | 开合屏
>>C 案例中心 Case
> 开合屏 > 旋转滑轨屏 > 弧形滑轨屏 > 多点触控 > 数字展厅 > 虚拟展馆 > 3D 渲染 > 三维全景 > 多屏互动 > 虚拟现实
>>I 项目日志 Information
> 开合门胜利完工 > 张之洞博物馆完工 > 汽车教学 AR、VR和体感等互动 > 安徽滑轨项目施工篇 > 连云港86寸定制款滑轨屏之物料 > 连云港86寸定制款滑轨屏之施工 > 河北邯郸馆陶县互动滑轨屏项目 > 武汉绘芯辽宁项目日志
C 联系方式 Contact Us

地址: 湖北省武汉市江夏区藏龙岛九凤街谭湖一路8号

邮编: 443000

电话: +86-027-87052087

手机: +86-13329706647

邮箱: 956693667@qq.com

当前位置:首页 > 行业咨讯 > 行业咨讯

滑屏定制 决策树算法实验报告_公司运营风险分析与成本决策开题报告

时间:2020-07-01 13:20来源:hxceshi 点击:

一种无决策属性的信息系统的属性约简算法_企业经营风险分析与成本决策开题报告_决策树算法实验报告

【摘要】

众所周知,数据库技术从20世纪80年代开始决策树算法实验报告,已经得到广泛的普及和应用。随着数据库容量的膨胀决策树算法实验报告,特别是数据仓库以及web等新型数据源的日益普及,人们面临的主要问题不再是缺乏足够的信息可以使用,而是面对浩瀚的数据海洋如何有效地利用这些数据。

从数据中生成分类器的一个特别有效的方法是生成一个决策树(Decision Tree)。决策树表示方法是应用最广泛的逻辑方法之一,它从一组无次序、无规则的事例中推理出决策树表示方式的分类规则。决策树分类方法采用自顶向下的递归方式,在决策树的内部结点进行属性值的比较并根据不同的属性值判断从该结点向下的分支,在决策树的叶结点得到结论。所以从决策树的根到叶结点的一条路径就对应着一条合取规则,整棵决策树就对应着一组析取表达式规则。

决策树是应用非常广泛的分类方法,目前有多种决策树方法,如ID3、CN2、SLIQ、SPRINT等。

关键词:数据挖掘知识发现 决策树(Decision Tree)ID3算法

一、问题重述

1.1相关信息

决策树是一个类似于流程图的树结构,其中每个内部结点表示在一个属性上的测试,每个分支代表一个测试输入,而每个树叶结点代表类或类分布。数的最顶层结点是根结点。一棵典型的决策树如图1所示。它表示概念buys_computer,它预测顾客能否可能购买计算机。内部结点用矩形表示,而树叶结点用椭圆表示。为了对未知的样本分类,样本的属性值在决策树上测试。决策树从根到叶结点的一条路径就对应着一条合取规则,因而决策树容易转化成分类规则。[2]

图1

ID3算法:

■ 决策树中每一个非叶结点对应着一个非类别属性,树枝代表这个属性的值。一个叶结点代表从树根到叶结点之间的路径对应的记录所属的类别属性值。

■ 每一个非叶结点都将与属性中具有最大信息量的非类别属性相关联。

■ 采用信息增益来选择能够最非常好地将样本分类的属性。

信息增益基于信息论中熵的概念。ID3总是选择具有最高信息增益(或最大熵压缩)的属性作为当前结点的测试属性。该属性使得对结果划分中的样本分类所需的信息量最小,并反映划分的最小随机性或“不纯性”。

1.2问题重述

决策树算法实验报告_一种无决策属性的信息系统的属性约简算法_企业经营风险分析与成本决策开题报告

1、算法参见第八章分类与预测

2、目标概念为“寿险促销”

3、计算每个属性的信息增益

4、确定根节点的测试属性

模型求解

构造决策树的方法是采用自上而下的递归构造,其思路是:

■ 以代表训练样本的单个结点开始建树(步骤1)。

■ 如果样本都在同一类,则该结点成为树叶,并用该类标记(步骤2和3)。

■ 否则,算法使用称为信息增益的机遇熵的度量为启发信息,选择能最非常好地将样本分类的属性(步骤6)。该属性成为该结点的“测试”或“判定”属性(步骤7)。值得注意的是,在这类算法中,所有的属性都是分类的,即取离散值的。连续值的属性必须离散化。

■ 对测试属性的每个已知的值,创建一个分支,并据此划分样本(步骤8~10)。

■ 算法使用同样的过程,递归地构成每个划分上的样本决策树。一旦一个属性出现在一个结点上,就不必考虑该结点的任何后代(步骤13)。

■ 递归划分步骤,当下列条件之一成立时停止:

(a)给定结点的所有样本属于同一类(步骤2和3)。

(b)没有剩余属性可以用来进一步划分样本(步骤4)。在此情况下,采用多数表决(步骤5)。这涉及将给定的结点转换成树叶,并用samples中的多数所在类别标记它。换一种方式,可以存放结点样本的类分布。

(c)分支test_attribute=ai没有样本。在这种情况下,以samples中的多数类创建一个树叶(步骤12)。[2]

在线客服

扫码与我交流