贝叶斯分类算法的研究与应用文献综述

 2022-08-19 09:44:01

贝叶斯分类算法的研究与应用

摘要:本文重点研究了数据挖掘中的贝叶斯方法,它具有坚实的数学理论基础, 并能 综合先验信息和数据样本信息,成为数据挖掘和机器学习研究的热点之一。朴素 贝叶斯分类器是一种简单而有效的概率分类方法,然而其属性独立性假设在现实 世界中多数不能成立。为了改进该方法的分类性能,近几年已有大量研究成果,许多学者都致力于构建能反映属性之间依赖关系的贝叶斯分类模型。 本文简要地介绍了关于朴素贝叶斯分类器和粗糙集的基本理论,包括朴素贝叶斯分类模型,基于属性相关性分析的贝叶斯分类模型,加权贝叶斯分类模型, 粗糙集基本理论和属性重要度的构造方法。本文根据 Rough Set 属性重要度理论, 构建了基于互信息的属性子集重要度度量公式,提出属性相关性的加权朴素贝叶 斯分类算法(WCB),该算法同时放宽了朴素贝叶斯算法属性独立性、属性重要性 相同的假设。通过数据仿真实验,与基于属性相关相关性分析的贝叶斯(CB)和加 权朴素贝叶斯(WNB)两种算法做比较,证明了该算法的有效性。 最后对全文的工作进行了总结,并指出有待进一步研究的方向.

关键词:朴素贝叶斯分类器,属性重要度,属性相关,加权贝叶斯分类

第一章 绪论

1.1研究背景及国内外研究现状

1.1.1研究背景

在信息爆炸的时代中,人们需要利用新的技术来自动、智能和快速地分析海量的原始数据来使数据得以充分利用。由此一个新的研究方向得以引发:数据挖掘与知识发现的理论与技术研究。数据分类是数据挖掘的基本任务之一,作为一种数据分析形式,它主要提取刻画重要数据类的模型,而这种模型就称为分类器。贝叶斯算法是分类算法中的一种经典算法,在许多场合中,其作用可媲美决策树与神经网络分类算法。由于分类准确率高、速度快等优点,一直被广泛运用到各个领域之中。当属性的独立性假设不成立时,使用朴素贝叶斯分类器会影响其分类效果,因此,如何降低独立性假设,提升分类的准确率已成为一个重要的课题。近年来许多学者致力于构建反映属性之间依赖关系的贝叶斯分类模型,许多其他贝叶斯分类算法得以衍生,如加权贝叶斯分类算法、CB分类算法等。

1.1.2国内外研究现状

贝叶斯分类算法适应于各种数据类型的处理,在实际中有着广泛的应用.近几十年来,国内外专家和学者对贝叶斯算法的研究做了大量的工作。

剩余内容已隐藏,您需要先支付 10元 才能查看该篇文章全部内容!立即支付

以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。