一、选题背景和意义:
饮食习惯与生活状态的改变,使得脑部疾病成为影响人类健康和寿命的重要因素。脑电波(Brain Wave)检测具有非侵人、无辐射、可持续的特点,成为最常用的脑病变检测方法。传统的手段是以纸笔记录脑电波的变化,形成脑电图(EEG)。当记录笔发生故障或更换记录纸时,记录将中断。近年来随着电子技术的进步和计算机技术的发展,逐渐出现了以计算机为中心的脑电波记录分析系统。基于脑电波记录的检索仍是一个非常年轻且尚未开发的领域。
本次研究重点是基于脑电波的检测分析处理来判断睡眠类型。人体的睡眠过程属于人体生命中必不可少的过程,成年人的正常睡眠时间大约在7~9 小时,即占据了人体生命中大约
1/3 的时间。1937 年,利用早期的多导睡眠图(polysomnogram,PSG),Loomis、Harvey 和 Hobart等人证实了这样一个事实:人体的睡眠过程是处于一个有规律的周期状态变换,并非是一个平稳的状态。多导睡眠图检测方法的进展,有力的推动了睡眠检测的医学研究,1957 年,美国芝加哥大学按照相应的脑电图(electroencephalogram,EEG)特征性改变,将人的不同程度的睡眠状态时期划分为觉醒期、非 REM 睡眠期(即睡眠Ⅰ、Ⅱ、Ⅲ、Ⅳ期)和 REM 睡眠期(Rapid Eye Movement)。REM 睡眠行为障碍,即快速眼动期睡眠行为障碍疾病,通常简称为 RBD。该疾病是患者在 REM 睡眠期出现肌肉控制障碍,即肌肉不受身体的控制,会根据其梦境发生一些动作,往往是暴力的动作,例如喊叫、抓握、抬臂、踢踹等现象。针对于
REM 睡眠行为障碍,应该确切的分析其睡眠中的 REM 睡眠期,然后通过检测其肌电电压值进行有效的检测。本次课题研旨在利用随机森林算法,通过对多导睡眠图数据进行睡眠阶段的分类来判断睡眠类型。
随机森林算法是一种基于决策树的集成学习算法,具有很高的预测准确率,对异常值和噪声具有很好的容忍度,而且不容易出现过拟合,在医学等领域具有广泛的应用。机器学习算法中的有监督学习无非就是解决分类问题和回归问题,其中解决分类问题的算法有很多,例如朴素贝叶斯算法(Naive Bayesian)、支持向量机算法(Support Vector Machine)、决策树算法(Decision Tree)等。显然这些都是单个的分类器,单个的分类器很容易出现过拟合的问题, 而且在对其进行性能提升时会出现瓶颈,因此集成学习算法运应而生。集成学习算法中集成方法主要有两种:Boosting和Bagging(boostrap aggregating)。其中Boosting算法有很多,最具代表性的应当是AdaBoost算法;Bagging是通过结合几个模型降低泛化误差的技术,随机森林(Random Forests) 是Bagging集成方法中最具有代表性的算法,该算法是2001年由Leo Breiman将Bagging集成学习理论与随机子空间方法相结合,提出的一种机器学习算法。
二、课题关键问题及难点:
本课题重点研究基于随机森林算法的睡眠类型判断。随机森林算法虽然在分类精度、泛化误差等性能方面比决策树算法有较大的提升,也得到了广泛的应用,但是随着研究的深入,随机森林算法自身存在的问题也慢慢暴露出来, 主要表现在三个方面:第一,不能很好地处理非平衡数据;第二,对连续性变量的处理还需要进行离散化;第三,分类精度还需要进一步提高。在编写算法对已有的公开睡眠数据集进行处理具有一定的难度,之后针对随机森林算法自身存在的问题也要尝试改进优化,都是存在一定困难的。除此之外,制定的研究内容里也想尝试通过使用一些其他算法对同样的数据进行处理,将结果与使用随机森林算法所得出的结果进行对比,也是比较有难度的。
三、文献综述(或调研报告):
要实现对睡眠类型进行判断,一般要先获取受试者的睡眠数据集。多导睡眠图(PSG)又称睡眠脑电图,是通过不同部位的生物电或通过不同传感获得生物讯号,经前置放大,输出为不同的电讯号,记录出不同的图形以供分析。其中可以利用算法来获取多导睡眠图数据集文件。所使用的的处理数据的随机森林算法在以决策树为基学习器构建Bagging集成的基础上,进一步在决策树的训练过程中引入随机属性的选择。随机森林算法简单、易于实现、计算开销小。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。