Logistic回归以及应用
摘要:Logistic回归(logistic regression)是属于概率型非线性回归,是分析反应变量为独立分类资料的常用统计分析方法,由于它对资料的正态性和方差齐性不做要求、对自变量类型也不做要求等特点,这使得近年来Logistic回归模型在各个领域被广泛用,目前主要适用于流行病学研究中危险因素的筛选,同时它还具有良好的判别和预测功能,尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时,Logistic回归判别的优势和效能更为突出。本文对Logistic回归方程的判别分析进行研究探讨,并以实例介绍其应用。
关键词:Logistic回归; 判别分析; 预测; 应用
- 引言
近年来,回归模型的应用相当广泛,已经渗透到医学、经济学、生物学、犯罪心理学、工程技术学等领域。主要原因是回归模型是处理分类数据包括连续数据的有力工具,且对解释变量几乎没有任何限制。Logistic 回归常用于分析二分类因变量(如存活和死亡、患病和未患病等)与多个自变量的关系。比较常用的情形是分析危险因素与是否发生某疾病相关联。Logistic 回归与多元线性回归有很多相同之处,但最大的区别就在于他们的因变量不同。多元线性回归的因变量为连续变量;Logistic 回归的因变量为二分类变量或多分类变量,但二分类变量更常用,也更加容易解释。Logistic回归分析在医学研究中应用广泛。目前主要是用于流行病学研究中危险因素的筛选,但它同时具有良好的判别和预测功能,尤其是在资料类型不能满足Fisher判别和Bayes判别的条件时,更显示出Logistic回归判别的优势和效能。
二、研究背景
我们大概追溯一下现代统计学的发展。统计方法可以追溯到很早,几乎在计数方法被发明的时候就有了原始的统计方法。到了16世纪,由于掷筛子赌博的兴盛(据说),学者们开始研究点数的频率,推算概率。这是早期的概率论。与此同时,政府为了增强控制力需要了解人口的特征。学者们发展了国情学,开始应用在人口统计上,比如男女性别。统计方法以概率论和国情学为两个方法论的源头,有了进一步的发展。
统计方法发展成为现代(数理)统计学,则是更近的事。17、18世纪的数学家继续发展了概率论,为现代统计学的奠定了部分理论基础。
Logistic概率函数又称增长函数,是1838年比利时P F。Verhuist首次提出的m。他用logistic函数作增长曲线后,利用该曲线进行人口统计学的研究一直持续到十九世纪末。在过去的许多年间,Logistic回归模型使用已经非常广泛了。在它的起源时就已在传染学研究中有很规范的应用了。
自VeThulst提出用Logistic函数作增长曲线后,利用该曲线进行人口统计学的研究—直持续到十九世纪末。进二十一世纪,Logistic函数与Logistic回归模型已经在生物、经济,农业、医疗等方面获得了广泛应用。取得了丰硕的研究成果。Pearl和Read(1920[3],1924[4]),Schultz(1930[5]),Pearl,Read和Kish(1940[6])先后用Logistic曲线建立生物机体增长模型。Schultz(1930[5]),Oliver(1964[7])用Logistic函数建立农产品数量增长模型。许多学者,包括Pearl(1940[8]),Berkson(1944[9],1951 [10],1953 [11]),Finney(1947[12],1952[13])先后讨论了Logistic函数在计量生物学上的应用。在Plackett(1959 [14])将Logistic函数应用到生存分析后,Fisk(1961[15])又将Logistic函数应用到计量经济学。COK(1966[16]),Day和Kerridge(1967[17]),Anderson(1972[l8],1973[19],1974 [20])等先后又将Logistic函数应用到医疗诊断。
以上是毕业论文文献综述,课题毕业论文、任务书、外文翻译、程序设计、图纸设计等资料可联系客服协助查找。