影响戒烟成功的因素分析数模论文.doc
《影响戒烟成功的因素分析数模论文.doc》由会员分享,可在线阅读,更多相关《影响戒烟成功的因素分析数模论文.doc(18页珍藏版)》请在三一办公上搜索。
1、影响戒烟成功的因素分析摘要本论文通过对戒烟者的年龄、性别、每日抽烟支数及调整的CO浓度等因素的数量变化分析说明影响戒烟成功的因素,分段讨论不同因素下的累加发病率分布情况,用相关系数讨论影响戒烟时间的因素,用多元线性回归讨论影响戒烟成功的主要因素有哪些,建立出三个相应的模型。针对问题一,利用数理统计与概率的知识分别在不同年龄段、不同性别等因素下对234名烟民进行分段,设再次吸烟的人数为p,总人数为p,统计累加发病率,建立一个较为简单的模型。 针对问题二,利用相关系数和平均数的方法分两步来讨论分析影响戒烟时间的因素:(1)对于戒烟时间受年龄、每日抽烟支数及调整的CO浓度等因素的影响的差异,首先分别
2、求戒烟时间y与年龄、每日抽烟支数及调整的CO浓度等因素即x的相关系数。以戒烟时间与不同因素分别对应的相关系数r为基础,建立相应的模型.然后根据不同的讨论影响戒烟时间的因素。(2)对于性别对戒烟天数的影响,我们分别求出不同性别对应的戒烟天数t的平均值,再进行比较,由此得出性别对戒烟天数的影响。= (n为不同性别对应的人数)(3)另外,我们分别绘制出戒烟时间与年龄、每日抽烟支数及调整的CO浓度等因素的散点图,由点的分布更直观地体现不同因素对戒烟时间的影响程度。 针对问题三,把戒烟天数作为戒烟成功的标准,运用多元线性回归的知识,由于在问题一和二的解答中,我们得知性别对戒烟情况影响不大,所以只把年龄,
3、每日抽烟支数,CO浓度,调整的CO浓度四个因素作为自变量X,戒烟天数作为Y,建立新的模型:Y=通过本模型分析各种因素与成功戒烟之间的关系,确定了影响戒烟成功的因素。最后,我们对模型的科学性和现实性进行了阐述,并得到了对模型的整体评价,及急需改进之处。关键词:戒烟 概率论与数理统计方法 相关系数 多元线性回归 EXCEL问题重述众所周知,吸烟不仅危害自身健康,而且由此引起的被动吸烟更是危害公众身心健康的主要原因。为此,如何帮助相关人士摆脱烟瘾的困扰也就成为一个重要的研究课题。本文研究数据涉及 234人,他们都自愿表示戒烟但还未戒烟。在他们戒烟的这一天,测量了每个人的CO(一氧化碳)水平并记下他们
4、抽最后一支烟到CO测定时间.。 CO的水平提供了一个他们先前抽烟数量的客观指标,但其值也受到抽最后一支烟的时间的影响, 因此抽最后一支烟的时间可以用来调整CO的水平。记录下研究对象的性别、年龄及自述每日抽烟支数。这个调查跟踪1年, 考察他们一直保持戒烟的天数, 由此估计这些人中再次吸烟的累加发病率, 也就是原吸烟者戒烟一段时间后又再吸烟的比例. 其中假设原烟民戒烟的可信度是很低的(更恰当地说多数是再犯者)戒烟天数是从0到他(她)退出戒烟或研究截止时间(1 年)的天数。假定他们全部没有人中途退出研究。请回答下列问题:1)试分析上述234人中再次吸烟的累加发病率分布情况(如不同年龄段、不同性别等因
5、素下的累加发病率分布情况)。2)你认为年龄、性别、每日抽烟支数及调整的CO浓度等因素会影响戒烟时间(天数)长短吗?如果影响请利用附录中的数据,分别给出戒烟时间与上述你认为有影响的因素之间的定量分析结果。3)请利用附录中的数据建立适当的数学模型,讨论影响戒烟成功的主要因素有哪些,并对你的模型进行可靠性分析。4)请根据你的模型,撰写一篇500字左右的短文,向有志于戒烟的人士提供戒烟对策和建议。问题分析全世界现有11亿人在抽烟,每年约有120万人死于烟草诱发的相关疾病,中国烟民已超过3亿,占全球吸烟者总数的1/3,二手烟民更高达7.4亿人。为什么戒烟如此困难?吸一口烟能在几秒钟内迅速将尼古丁颗粒送进
6、大脑,从而使脑细胞受体释放出多巴胺等使人感觉良好的其他微小颗粒,让烟民明知吸烟百害无一利,也欲罢不能。所以,如何帮助烟民戒烟,成了既急迫又棘手的问题。从理论上讲,戒烟难度可能受年龄,性别,每日抽烟支数等因素的影响。但从数据分析中发现,这种相关性并不十分明显。所以我们将综合累加发病率,影响戒烟时间的因素,影响戒烟成功的主要因素这三方面来,从而得出戒烟对策和建议。1)对影响戒烟成功的因素的理解 问题一:数据中的戒烟天数直接反映了调查对象的戒烟情况,这个调查跟踪1年,则戒烟天数小于一年(365天)的人即为再次发病的人数。由于再次吸烟的累积发病率指总人群,经过一段特定的观察期(一年)之后,再次吸烟的频
7、率,所以分子是在一年内再次吸烟的人数,分母是观察开始时的总人数。且题目要求分析在不同年龄段等因素下的累加发病率,所以我们将进行分段统计。问题二:讨论影响戒烟时间的因素,可以分别求年龄、性别等因素与戒烟时间之间的相关系数r,再根据越接近1则相关性越大的原理来对影响戒烟时间的因素进行排序。另外,由于性别仅有2个变量,我们将对不同性别对应的戒烟天数的平均数进行比较。最后,我们分别制出年龄、性别等因素与戒烟时间之间的散点图,更直观地反应不同因素对戒烟天数的影响程度。问题三:由于戒烟天数可看成戒烟成功的指标,讨论影响戒烟成功的主要因素,可转化为影响戒烟天数的主要因素。与问题二不同的是,问题三是戒烟天数这
8、一因变量与多个自变量对应,从而比较得出主要影响因素;而问题二仅需判断各个因素是否单独对戒烟天数产生影响。所以这里可用多元线性回归的方法来讨论。问题假设由于问题本身尚有一些不确定因素,为使问题抽象成一个数学问题,做如下假设;(1)一年为365天。(2)数据不全的调查对象的已知数据仍有说服力,其数据可正常使用。(3)本题提供的数据能代表全部戒烟人士的情况,数据的象征性,准确性无需置疑。 (4)没有人中途退出该测试。模型分析及求解问题(1):符号说明:p: 再次吸烟的人数p,;总人数;累加发病率我们将B组数据中戒烟天数按时间用Excel进行重新排序并计算上述234人中再次吸烟的累加发病率为=0.85
9、8974359。在计算年龄,性别,每日抽烟支数,CO浓度,调整的CO浓度的累加发病率分布时,我们坚持一个原则:当戒烟天数分别与年龄,性别,每日抽烟支数,CO浓度,调整的CO浓度一一对应存在时,我们才采纳这个数据,他们的柱状图如下:(1) 根据上述原则,我们采纳了234个数据。根据测试人群年龄,我们把年龄分成三段(单位:岁):青年19-39,中年39-59,老年59-79.在不同年龄段,三个年龄段得到的累加发病率分别为;=0.8888888889,=0.8557692308,=0.7272727273可见年龄越大,累加发病率越低,且老年(59,79)的累加发病率较低。(2) 根据上述原则,我们采
10、纳了234个数据。我们把性别分成两段:2男,1女. 在不同性别,得到的累加发病率分别为;=0.8709677419=0.8454545455,可见女性的累加发病率较高。(3) 根据上述原则,我们采纳了234个数据。我们把每日抽烟支数分成三段(单位:支):每日抽烟只数不太多(0,15),每日抽烟只数一般多15,30),每日抽烟只数很多30,+ ).在不同每日抽烟支数段,得到的累加发病率分别为;=0.8461538462,=0.8828828829,=0.8333333333可见每日抽烟只数在15,30)时的累加发病率最高,在(0,15)时的累加发病率次之,在30,+ )时的累加发病率最低。(4)
11、 根据上述原则,我们采纳了227个数据。我们把CO浓度分成三段:浓度不算太高(0,200),浓度不算一般高200,400),浓度较高400,+ ).在不同CO浓度段,得到的累加发病率分别为;=0.8414634146,=0.8636363636,=0.9142857143可见CO浓度越高,累加发病率越高,且浓度较高400,+ )的累加发病率特别高。(5) 根据上述原则,我们采纳了224个数据。我们把调整的CO浓度分成三段:浓度不算太高(500,1000),浓度不算一般高1000,1500),浓度较高1500,2000).在不同的调整的CO浓度段,得到的累加发病率分别为;=0.727272727
12、3,=0.8571428571,=0.8939393939可见调整的CO浓度越高,累加发病率越高,浓度不算太高(500,1000)的累加发病率相较低。总结分析:对于年龄,越年轻,累加发病率越低。对于性别,女性,累加发病率较高。对于每日抽烟支数,累加发病率的分布没有明显规律。对于CO浓度和调整的CO浓度,浓度越高,累加发病率越高。模型改进方向:由于累加发病率指已知人群,经过一段特定的观察期之后,发生某病的频率。分子是在某一特定观察期内发生的某病新病例数。分母是观察开始时的暴露人数。这是一个规定的概念,所以我们按要求对数据进行分段统计分析,无需再寻找其他更好的模型。问题(2):变量假设:符号说明:
13、:年龄:每日抽烟支数:CO浓度 :调整的CO浓度建立模型:我们利用excel通过对已知数据的分析,分别计算出年龄,每日抽烟支数,CO浓度,调整的CO浓度与戒烟天数的相关系数,如下表所示: 0.0527833720.026584259-0.199920331-0.1369511091) 由表可知,年龄、每日抽烟支数,CO浓度调整的CO浓度会影响戒烟时间(天数)长短,据越接近1则相关性越大的原理,他们对戒烟天数的影响程度有大到小排序如下:CO浓度,调整的CO浓度,年龄,每日抽烟支数。2) 由r的符号可知,年龄,每日抽烟支数与戒烟天数是正相关的,CO浓度,调整的CO浓度与与戒烟天数是负相关的。3)
14、为了更直观地体现不同因素对戒烟时间的影响程度,我们用excel绘制了戒烟时间与年龄、每日抽烟支数及调整的CO浓度等因素的散点图,具体如下CO浓度与戒烟天数的相关系数r=-0.199920331调整的CO浓度与戒烟天数的相关系数r=-0.136951109年龄与戒烟天数的相关系数r=0.052783372每日抽烟支数与戒烟天数的相关系数r=0.026584259根据散点图中各点分布走向和密集 程度,可以大致判断变量之间的共变关系,由四图可看出,各点的密集 程度是从大到小的,所以我们可以判断影响戒烟时间的因素由相关度从大到小排序是CO浓度,调整的CO浓度,年龄,每日抽烟支数。4) 最后,我们利用e
15、xcel分别计算不同分性别对应的戒烟天数的平均数,求得男性的戒烟天数的平均数为77.86363636,女性的戒烟天数的平均数为81.83064516。可见性别会影响戒烟天数,一般来说,男性的戒烟天数低于女性。总结分析:年龄、性别、每日抽烟支数及调整的CO浓度会影响戒烟时间(天数)长短。由强到弱按对戒烟时间影响的程度排序有:CO浓度,调整的CO浓度,年龄,性别,每日抽烟支数。模型改进方向:该模型仅给出不同因素与戒烟天数的相关系数,及性别这一因素的戒烟天数的平均数,并没直接给出不同因素与戒烟天数的具体函数(数量)关系,给出的分析结果较为模糊,如果能运用回归分析中一元线性回归的方法,分别用回归方程准
16、确地表示不同因素与戒烟天数的回归方程,或许会有更清晰的数据结果。问题(3)符号说明::年龄:每日抽烟支数:CO浓度:调整的CO浓度针对问题三,我们把戒烟天数作为判断戒烟成功的指标,于是,讨论影响戒烟成功的主要因素即转化为讨论影响戒烟天数的主要因素。由于因变量是戒烟天数,而自变量有多个(年龄、每日抽烟支数及调整的CO浓度等因素),所以我们首先讨论自变量到底选取哪几个。我们可以轻易判断,戒烟天数与距离抽最后一支烟的分钟数无关,所以仅考虑其他五个因素(年龄, CO浓度,调整的CO浓度,每日抽烟支数,性别)。我们运用多元线性回归的方法解决该题。我们在剔除了10个数据不完整的调查对象后,对剩下的224个
17、调查对象用EXCEL进行线性回归分析,一共做了五个模型(自变量包括五个因素,自变量分别不包括性别,年龄, CO浓度,调整的CO浓度,每日抽烟支数的四个模型),发现性别的标准误差均较大,而标准误差越大,拟合程度越差,所以舍去该因素。因此,我们最终把年龄, CO浓度,调整的CO浓度,每日抽烟支数作为自变量。基于上述分析,用EXCEL进行回归分析,统计结果如下:回归统计Multiple R0.236065127R Square0.055726744Adjusted R Square0.038479744标准误差126.0181324观测值224方差分析dfSSMSFSignificance F回归分
18、析4205246.695851311.673943.2310978080.0133224残差2193477844.76415880.5697总计2233683091.46Coefficients标准误差t StatP-valueLower 95%Upper 95%下限 95.0%上限 95.0%Intercept64.3915870685.107710860.7565893430.450109069-103.3433974232.1265715-103.3433974232.1265715Age0.1527726410.6878942460.2220873950.824452817-1.202
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 影响 戒烟 成功 因素 分析 数模 论文
链接地址:https://www.31ppt.com/p-3924696.html