自考30447数据、模型与决策.ppt
《自考30447数据、模型与决策.ppt》由会员分享,可在线阅读,更多相关《自考30447数据、模型与决策.ppt(181页珍藏版)》请在三一办公上搜索。
1、2023/5/24,1,第1章 总论,本讲主要内容:一、数据分析的意义二、数据、模型与决策关系三、定量分析的要求,2023/5/24,2,第1章 总论,一、数据分析的意义1、定量方法类课程在工商管理中的地位,2023/5/24,3,第1章 总论,一、数据分析的意义2、定类分析类课程的实用性 背景分析1:企业生产经营方式 背景分析2:定价与销售效果 背景分析3:社会救助与公司解雇 背景分析4:销售因素诊断,2023/5/24,4,第1章 总论,二、数据、模型与决策关系,2023/5/24,5,第1章 总论,二、数据、模型与决策关系,2023/5/24,6,第1章 总论,三、定量分析的要求 定性分
2、析为先导 管理决策为根本目标 科学方法论为指导 数学模型为主要工具 软件应用为辅助性手段,2023/5/24,7,第2章 数据资料的来源、分类与变换,本讲的主要内容:一、数据资料的来源二、数据资料的分类三、数据质量检查的两种方法四、数据资料的变换,2023/5/24,8,第2章 数据资料的来源、分类与变换,一、数据资料的来源1、科学研究过程及方法,2023/5/24,9,第2章 数据资料的来源、分类与变换,一、数据资料的来源2、数据是开展定量分析的基础 如果选择实证研究,数据资料的采集可能是一项基础性质的工作。3、数据资料搜集提纲 研究目标,研究对象,研究变量,数据资料搜集的渠道,区分清楚资料
3、的最终用途。,2023/5/24,10,第2章 数据资料的来源、分类与变换,一、数据资料的来源4、数据资料搜集途径,2023/5/24,11,第2章 数据资料的来源、分类与变换,一、数据资料的来源4、数据资料搜集途径,2023/5/24,12,第2章 数据资料的来源、分类与变换,一、数据资料的来源5、不同抽样方式下的样本单位确定,2023/5/24,13,第2章 数据资料的来源、分类与变换,一、数据资料的来源6、样本抽取的电子表格实现 利用EXCEL“数据分析”中的“抽样”可以获得相应抽样方式的样本。,2023/5/24,14,第2章 数据资料的来源、分类与变换,二、数据资料的分类1、测量尺度
4、分类,2023/5/24,15,第2章 数据资料的来源、分类与变换,二、数据资料的分类2、时空要素分类,2023/5/24,16,第2章 数据资料的来源、分类与变换,三、数据质量检查的两种方法1、数据资料质量 准确性,时效性,代表性,系统性,可比性2、数据资料质量的相对性3、数据质量的影响因素,2023/5/24,17,第2章 数据资料的来源、分类与变换,三、数据质量检查的两种方法4、数据质量检查,2023/5/24,18,第2章 数据资料的来源、分类与变换,四、数据资料的变换1、数据变换的目的 便于运用简单的方法开展分析,迅速获得更加清晰的直观认识,保证数据分析所需要的假定条件得到满足,弱化
5、乃至消除数据资料不准确对计量分析结论的影响,利于选择和建立合适的分析模型。2、数据变换的方法 线性和线性化变换,差分变换,方差稳定化变换,标准化变换等。,2023/5/24,19,第3章 统计资料描述分析,本讲的主要内容:一、一般介绍二、数据描述的图表工具三、数据分析的特征数字四、电子表格数据处理,2023/5/24,20,第3章 统计资料描述分析,一、一般介绍 围绕某个问题开展研究,可以采用定性和定量分析两种逻辑。,2023/5/24,21,第3章 统计资料描述分析,一、一般介绍 实证分析的基础是占有数据资料,采集到必要的数据后,通常需要对数据资料实施描述性分析。,2023/5/24,22,
6、第3章 统计资料描述分析,二、数据描述的图表工具1、统计表的种类2、频数分布 频数分布是统计资料整理和描述分析过程中经常使用的一种方法,频数分布能对观察资料实施大幅度的压缩和提炼,可以使资料以更加清晰、简洁的形式展现出来,从而便于直观地了解现象的内部结构。频数分布是在统计分组的基础上形成的样本单位在各个组间的分配。,2023/5/24,23,第3章 统计资料描述分析,二、数据描述的图表工具3、EXCEL频数分布的制作 利用EXCEL中的函数FREQUENCY,可以编制频数分布,具体过程是:首先确定分组组数和组限,一次性选定与组数大小相同的空白行,然后编写函数“=FREQUENCY(数据区域,每
7、个组的上限值)”,最后按CTRL+SHIFT+ENTER。,2023/5/24,24,第3章 统计资料描述分析,二、数据描述的图表工具4、频数分布中的几个概念(1)频数。每个组观察值出现的次数,统称为频数,用以反映各组观察值发生的频繁程度。(2)频率。各个组中的频数与所有组频数之和的比率。(3)累积频数。几个相关组发生频数的合计,能够反映组合并后的观察值总共出现的次数。(4)累积频率。几个相关组发生频率的累加和,能够用于描述和解释组合并后观察值出现的相对频繁程度。,2023/5/24,25,第3章 统计资料描述分析,二、数据描述的图表工具5、数据描述的图形显示(1)直方图、折线图与曲线图:功能
8、与绘制;(2)累积分布图:功能与绘制;(3)饼形图与圆环图;(4)帕雷特图:应用与绘制;(5)雷达图:功能、阅读与绘制;(6)散点图:功能、应用与绘制;(7)茎叶图:含义、作用于制作。,2023/5/24,26,第3章 统计资料描述分析,三、数据分析的特征数字(一)综述,2023/5/24,27,第3章 统计资料描述分析,三、数据分析的特征数字(二)定量数据的特征数字1、定量数据集中趋势的特征数字 定量数据集中趋势的特征数字,常用的有算术平均数、中位数、众数、截尾均值等。(1)算术平均数:含义,计算方法,应用。(2)中位数与四分位数:含义,计算,应用。(3)众数:含义,计算方法,应用。(4)截
9、尾均值:含义,计算方法,应用。,2023/5/24,28,第3章 统计资料描述分析,三、数据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(1)算术平均数、中位数、众数的结合应用 将算术平均数、中位数和众数结合起来,可以大致判断现象存在的对称性。如果现象存在的状态是对称的,算术平均数、中位数与众数完全相同。算术平均数、中位数或众数不相同,说明现象存在的状态不对称,算术平均数大于中位数或众数,表明现象呈右偏态,频数分布的尾巴拖向右边。算术平均数小于中位数或众数,表明现象呈左偏态,频数分布曲线的尾巴拖向左边。,2023/5/24,29,第3章 统计资料描述分析,三、数
10、据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(2)中位数与四分位数的结合应用 从方法性质上,中位数与四分位数没有本质的不同,都是根据样本数据排序的位置确定的,所以常称为位置集中趋势测度。但将它们结合起来使用,也能发挥更大的作用。比如经常见到的“箱线图”。,2023/5/24,30,第3章 统计资料描述分析,三、数据分析的特征数字(二)定量数据的特征数字2、定量数据集中趋势特征数字的综合应用(3)马尔可夫不等式 为一组非负观察值,为算术平均数,k为大于1常系数,则有表明某个数值不小于算术平均数k倍的概率不会超过1/k。,2023/5/24,31,第3章 统计资料
11、描述分析,三、数据分析的特征数字(二)定量数据的特征数字3、定量数据离散趋势特征数字 观察值之间的差异程度或频数分布的分散程度,称为离散趋势。常用的离散趋势的特征数字有:极差,四分位数差,方差与标准差。(1)极差:含义,计算,应用。(2)四分位数差:含义,计算,应用。(3)方差与标准差:含义,计算,应用。,2023/5/24,32,第3章 统计资料描述分析,三、数据分析的特征数字(二)定量数据的特征数字4、定量数据离散趋势特征数字的综合应用(1)数据资料标准化。(2)变异系数 变异系数是把算术平均数与标准差联系起来的一个测度。,2023/5/24,33,第3章 统计资料描述分析,三、数据分析的
12、特征数字(二)定量数据的特征数字4、定量数据离散趋势特征数字的综合应用(3)切比雪夫经验规则 切比雪夫定理:任何一个数据集中,至少有 个数据出现在均值Z个标准差的范围,其中Z是一个大于1的数。,2023/5/24,34,第3章 统计资料描述分析,三、数据分析的特征数字(二)定性数据的特征数字1、定性数据集中趋势的特征数字 属性资料集中趋势的测度主要是:众数,中位数,四分位数等。2、定性数据离散趋势的特征数字(1)离散比率,2023/5/24,35,第3章 统计资料描述分析,三、数据分析的特征数字(二)定性数据的特征数字2、定性数据离散趋势的特征数字(2)GINI-SIMPSON指数(3)熵,2
13、023/5/24,36,第3章 统计资料描述分析,四、电子表格数据处理 利用EXCEL加载宏中的“数据分析”,可以一次性处理数量数据相关的特征数字计算。具体过程是:在EXCEL工作表中录入需要处理的数据;点击菜单栏中的“数据”,从右上方找到“数据分析”;在弹出的对话框中,选择“描述统计”,然后按“确定”;在新弹出的对话框中,将待处理数据所在的范围输入到“输入区域”框中,指定输出区域,选定“汇总统计”。,2023/5/24,37,第4章 参数样本推断,本讲的主要内容:一、统计量与抽样分布 二、参数估计应用 三、假设检验应用四、EXCEL中的“数据分析”,2023/5/24,38,第4章 参数样本
14、推断,一、统计量与抽样分布 1、参数与统计量 特征数字有总体特征数字和样本特征数字之分。总体特征数字是根据研究对象全体调查资料计算的,反映了研究对象总体的基本信息,常被叫做参数。样本特征数字是根据研究对象中抽取出来的部分代表性单位即样本观察数据计算的,反映了样本资料的基本信息,也叫统计量。,2023/5/24,39,第4章 参数样本推断,一、统计量与抽样分布 2、统计量的抽样分布 统计量是样本的函数,随着抽取的样本的变化,得到的统计量值彼此之间存在差异。为了搞清统计量的性质,需要借助频数分布的概念,以揭示统计量取值的变化情况。抽样分布就是,从总体中抽出相同容量的全部样本,并计算出统计量的值,然
15、后按统计量的值编制出来的频数分布。,2023/5/24,40,第4章 参数样本推断,一、统计量与抽样分布3、常用的统计量抽样分布(1)单样本均值抽样分布(2)两样本均值差的抽样分布,2023/5/24,41,第4章 参数样本推断,一、统计量与抽样分布3、常用的统计量抽样分布(3)样本比例数的抽样分布(4)样本方差的抽样分布,2023/5/24,42,第4章 参数样本推断,二、参数估计应用 1、点估计 点估计也叫定值估计,它针对总体参数的性质构造估计用统计量,然后由样本资料计算出统计量的值,并直接作为相应总体参数值的替代。用一句话来说,就是用单个统计量的值作为总体参数值的近似或估计。,2023/
16、5/24,43,第4章 参数样本推断,二、参数估计应用 1、点估计 从实用的角度,在此把点估计做一归纳。,2023/5/24,44,第4章 参数样本推断,二、参数估计应用 2、区间估计(1)单总体均值区间估计(2)两总体均值差区间估计,2023/5/24,45,第4章 参数样本推断,二、参数估计应用 2、区间估计(3)总体比例数区间估计,2023/5/24,46,第4章 参数样本推断,二、参数估计应用 2、区间估计(4)总体方差区间估计,2023/5/24,47,第4章 参数样本推断,三、假设检验应用1、总体均值检验(1)单样本总体均值检验(2)两总体均值差检验,2023/5/24,48,第4
17、章 参数样本推断,三、假设检验应用2、总体比例数检验3、总体方差检验,2023/5/24,49,第4章 参数样本推断,四、EXCEL中的“数据分析”1、EXCEL的参数估计 利用EXCEL中的“数据分析”可以做参数的点估计与区间。以均值为例,运行“数据分析”得到输出结果后,直接以特征数字作为点估计,将均值和置信度做减和加处理,便能得到区间估计。其他的估计,可以在电子表格中直接编写计算公式。,2023/5/24,50,第4章 参数样本推断,四、EXCEL中的“数据分析”2、EXCEL的参数假设检验 EXCEL中的“数据分析”带有两样本等方差、异方差等检验功能,使用过程是:第一步,在EXCEL工作
18、表中编录数据;第二步,从菜单栏“数据”的右上方找到“数据分析”并打开;第三步,在弹出的对话框中,打开“t-检验:双样本等方差假设”,根据提示进行相关设定即可。,2023/5/24,51,第5章 方差分析及其应用,本讲的主要内容:一、方差分析的基本问题二、单因素方差分析三、两因素方差分析四、电子表格求解,2023/5/24,52,第5章 方差分析及其应用,一、方差分析的基本问题1、含义 方差分析是在若干个能够互相比较的资料组中,把产生变异的原因加以明确区分的方法和技术。2、假定条件 实验相互独立,实验误差服从正态分布,等方差。3、基本思想 某一因素水平下的实验结果,由于实验条件相同,数据间的差异
19、可看成是随机性误差引起的,不同因素水平下的实验数据因实验条件改变,其间的差异可看成主要是实验条件改变造成的。随机误差服从正态分布,因此每一因素水平下的实验数据又可当作是来自这一因素水平的总体的一个样本,理论上应该有一个均值。如此一来,因素影响是否显著就转化为检验 是否相等的问题。,2023/5/24,53,第5章 方差分析及其应用,二、单因素方差分析1、单因素等重复方差分析(1)提法 实验中只考虑一个因素A,分r 个水平作观察,每个水平下的实验结果均服从正态分布且方差相等。为检验 是否相等,对每个水平都做n 次实验(等重复的含义),且保证各次实验相互独立。,2023/5/24,54,第5章 方
20、差分析及其应用,二、单因素方差分析1、单因素等重复方差分析(2)检验统计量其中,2023/5/24,55,第5章 方差分析及其应用,二、单因素方差分析2、单因素不等重复方差分析(1)提法 实验中只考虑一个因素A,分r 个水平作观察,每个水平下的实验结果均服从正态分布且方差相等。为检验 是否相等,对每个水平所做的实验次数不一定相等,但各次实验相互独立。,2023/5/24,56,第5章 方差分析及其应用,二、单因素方差分析2、单因素不等重复方差分析(2)检验统计量其中,2023/5/24,57,第5章 方差分析及其应用,三、两因素方差分析1、无重复两因素方差分析(1)提法 实验中考虑两个因素,用
21、A、B表示,A因素取r个水平,B因素取s个水平,对A、B的每一水平搭配只作1次实验(无重复),实验结果服从正态分布。检验的问题:因素A和因素B对实验结果是否有显著影响。,2023/5/24,58,第5章 方差分析及其应用,三、两因素方差分析1、无重复两因素方差分析(2)检验统计量其中,2023/5/24,59,第5章 方差分析及其应用,三、两因素方差分析2、等重复两因素方差分析(1)提法 实验考虑两个因素A和B,A因素取r个水平,B因素取s个水平,对A与B的每一水平搭配分别作l次实验(等重复),实验结果服从正态分布,且各次实验相互独立。检验的问题是,因素A、因素B及其搭配对实验结果是否存在显著
22、的影响。,2023/5/24,60,第5章 方差分析及其应用,三、两因素方差分析2、等重复两因素方差分析(2)检验统计量其中,2023/5/24,61,第5章 方差分析及其应用,四、电子表格求解1、单因素方差分析 方差分析的计算工作量大,利用EXCEL中的“数据分析”功能,很容易能实现数据的处理。单因素方差分析实现过程:第一步,将实验数据输入到EXCEL工作表中;第二步,点击菜单栏“数据”,在右上方的“数据分析”找到并打开“方差分析:单因素方差分析”;第三步,在弹出的对话框中,根据需要和要求进行设置:(1)将待处理的数据一次性输入到“输入区域”;(2)选定分组方式,是列还是行;(3)选定“标志
23、位于第一行”,标志是数据所在列的名称;(4)在 中输入既定的显著性水平;(5)在输出选项中,指定结果放置。,2023/5/24,62,第5章 方差分析及其应用,四、电子表格求解2、两因素方差分析 EXCEL“数据分析”的两因素等重复方差分析实现过程:第一步,将实验数据输入到EXCEL工作表中,编辑数据时,把重复实验的结果放在行,每一行录入一个实验数据;第二步,点击菜单栏“数据”,在右上方的“数据分析”找到并打开“方差分析:可重复两因素分析”;第三步,在弹出的对话框中,根据需要和要求进行设置:(1)将待处理的数据一次性输入到“输入区域”;(2)在“每一行的样本数”中,输入重复实验的次数;(3)在
24、 中输入既定的显著性水平;(4)在输出选项中,指定结果放置。,2023/5/24,63,第6章回归模型及其应用,本讲的主要内容:一、简单线性回归分析二、多元线性回归分析三、简单非线性回归模型四、多元非线性回归模型五、线性回归分析的推广,2023/5/24,64,第6章回归模型及其应用,一、简单线性回归分析1、理论模型 为一组成对的样本观察,称刻画变量x与y关系的下列方程式为简单线性回归模型式中,y为因变量或被解释变量,x为自变量或解释变量,、为参数,表示截距,为回归系数,为随机项。,2023/5/24,65,第6章回归模型及其应用,一、简单线性回归分析2、求解3、抽样分布,2023/5/24,
25、66,第6章回归模型及其应用,一、简单线性回归分析3、区间估计与假设检验,2023/5/24,67,第6章回归模型及其应用,一、简单线性回归分析4、模型的代表性分析(1)残差图分析(2)拟合优度系数(3)估计标准误差,2023/5/24,68,第6章回归模型及其应用,一、简单线性回归分析5、EXCEL求解 EXCEL中,简单线性回归分析的求解过程:第一步,在工作表中录入数据;第二步,打开“数据”中的“数据分析”;第三步,打开“数据分析”中的“回归”,然后根据提示进行相应的设置:(1)将因变量数据输入到“Y值输入区域”,将自变量的数据输入到“X值输入区域”;(2)选定“标志”,如果没有X、Y观察
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 自考 30447 数据 模型 决策

链接地址:https://www.31ppt.com/p-4941184.html