第8章广义线性模型ppt课件.ppt
第8章 广义线性模型,回归分析中假定随机扰动服从这样的一些正态分布:其方差取常值,而均值则为附属数据的线性函数很多精算问题可以利用特殊的广义线性模型来处理,如方差分析,泊松回归以及Logistic对数(logit)与概率(Probit)模型等的几类。,精算数据与模型,实践中采集的数据往往显示方差要大于均值用于描述索赔额的分布通常具有厚重的右尾 有待建模的现象极少关于附属数据是可加的,一般往往可用乘法模型,广义线性模型,它允许偏离均值的随机误差服从不是正态分布。如,随机误差可服从指数散布族中的任一种分布,包含了泊松分布、(负)二项分布、伽玛分布与逆高斯分布等.并不要求随机变量的均值是解释变量的线性函数。但进行某些变换后它仍是是线性的譬如,当对数时,我们可以用乘法模型替代了加法模型,广义线性模型具有以下三个特征:,伽玛随机变量,逆高斯随机变量,上面所列的分布的均值。,注8.2.1(典则联结),注8.2.2(方差函数),以下依方差函数中 的幂次的升幂序,分别表述之:,8.3 若干传统的估计方法与广义线性模型,不妨先假定,逐项置换法,首先可将(8.4)中的第一组方程改写为,因此,方法8.3.8(边缘总和法),在一个“良好”的收费系统内,对于一个拥有众多被保险人的组合来说,保费总额相等于观测到的损失总额.,若将下述关系式代入上式:,方法8.3.10(最小二乘法关于正态的极大似然法),8.4偏差与比例偏差,显然,对全模型而言,借助逐项最大化(8.20)即知,对每一皆有如以表示偏差便得,这表明,对正态分布而言,最小化偏差(或等价地最大化似然函数)是和确定参数的最小二乘法等效的,此时,对全模型仍可得 这是因为,不难验证,此例中的偏差由下式给出:,自然,上式中 必须取正值,指数散布族,定义8.6.1(指数散布族)指数散布族密度具有以下形式,8.6广义线性模型,例8.6.2(指数散布族的若干成员)下述参数族是指数散布族中最重要的一些成员:,最后一种参数化称为是自然或典则参数化.,证明:由(8.33),我们有,其中:,这恰和通常的泊松分布的密度表达式是一致的。,推论8.6.9(指数散布族与Esscher 变换)一个连续密度 的以h 为参数的Esscher 变换是下述密度,显然,它仍是一个具有参数 和相同 的指数散布族成员的累积量数,注8.6.10(指数散布族中特定子类的生成)不难验证,以h 任况为参数的Esscher 变换完成下述分布间的转换:,