第十章药学导论 药学统计学及药学信息学课件.ppt
《第十章药学导论 药学统计学及药学信息学课件.ppt》由会员分享,可在线阅读,更多相关《第十章药学导论 药学统计学及药学信息学课件.ppt(138页珍藏版)》请在三一办公上搜索。
1、第十章 药学统计学与 药学信息学,药学导论,统计学(statistics):研究数据的收集、描述、分析、综合和解释,以获得新信息、作出新推断的学科。包括: (1)制定调查方案和设计科学实验 (2)描述实验数据 (3)进行假设检验 (4)获知变量间的定量关系,概 述,第一节 几个基本统计学概念,频率:概率:,一、必然事件与随机事件,必然事件:某条件实现后一定发生或一定不发生的事件随机事件:一定条件下,不一定发生的事件,二、频率与概率,描述随机事件发生可能性大小的数值,随机事件概率的大小在0与1之间,P越接近1,表示某事件发生的可能性越大;P越接近0,表示某事件发生的可能性越小。习惯上将P0.05
2、的事件,称为小概率事件,表示在一次实验或观察中该事件发生的可能性很小,可视为不发生。,在现实中,随机事件的概率往往是未知的,因此,当观测单位足够多时,常用样本中事件的实际发生率来估计总体概率,这种实际发生率称为频率。设在相同条件下,独立重复进行n次试验,事件A出现t次,则事件A出现的频率为tn.如治疗200例患者,120名患者治愈,治愈率为60,这就是一个频率。当观测单位较少时,用频率估计概率是不可靠的。,1. 总体与样本的关系 样本参数用英文字母表示 总体参数用希腊字母表示,三、总体与样本,2. 取样的随机性 随机性包括: 总体中个体的抽取必须是相互独立的; 总体中所有个体被抽取的机会相等。
3、 满足以上两个要求的取样,称为简单随机取样(SRS,simple random sampling) 这样抽取的样本称为简单随机样本。,四、观测值的特征集中位置与离散程度,量度集中位置的统计量(1)均值 样本均值 总体均值 E(X)取值概率XiPi 均值的重要性质: 观测值与均值之差(偏差)之和 偏差的平方和 最小,(2)众数 频数最大的观测值叫众数,常用于表示离散型随机变量的集中位置。(3)中位数 把变量的观测值按大小顺序排列,排在当中的一个观测值叫中位数。,(1)极差 (最大值和最小值之差) RXmaxXmin(2)平均(绝对)偏差,2. 量度数据离散程度的统计量,(3)方差 式中n1在统计
4、学中叫自由度(degree of freedom),常用希腊字母表示,五、两个典型的概率分布,1. 二项分布是典型的离散型概率分布(1)特点: 二项分布是一种每次试验只有两种可能结果而不受以前实验影响的分布。在样本容量相对于总体很小时,取样试验后,返回不返回,对下一次试验的结果无影响。,(2)二项分布的均值、方差、标准差 均值np 方差npq 标准差(3)二项分布的实际意义 一些只有两个结果的互斥事件都与二项分布有关,在药学方面,可用于分析从制剂批抽出n个个体中不合格个体数的概率。,2. 正态分布是一种连续型概率分布,各种分布都以它为中心在一定条件下相互转化。 设连续性随机变量X的概率密度为
5、则称X服从参数为、 (- + , 0)的正态分布,记为XN( , ),(1)特点: 极大值在; 以X为对称轴; X轴是渐进线;拐点在X。,(2)标准正态分布一般的正态分布取决于均值和标准差 计算概率时 ,每一个正态分布都需要有自己的正态概率分布表,这种表格是无穷多的若能将一般的正态分布转化为标准正态分布,计算概率时只需要查一张表,任何一个一般的正态分布,可通过下面的线性变换转化为标准正态分布,(3)标准正态分布表的使用将一个一般的转换为标准正态分布计算概率时 ,查标准正态概率分布表对于负的 x ,可由 (-x) x得到对于标准正态分布,即XN(0,1),有P (a X b) b aP (|X|
6、 a) 2 a 1对于一般正态分布,即XN( , ),有,六、均值的分布和中心极限定理,均值的分布 如一个随机变量X呈总体均值为、总体方差为2的正态分布,则其容量为n的样本均值 也呈正态分布,其总体均值仍为,但总体方差为2 /n,即,2. 中心极限定理 设从均值为,方差为 2的一个任意总体中抽取容量为n的样本,当n充分大时,样本均值的抽样分布近似服从均值为、方差为2/n的正态分布,第二节 取样,按与调查目的有关的某个主要性标志将总体单位划分为若干层(也称类、组或子总体),然后从多层中按随机原则分别抽取一定数目的单位构成样本。,一、随机取样与随机数表,简单随机抽样是最基本的抽样组织方式。是对总体
7、单位不进行任何划分或排队,完全随机地直接从总体中抽取样本单位,使每个总体单位都有完全均等的机会被抽中。,二、分层取样,在大规模生产中,表明供应方产品质量特征的随机变量应不超出某规定范围。,三、系统取样,常用于质量控制,每第n个个体选取一个,但最初选取的个体是随机的。,四、验收取样,第三节 数据制图,与统计方法有关的图解: 以传递信息为目的的图解: 如直方图、条形图 在坐标中描述变量之间关系的图解,一、引言,在许多研究数据中,响应Y的对数而不是Y本身与独立变量X呈线性关系,这样就要进行半对数标绘,即变量X的坐标是自然数而响应(函数)Y的是它的对数logY。,二、描述频数的图解,直方图、条形图、扇
8、形图,三、描述变量关系的标绘图,第四节 统计估计和假设检验,样本统计量均值 和方差S2分别是其总体均值和总体方差2的最佳估计。 置信区间(confidence interval):是我们相信统计量如总体均数所在的区间,由总体的性质、参数的样本估计值和想达到的置信度决定。 以样本均值为对称中心的双侧置信区间: P置信区间,一、统计估计,1. 用t分布确定置信区间 P置信区间2. 几个不同置信区间的构造(1)未知,需要由样本估计(2)已知,直接代入公式(3)比率的置信区间,一、统计估计,二、假设检验,1. 引言(1)概念事先对总体参数或分布形式作出某种假设然后利用样本信息来判断原假设是否成立(2)
9、类型参数假设检验非参数假设检验(3)特点采用逻辑上的反证法依据统计上的小概率原理,零假设(null hypothesis): 关于两个总体在某一参数如均值上一致(实际上差异为零)的假设H0。 如 H0:12 备择假设(alternative hypothesis):如果舍弃H0则接受Ha,Ha也可用H1表示。 如Ha:12,例:表 观测单一总体均值的实验示例,对此例中每一类问题的假设检验,可提出三个假设检验:H0:=0,Ha: 0 H0:=0,Ha:0,2. 检验假设的步骤(1)提出检验统计量T并进行实验(2)提出零假设H0和备择假设Ha(3)规定显著性水平 显著性水平:即根据统计检验的结果舍
10、弃零假设H0(存在显著差异)而实际上不存在的概率。(4)计算检验统计量T并进行显著性检验,3. 几种具体的假设检验(1)已知的单样本双侧均值检验(2)已知的单样本单侧均值检验(3)未知的单样本双侧均值检验 先求t值,再计算置信区间,进行t检验(4)独立样本方差S12和S22的比较:F检验,1. 什么是回归分析:从一组样本数据出发,确定变量之间的数学关系式对这些关系式的可信程度进行各种统计检验,并从影响某一特定变量的诸多变量中找出哪些变量的影响显著,哪些不显著利用所求的关系式,根据一个或几个变量的取值来预测或控制另一个特定变量的取值,并给出这种预测或控制的精确程度,第五节 回归分析,2. 回归模
11、型的类型,3. 回归模型(1)回答“变量之间是什么样的关系?”(2)方程中运用1个数字的因变量(响应变量)被预测的变量1个或多个数字的或分类的自变量 (解释变量)用于预测的变量(3)主要用于预测和估计,概念要点(1)当只涉及一个自变量时称为一元回归,若因变量 y 与自变量 x 之间为线性关系时称为一元线性回归(2)对于具有线性关系的两个变量,可以用一条线性方程来表示它们之间的关系(3)描述因变量 y 如何依赖于自变量 x 的方程称为回归模型,5. 简单线性回归方程的形式如下 Y = 0+ 1 x 方程的图示是一条直线,因此也称为直线回归方程 0是回归直线在 y 轴上的截距,是当 x=0 时 y
12、 的期望值 1是直线的斜率,称为回归系数,表示当 x 每变动一个单位时,y 的平均变动值,6. 最小二乘法 回归直线是对若干个数据对(X,Y)绘制的,但由于遵守正态分布的实验误差,数据对中两个以上的点,不能恰好在一条直线上,即恰好通过所有数据点的直线是找不到的,只能找到一条离所有点都近的直线,所用的客观方法叫最小二乘法(method of least squares)。,7. 最小二乘线 (1)定义 给定n个数据对(X,Y),找到一条规定X,Y关系的直线,使所有数据对(X,Y)与拟规定的直线在Y轴方向的距离平方和最小用数学语言表示就是 最小,这样的一条直线就是描述X,Y间关系的最佳直线,称为最
13、小二乘线。,(2)图示,(3) 和 的计算公式,二、回归分析在药物研究中的应用,例:把6个浓度按两倍递增的纯青霉素溶液(132U/ml)置于进行生物测定的杯碟中。下表给出每一浓度以mm表示的抑菌圈直径,在这个长度的测量中发生较大的误差。如果对青霉素溶液的浓度C取以2为底的对数(笔,binit),则抑菌圈的直径与青霉素溶液的浓度成线性关系。试求Y在X上的回归直线方程。,表 青霉素溶液浓度的对数变换,解 进行Y在X上的回归计算 X15 n6 Y122.42 2.50 20.40 X255 XY337.24 Y22553.3880 于是Y在X上的回归直线方程是 15.941.782X,第六节 实验设
14、计,1. 基本原理(1)对照:齐同可比(2)重复:获得总体标准差的估计值 用大容量样本重复多次获得的均值,能把因素在实验中的效应估计得更精密。(3)随机:有助于把可能存在得外部因素效应平均化而减免。,一、实验设计的基本原理,2. 步骤 确认并陈述问题 选择因素和水平 选择响应变量 选择实验设计 进行实验 分析数据 做结论并提建议,二、方差分析(analysis of variance,ANOVA),方差分析能确定引起生产和实验结果有差异的诸因素各自的单独作用和彼此的交互作用。 变差的大小通常用变差平方和(简称平方和)表示 平方和的加和性:总平方和等于各因素平方和与误差平方和之和,即 SStot
15、SSASSBSSe,三、实验设计的分类,1. 两类基本的实验设计 等级分类 交叉分类2. 两类不同性质的因素 固定的 随机的3. 配置完整和不完整,第七节 几个现代统计方法,1. 概述 蒙特卡洛方法根据模拟抽样的结果估算求解问题解X的近似值。这样的近似值通常是以一个数学期望等于X的统计量的样本均值给出。2. 分类 SS,SS,SM,MS,SMS3. 一个例子制剂含量均匀度计量型检查法的制定,一、蒙特卡洛方法随机现象的统计模拟,二、模拟识别(pattern recognition),1.概述 模式识别不需要数学模型,只需要找到互不相同的数据间的关系,可处理代表模式而维数大于三的数据。2.一般步骤
16、和分类(1)步骤:数据即观测值的收集、表示和预处理; 特征提取和选择; 分类、决策(2)分类:非参数法;参数(贝叶斯)法3.中药质量的化学模式识别,2. 药学信息学,2.1 信息2.2 信息的相关概念2.3 信息管理2.4 药学信息管理,信息概念是十分复杂的。我们在讨论信息的定义时,必须注意定义的条件和范围。引入不同的约束条件,将会得到不同的信息定义。为了对信息概念有一个更为清晰的认识。 我们首先从本体论和认识论两个层次上来讨论信息概念的定义,并进行比较。 (1)本体论层次的信息定义 信息是事物存在的方式和运动状态的表现形式。,2.1.1 信息的含义,存在于人类社会、思维活动和自然界中一切可能
17、的对象,事物的内部结构和外部联系,一切意义上的变化,包括机械的、物理的、化学的、生物的、思维的和社会的运动,事物在时间和空间上变化所展示的特征、态势和规律,2.1 信息,(2)认识论层次的信息定义信息是主体所感知或表述的事物存在的方式和运动状态。,外部世界向主体输入的信息,主体向外部世界输出,(3)两种不同层次的信息定义比较 在本体论层次上信息的存在不以主体的存在为前提,即使根本不存在主体,信息也仍然存在。因此,完全可以认为,在人类出现以前,信息就已经客观存在,只是没有人去感知、表述和利用而已。 在认识论层次上则不同,没有主体,就不能认识信息也就没有认识论层次上的信息。因此也可以说,在人类出现
18、之前,根本就不存在信息。 认识论层次的信息概念比本体论层次的信息概念具有更为丰富的内涵.这是因为下述三个方面的缘由 首先,作为主体的人具有感知能力能够感知到事物的存在和运动状态; 其次,人具有理解能力,能够理解事物的存在和运动状态的特定含义; 第三,人具有目的性,能够判断事物的存在方式和运动状态对其目的而言的效用价值。 上述三个方面是相互依存不可分割的。只有在感知了事物的存在方式和运动状态的形式,理解了它的含义,明确了它的效用之后,才算真正掌握了这个事物的信息,才能做出正确的决策。我们把同时考虑到事物存在方式和运动状态的外在形式、内在含义和效用价值的识论层次上的信息称为“全信息”,,将仅考虑其
19、中形式因素的信息称为“语法信息”,将仅考虑其中内容(含义)因素的信息称为“语义信息”,将考虑其中效用因素的信息称为“语用信息”。因此,认识论层次的信息是同时考虑语法信息、语义信息和语用信息的全信息。,全信息,形式因素,语法信息,(Syntactic Information),内容(含义)因素,语义信息,效用因素,语用信息,(Semantic Information),(Pragmatic Information),(Comprehensive Information),(4)信息与物质、能量的关系 信息与物质、能量的差异 A 信息是物质的属性而不是物质本身。 信息可以脱离物质而独立存在,同时又
20、不影响物质的存在与运动,它所表现的主要是物质运动的状态与方式,是物质之间的联系与相互作用。我们可以用一个很简单的例子来解释这个现象。比如在心电检查过程中,被检查者心脏运动状态及其状态的改变可通过心电图记录下来,医生可以从心电图的波动曲线变化情况分析判断被检查者心脏健康状况。此时,记录下来的仅仅是能够反映心脏功能状态的信息,而不是心脏实体。 B 信息是物质的运动状态或方式,而能量则是物质做功的动力。, 信息与物质、能量之间的联系 A 物质是信息的源泉。 任何物质的运动过程同时也是信息运动的过程,而任何信息运动的过程都离不开物质的运动过程,即信息不能脱离物质而单独存在。 B 信息与能量密不可分。
21、信息的获取和传递离不开能量,能量的转换也离不开信息。传输信息或处理信息总需要一定的能量来支持,而控制和利用能量总需要有信息来引导。 C 信息与物质、能量可以相互转化。 信息虽然既不是物质也不是能量。但在一定条件下,信息可以转化成物质和能量。最主要的条件是信息必须被人们有效地利用。正确而有效地利用信息,就可能在同样的条件下创造更多的物质财富和能量,2.1.2 信息的类型,(1)信息的类型,按信息的来源,自然信息社会信息,按信息的逻辑层面,语法信息语义信息语用信息,按信息的运动状态,动态信息:时间性很强的新闻和情报静态信息:比较稳定的历史文献、资料和知识的信息,按对信息的感受方式,直接信息间接信息
22、,按信息产生的时间,历史信息:历史记载、档案资料等人类历史上的信息现时信息:关于当今社会发展变化的信息,涉及当前社会生活的一切领域未来信息:人类对未来社会的关注以及未来学、预测学的研究,利用者(认识主体)观察的角度和过程,在理想观察条件下认识主体所获得的关于事物的全部信息,实在信息,先验信息 认识主体具有的记忆能力,实得信息 认识主体具有的学习能力,信息的传递方向,纵向信息横向信息网状信息,信息的流通渠道,正式信息非正式信息,信息的记录方式,语音信息图像信息文字信息数字信息计算信息,(2)药学信息的类型 人体内信息药学信息的存在方式 人体外信息 人体内信息是指药物与生命现象有关的在人体内不同层
23、次发生、传递、接收并执行生命系统功能的各种信息。主要包括:药物与生命遗传有关的信息、药物与生命活动的调控有关的信息、药物与生物电磁有关的信息、药物与脑和神经系统有关的信息、药物与视觉和光处理有关的信息、药物与生物体结构和微光机电系统有关的信息、药物与基因芯片和蛋白质芯片有关的信息等。值得关注的是对基因层次的信息研究是近年来生物信息学研究的重点,并由此形成新的分支学科药物基因组学(pharmacogenomics),包括选择个体中有关药物的作用、活性、排除候选基因和鉴别基因序列中的差异。通过分析评价这些差异在药物中的作用功能,以及在种群中表型差异,开发出适合个体的药物,实现个体化用药,从而最大限
24、度地减少药物的毒副作用,获得最优化的疗效。 人体外信息是药学研究、药物生产、流通和使用等有关的各种信息。主要包括:与临床观察、疾病诊断和治疗有关的信息、与临床用药决策有关的信息、与计算机药学应用系统有关的信息、与药学研究和开发有关的信息、与药学信息处理有关的信息、与药学数据库有关的信息、与社区医疗用药有关的信息、与公共卫生和卫生保健有关的信息、与药学教育与管理有关的信息等。从信息管理的角度人体外信息是药学信息管理的主要对象。,药学信息的来源,系统内部的信息主要来自药学领域各业务部门、用药活动全过程、药学科学和技术的发展以及医药卫生行政管理等。并以统计、报表、原始数据、分析、总结、资金、供应、库
25、存、设备、规章、标准等形式表现出来,多属一次信息。系统内部的信息是药学信息的重要来源也是获取药学信息的重要渠道。 系统外部的信息是指反映医药卫生系统外部环境变化的信息。各种类型的相关学科文献、各级政府和相关部门、社会组织和学术团体以及普通公民,都可能提供、传递和使用药学信息。,系统内部的信息,系统外部的信息,药学信息学,药研信息学药疗信息学药市信息学药事信息学,药学技术信息学,药学服务信息学,生物系统技术信息学基因技术信息学免疫技术信息学毒理学技术信息学 化学反应技术信息学代谢组技术信息学中药信息学,图 药品从研发到上市流程图,图 技术信息学的含义,图 技术信息学的反复叠代过程,图 新药产品到
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 第十章 药学导论 药学统计学及药学信息学课件 第十 药学 导论 统计学 信息学 课件
链接地址:https://www.31ppt.com/p-1455407.html