R语言课件(简略版).ppt
《R语言课件(简略版).ppt》由会员分享,可在线阅读,更多相关《R语言课件(简略版).ppt(97页珍藏版)》请在三一办公上搜索。
1、R语言,目录,计算机与R语言,第一章 网络基础知识及R介绍第二章 R语言基础第三章 数据的存储与读取第四章 R的图形功能第五章 R的程序设计第六章 综合实例,第二章 R语言基础,一、一个简短的R会话二、R的基本语法三、R的数据结构,一、一个简短的R会话,数据的描述?mtcarsmtcar:美国Motor Trend杂志收集的32辆汽车(1973-1974车型)的11项指标。,一、一个简短的R会话,数据的浏览所有数据mtcars 前6个观测值head(mtcars)后6个观测值tail(mtcars),一、一个简短的R会话,数据的编辑方法一:data.entry(mtcars)方法二:MTcar
2、sfix(mtcars)区别:edit()修改结果不存入mtcars中;fix()结果保存至mtcars中。,一、一个简短的R会话,浏览变量信息,例如mpg先激活数据集mtcars attach(mtcars)mpg 1 21.0 21.0 22.8 21.4 18.7 18.1 14.3 24.4 22.8 19.2 17.8 16.4 17.3 15.215 10.4 10.4 14.7 32.4 30.4 33.9 21.5 15.5 15.2 13.3 19.2 27.3 26.0 30.429 15.8 19.7 15.0 21.4,二、R语言的基本语法,1、符号1)命令或运算提示符
3、2)+续行符3)#说明语句字符2、赋值符号1)-2)=,二、R语言的基本语法,3、基本算术运算1)+加号2)-减号3)*乘号4)/除号5)%取模6)%/%整除7)乘方,运算优先级别递增+-*/%,%/%TRUE=1;FALSE=0,二、R语言的基本语法,4、比较运算符1)大于2)=大于等于 4)=小于等于5)=等于6)!=不等于比较运算得到的结果是逻辑常量TRUE(真)和FALSE(假)。,5、逻辑运算符1)!x逻辑非当前逻辑值取反运算。2)x&y 逻辑与如果两个表达式的值均为TRUE,结果才为TRUE,否则为FALSE。3)x&y逻辑与若x,y为向量只比较第一个元素。,二、R语言的基本语法,
4、二、R语言的基本语法,4)x|y 逻辑或如果x和y的值均为FALSE,结果才为FALSE,否则为TRUE。向量对每个元素进行比较。5)x|y逻辑或若x和y为向量只比较第一个元素。6)xor(x,y)异或两个逻辑值不相同,则异或结果为真。反之,为假。,二、R语言的基本语法,6、求助符号1)?2)help(),7、常量和变量1)常量是其值不变的量,如1234,“abc等数值、字符串和逻辑值等。2)变量是其值可变的量,如x-3,x就是一个变量,当x-4时,x的值被重新赋值为4。变量名由字母、数字和下划线组成,变量的第一个字符为字母。3)显示变量列表:显示现在内存中已创建的变量名,使用ls()函数。4
5、)显示变量值:直接输入变量名或使用print()函数5)清除:将变量从内存中清除,使用rm()。,思考题:下列()表示的是变量。A.123B.TRUEC.InfD.abc下列()不可以作为变量名。A.1a2bB.a1b2C.a_b下列()可以作为变量名。A.TRUEB.InfC.TrueD.NaN下列赋值语句错误的是()。A.a-1B.a=1C.1=aD.A_1-”1”,三、R语言的数据结构,1、R的对象与属性R通过一些对象来运行,对象包括数据类型和长度两个内在属性。数据类型是对象元素的基本种类,共有四种:数值型(numeric)字符型(character)逻辑型(logical)复数型(co
6、mplex),三、R语言的数据结构,数值型:包括整型(integer)、双精度实型(double),对很大的数据则可用指数形式表示例如:1、0.5、-0.5、2.1e23(指数形式表示的数值)。R可以表示无穷的数值,用Inf和-Inf表示+和-,或者用NaN表示不是数字的值(Not a Number的意思)。例如:5/0显示的结果为Inf、Inf-Inf显示的结果为NaN。,三、R语言的数据结构,字符型:使用”双引号或单引号作为定界符。例如:abc、R语言、123、123-321abc、R语言、123、123-321 如果需要在字符型数据中引用双引号或单引号的话,可以在双引号前加上反斜杠。例如
7、:Tom said:Hello!或者使用单引号作为定界符例如:Tom said:Hello!、Tom said:Hello!对于单引号也是一样。例如:13 12、13 12、1312,三、R语言的数据结构,逻辑型:TRUEFALSE缺失数据用NA(Not Available的意思)来表示。NA是逻辑常量。,三、R语言的数据结构,数据对象的长度是对象中元素的数目。函数mode()可以得到对象的类型,length()可以得到对象的长度。例如xmode(x)1 numericlength(x)1 1mode(a)-CHINA;mode(compare)-TRUE;mode(z)-1i1 charac
8、ter2 logical3 complex,三、R语言的数据结构,思考题:下列不是数值型数据的是()。A下列是字符型数据的是()。A.TRUEB.1e2C.123 D.5+1i下列字符型定界符用法错误的是()。A ab c B.ab c C.abc D.ab c 下列是逻辑型数据的是()。A TrueB.FALSEC.InfD.NaNInf是()型的数据。A.数值型B.NA型C.字符型D.逻辑型,三、R语言的数据结构,统计实例例:一家保险公司收集到由36个投保个人组成的随机样本,得到每个投保人的年龄(周岁)数据如表所示。试确定投保人平均年龄90%的置信区间。,三、R语言的数据结构,注:置信区间
9、是指数据可靠程度的范围。90%指置信水平。求置信水平下的置信区间公式为:即x的均值加减常用置信水平的正态分布的临界值乘以样本标准差与样本个数开方的差。90%-=1.64595%-=1.9699%-=2.58,三、R语言的数据结构,x-c(23,35,39,27,36,44,36,42,46,43,31,33,42,53,45,54,47,24,34,28,39,36,44,40,39,49,38,34,48,50,34,39,45,48,45,32)m-mean(x)s-sd(x)z1-m+1.645*(s/sqrt(36)z2-m-1.645*(s/sqrt(36)z-c(z1,z2)z,注
10、:新建程序脚本实现,三、R语言的数据结构,三、R语言的数据结构,说明:向量是一个变量,是R中最常用、最基本的操作对象;因子是一个分类变量;数组是一个k维的数据表;矩阵是数组的一个特例,其维数k=2。注意:数据或者矩阵中的所有元素都必须是同一种类型的;数据框是由一个或几个向量和(或)因子构成,它们必须是等长的,但是可以是不同的数据类型;“ts”表示时间序列数据,它包含一些额外的属性,例如频率和时间;列表可以包含任何类型的对象,包括列表。,三、R语言的数据结构,2、向量的建立 1)建立数值型向量数值型向量是统计分析中最常用的向量,可以用下面四个函数建立:(1)seq()或“:”#若向量序列具有较为
11、简单的规律(2)rep()#若向量序列具有较为复杂的规律(3)sequence()#输出从1到参数的向量(4)c()#若向量序列没有什么规律(5)scan()#通过键盘逐个输入,三、R语言的数据结构,1、n1:n2#生成从n1到n2步长为1(或-1)的向量例如:1:101 1 2 3 4 5 6 7 8 9 10 a 1:(10-1)1 1 2 3 4 5 6 7 8 9 1:10-11 0 1 2 3 4 5 6 7 8 9,三、R语言的数据结构,2、seq(n1,n2,by=n3,length=n4)#生成从n1到n2的向量,n3为步长,n4为生成元素的数量 seq(1,10)1 1 2
12、3 4 5 6 7 8 9 10 seq(1,5,by=0.5)1 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 seq(1,10,length=11)1 1.0 1.9 2.8 3.7 4.6 5.5 6.4 7.3 8.2 9.1 10.0,三、R语言的数据结构,3、rep(n1,n2)#生成n1重复n2次的向量 rep(2,3)1 2 2 2 rep(1:5,2)1 1 2 3 4 5 1 2 3 4 5 rep(1:5,1:5)1 1 2 2 3 3 3 4 4 4 4 5 5 5 5 5 rep(1:5,rep(2,5)1 1 1 2 2 3 3 4 4 5
13、 5,三、R语言的数据结构,4、c()#直接输出向量 x=c(42,7,64,9)length(x)5、scan()#通过键盘建立向量 scan()1:1 3 6 8#此行末打一空格后回车5:#冒号后直接打回车Read 4 items1 1 3 6 8,三、R语言的数据结构,6、sequence(n1)#生成从1开始到n1结束步长为1的向量 sequence(5)1 1 2 3 4 5 sequence(c(5,5)1 1 2 3 4 5 1 2 3 4 5 sequence(c(5,4)1 1 2 3 4 5 1 2 3 4,思考题:下列()不能生成向量(1 5 4 3 2 1)。A.5:1
14、 B.6-1:5 C.seq(1,5,by=-1)D.6-sequence(5)下列()不能生成向量(1 1 2 3 4 5 1 2 3 4 5)。A.rep(1:5,2)B.sequence(rep(5,2)C.1:10%6D.(0:9%5)+1,三、R语言的数据结构,2)数值型向量的运算向量的运算方法如下:(1)向量与一个常数的加、减、乘、除为向量的每一个元素与此常数进行加、减、乘、除;(2)向量的乘方()与开方(sqrt)为每一个元素的乘方与开方,这对log,exp,sin,cos,tan 等普通的运算函数同样适用;(3)同样长度向量的加、减、乘、除等运算为对应元素进行加、减、乘、除等;
15、(4)不同长度向量的加、减、乘、除遵从循环法则(recycling rule),但要注意这种场合通常要求向量的长度为倍数关系,否则会出现警告:“长向量并非是短向量的整数倍”。,三、R语言的数据结构,循环法则:同一个表达式中的向量并不需要具有相同的长度,如果它们的长度不同,表达式的结果是一个与表达式中最长向量有相同长度的向量,表达式中较短的向量会根据它的长度被重复使用若干次(不一定是整数次),直到与长度最长的向量相匹配,而常数将被不断重复。,三、R语言的数据结构,sqrt(c(2,4,25)1 1.414214 2.000000 5.000000 1:2+1:41 2 4 4 6 1:4+1:7
16、1 2 4 6 8 6 8 10警告信息:In 1:4+1:7:长的对象长度不是短的对象长度的整倍数,例子:5+c(4,7,17)1 9 12 22 5*c(4,7,17)1 20 35 85 c(-1,3,-17)+c(4,7,17)1 3 10 0 c(2,4,5)21 4 16 25,统计实例两变量线形相关系数的计算。在-1和+1之间波动,其绝对值越接近1,两个变量间的直线相关越密切。例题:trees数据集中树木高度(Height)和木材体积(Volume)的相关关系分析。(1)绘制散点图(2)计算相关系数值。,三、R语言的数据结构,3)建立字符型向量1.c()直接输入向量例如:c(a,
17、b,1,1e2,TRUE)#数字、逻辑型数据被强制转换为字符串1 a b 1 100 TRUE,2.paste()接受任意字符,并顺次组合连成字符串,在默认情况下,各字符串由一个空格分隔,可以通过sep=string把它更改为其他字符,包括空字符串。paste(a,1)1 a 1 paste(c(a,b),1)1 a 1 b 1 paste(c(a,b),c(1,2)1 a 1 b 2 paste(app,le,sep=)1 apple,三、R语言的数据结构,例子z-c(green,blue sky,-99)paste(1:12)paste(A,1:6,sep=)labs-paste(c(X,
18、Y),1:10,sep=)paste(Today is,date(),3.rep()#生成重复的向量例如:rep(a,3)1 a a arep(c(a,b),3)1 a b a b a brep(c(a,b,c),rep(2,3)1 a a b b c c,4)建立逻辑型向量 1.c()直接输入向量例如:c(TRUE,FALSE,TRUE)1 TRUE FALSE TRUE2.rep()#生成重复的向量例如:rep(c(TRUE,FALSE),2)1 TRUE FALSE TRUE FALSE3.由运算生成例如:1:531 FALSE FALSE FALSE TRUE TRUE,三、R语言的数
19、据结构,5)建立因子型向量 一个因子(factor)或因子向量不仅包括分类变量本身,还包括变量不同的可能水平。factor(x,levels=sort(unique(x),na.last=TRUE),labels=levels,exclude=NA,ordered=is.ordered(x)说明:这里x可以是数值型或字符型向量。levels用来指定因子的水平(缺省值是向量x中不同的值);labels用来指定水平的名字;exclude表示从向量x中剔除的水平值;ordered是一个逻辑型选项,用来指定因子的水平是否有次序。,三、R语言的数据结构,(1)将字符型向量转换为因子 a a a1 gre
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 课件 简略

链接地址:https://www.31ppt.com/p-5576132.html