【教学课件】第二讲R语言的基本数据结构.ppt
《【教学课件】第二讲R语言的基本数据结构.ppt》由会员分享,可在线阅读,更多相关《【教学课件】第二讲R语言的基本数据结构.ppt(54页珍藏版)》请在三一办公上搜索。
1、第二讲 R语言的基本数据结构,作业1:按下面表格的形式生成本组信息的数据框,并提交原程序.Name为字符型、ID为数字型、Team.Num为分组因子、Duty为分组因子、Grade1-5为数值型,Base:is.thingsBase:recursionGraphics:HersheyGraphics:JapaneseGraphics:graphicsGraphics:imageGraphics:perspGraphics:plotmathLattice:intervalsLattice:labelsLattice:latticeLattice:panelStats:glm.vrStats:lm
2、.glmStats:nlmStats:smooth,作业2:利用sample函数设计算法,把下面16个demo公平地分配给15个组,并提交原程序,一、R语言的对象,所有在R语言中可操作的各种数据及各种表达式等都叫R语言的操作对象。,对象命名:1、对象的名字必须是以一个字母开头(AZ 或az),中间可以包含字母,数字(09),点(.)及下划线(_);2、R对对象的名字区分大小写;3、避免用R的各种包中的既有对象名来对对象命名:例如,if、for、pi等3、可以通过输入一个对象的名字来显示其内容,例如,一个名为n的对象,其内容是数值10:n 1 10,对象的产生、查询及删除,1、赋值:namels
3、()ls(pat=“m”)ls.str()/将会展示内存中所有对象的详细信息,3、删除:rm(x)删除内存中所有对象:rm(list=ls()注:ls()函数中的一些选项同样可以运用到 rm中来,对象的基本属性,每个对象包含很多基本属性,常用的有对象的类型、存储类型、对象模式、对象长度、对象维度、对象名称等。,数值型Numeric 如 100,0,-4.335字符型Character 如“China”逻辑型Logical 如TRUE,FALSE因子型Factor 表示不同类别复数型Complex 如:2+3i,对象的类型:mode(object),对象的长度:length(object);,f
4、ruit names(fruit)mode(fruit)1 numeric length(fruit)1 4,对象属性的转换,常用对象转化函数as.character()#转换为字符型as.numeric()#转换为数值型as.logical()#转换为逻辑型plex()#转化为复数型as.factor()#转化为因子型methods(as)#methods包中的全部转换函数methods(is)#methods包中全部对象类型判别函数,二、数据的创建,三、数值向量,1、规则序列xxyyxxrep(1,time=30)#创建一个所有元素都相同的向量sequence(4:5)#创建一系列联系的整
5、数序列 1 1 2 3 4 1 2 3 4 5,gl(k,n)/k是水平数,n是每个水平重复的次数,有两个选项:length用来指定产生数据的个数,labels用来指定每个水平因子的名字gl(3,5)gl(3,5.4)#?,2、随机序列 R可以产生多种不同分布下的随机数序列。sample(1:40,5)1 25 32 2 35 9sample(c(H,T),10,replace=T)1 H H T H H T H H H H“,分布函数的形式rfunc(n,p1,p2,.),其中func指概率分布函数,n为生成数据的个数,p1,p2,.是分布的参数数值。如:rnorm#随机产生正态分布的数据
6、rnorm(100,2,5)#mean=1,sd=5 随机分布函数rfunc r:random 密度函数dfunc d:density 累计概率密度函数pfunc p:probability 分位数函数qfunc q:quantile,3、分布函数,plot(rnorm(100,2,5),x plot(x,dnorm(x),type=l),逻辑向量,逻辑向量包含TRUE、FALSE和NA(not availabe)逻辑向量可以同数值向量一起运算:TRUE=1,FALSE=0 SequenceNum Logicvector2.5 logicvector 错误:找不到对象logicvector L
7、ogicvector 1 FALSE FALSE TRUE TRUE,c(1:3,NA)-NaData NaData1 1 2 3 NA NaData8 NaData1 1 2 3 NA NA NA NA 8 is.na(NaData)1 FALSE FALSE FALSE TRUE TRUE TRUE TRUE FALSE,字符向量,可以用两个单引号()或两个双引号(“)去界定字符向量“/”用来识别字符串中包含的()或(“)例子:UserInfor UserInfor1 name users password e-mail“labs labs 1 X1 Y2 X3 Y4 X5 Y6 X7 Y
8、8 X9 Y10,复数向量,z z 1 1.0464457+1.4921546i-0.0857576+0.6500323i-0.4077956+0.7363948i 4 1.2992962+1.0821262i-1.3359859-2.2430534i 1.0756972+1.4531898i 7 1.1084957+0.6604677i 1.2716703+0.4288688i 0.2792403+0.4181003i zz zz.shift zz.shift,五、分组因子,R语言可以将一套数据中相同分类的数据进行分组,所用组别对象称为分组因子可以用factor()函数生成一个分组因子分组因
9、子可以方便地对分组数据做相应计算,如:计算平均值、总和或按某种函数形式例子:factor(sample(letters,10,replace=T),levels=letters)1 g b w j c z o d p q Levels:a b c d e f g h i j k l m n o p q r s t u v w x y z,六、数组及矩阵,数组是带多个下标的、类型相同的元素的多维数据集合,类型有数值型、字符型、逻辑型、复数型等矩阵为二维数组一维数组并不等效为向量除了类型和长度等基本属性外,数组还有一个特殊属性叫做维数向量,用dim()定义,数组定义,FirstArray Firs
10、tArray 1 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 dim(FirstArray)FirstArray#数组的填充规则:越靠前的下标变化越快;#越靠 后的下标变化越慢,1,1,2,3,41,1 4 7 102,2 5 8 113,3 6 9 12,2,1,2,3,41,13 16 19 222,14 17 20 233,15 18 21 24,#等价于 FirstArray-array(seq(1:24),dim=c(3,4,2),Dimnames属性,Prices Prices 64M 128M 25
11、6Mvender1 20 22 76vender2 24 56 87,Prices,c(“64M”,“256M”)#通过维名访问数组 64M 256Mvender1 20 76vender2 24 87,向量,数组的混合运算,规则:1、表达式中各元素匹配时,总是从左到右。2、在进行计算时比较短的向量会扩展数据以适应最大数量元素的操作数。扩展数据的基本规则为循环地从第一个元素开始填充所需要的数据。3、所有的数组必须具有相同的dim属性,否则返回一个错误。4、任何一个向量的操作结果的长度大于数组间操作结果的长度时,R语言会产生错误。5、如果数组间操作无误,那么计算结果也是一个相同维度的数组。,a1
12、 a2 a1,1,2,31,1 5 92,2 6 103,3 7 114,4 8 12 a2,1,2,31,1 4 72,2 5 83,3 6 9 a1+a2错误于a1+a2:非整合陈列,a2 a2,1,2,31,1 5 92,2 6 13,3 7 24,4 8 3 a1+a2,1,2,31,2 10 182,4 12 113,6 14 134,8 16 15 a1*a2,1,2,31,1 25 812,4 36 103,9 49 224,16 64 36,不同dim属性,相同dim属性,不同dim属性,相同dim属性,a3 a3,1,2,31,1 2 3 a2+a3错误于a2+a3:非整合陈
13、列,一维数组并不等效为向量,a4 a41 1 2 3 a4+a2,1,2,31,2 7 122,4 9 23,6 8 44,5 10 6,向量与数组运算,a5 a4+a51 2 4 6 5 7 9 8警告信息:In a4+a5:长的对象长度不是短的对象长度的整倍数,不同长度的向量运算,a6 a6+a2错误:dims product 12与对象长度13不匹配此外:警告信息:In a6+a2:长的对象长度不是短的对象长度的整倍数 a7 a7+a2错误:dims product 12与对象长度24不匹配,一维数组并不等效为向量,不同长度的向量运算,两个数组的外积,A B A,1,21,1 32,2
14、4 B,1,2,3,41,1 4 7 102,2 5 8 113,3 6 9 12,B%o%A,1,1,1,2,3,41,1 4 7 102,2 5 8 113,3 6 9 12,2,1,1,2,3,41,2 8 14 202,4 10 16 223,6 12 18 24,1,2,1,2,3,41,3 12 21 302,6 15 24 333,9 18 27 36,2,2,1,2,3,41,4 16 28 402,8 20 32 443,12 24 36 48,AB-outer(B,A,“*”)#?outer(),数组转置,aperm(a,perm,resize=TRUE)#a为数组,per
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 教学课件 教学 课件 第二 语言 基本 数据结构
链接地址:https://www.31ppt.com/p-5662485.html