R语言入门教程.ppt
《R语言入门教程.ppt》由会员分享,可在线阅读,更多相关《R语言入门教程.ppt(105页珍藏版)》请在三一办公上搜索。
1、语言入门,R语言入门,报告内容,一 R简介二 函数与对象三 编写脚本四 R绘图五 编写函数六 数据保存,一 R 简 介,R语言的由来,R语言是从S语言演变而来的。S语言是二十世纪70年代诞生于贝尔实验室,由Rick Becker,John Chambers,Allan Wilks开发。基于S语言开发的商业软件Splus,可以方便的编写函数、建立模型,具有良好的扩展性,取得了巨大成功。1995年由新西兰Auckland大学统计系的Robert Gentleman和Ross Ihaka,编写了一种能执行S语言的软件,并将该软件的源代码全部公开,这就是R软件,其命令统称为R语言。,R软件简介,R是开
2、源软件,代码全部公开,对所有人免费。R可在多种操作系统下运行,如Windows、MacOS、多种Linux和UNIX等。R需要输入命令,可以编写函数和脚本进行批处理运算,语法简单灵活。目前在R网站上约有2100个程序包,涵盖了基础统计学、社会学、经济学、生态学、地理学、医学统计学、生物信息学等诸多方面。,下载和安装R,The Comprehensive R Archive Network简称CRAN,提供下载安装程序和相应软件包。R主页 Windows版本下载地址之一:下载完成后,双击 开始安装。一直点击下一步,各选项默认。,图1 R软件首页,图2 R登陆界面(Windows版)路径:开始所有
3、程序,菜单栏,快捷按钮,控制台,命令行,图3 R Gui 的菜单介绍,练习一:下载和安装R,下载并安装R软件了解R的菜单,R程序包,为什么要安装程序包?特定的分析功能,需要用相应的程序包实现。例如:系统发育分析,往往要用到ape程序包,群落生态学vegan包等等。程序包是什么?R程序包是多个函数的集合,具有详细的说明和示例。Window下的R程序包是已经编译好的zip包。每个程序包包含R函数、数据、帮助文件、描述文件等。,常用R程序包,base-R 基础功能包stats-R统计学包nlme-线性及非线性混合效应模型Graphics-绘图lattice-栅格图ape-系统发育与进化分析apTre
4、eshape-进化树分析seqinr-DNA序列分析ade4-利用欧几里得方法进行生态学数据分析,常用R程序包,cluster-聚类分析ecodist-生态学数据相异性分析mefa-生态学和生物地理学多元数据处理mgcv-广义加性模型相关mvpart-多变量分解nlme-线性及非线性混合效应模型ouch-系统发育比较BiodiversityR-基于Rcmdr的生物多样性数据分析vegan-植物与植物群落的排序,生物多样性计算,常用R程序包,maptools-空间对象的读取和处理sp-空间数据处理spatstat-空间点格局分析,模型拟合与检验splancs-空间与时空点格局分析picante-
5、群落系统发育多样性分析,图4 CRAN Task Views:对程序包的分类介绍,图5 vegan包页面,R程序包,在CRAN 提供了每个包的源代码和编译好的MacOS、Window下的程序包以vegan包为例,CRAN提供了:Package source:vegan_1.15-3.tar.gz MacOS X binary:vegan_1.15-3.tgz Reference manual:vegan.pdf 等Window平台下程序包为zip文件,安装时不要解压缩。,R程序包安装,1 连网时,用函数install.packages(),选择镜像后,程序将自动下载并安装程序包。例如:打开RG
6、ui,在控制台中输入 install.packages(“ape)2 安装本地zip包路径:Packagesinstall packages from local files选择光盘或者本地磁盘上存储zip包的文件夹。,程序包使用,在控制台中输入如下命令:library(vegan)library(ade4)调用程序包内的函数与R内置的函数调用方法一样library(vegan)This is vegan 1.15-3Warning message:,练习二 安装并导入程序包,安装程序包程序包从本地zip文件安装程序包调用程序包library(vegan)library(ape),查看帮助文件
7、,如何知道ape程序包内部都有哪些函数?最常用的方法:1 菜单 帮助Html帮助2 查看pdf帮助文档(从程序包下载页面下载),查看帮助文件,1 help(t.test)2?t.test 3 help.search(t.test)4 apropos(t.test)5 RGuiHelpHtml help 6 查看R包pdf手册,帮助文件的内容,以lm函数为例:lm(stats)#函数名及所在包 Fitting Linear Models#标题Description#函数描述Usage#默认选项Arguments#参数Details#详情Author(s)#作者References#参考文献Exa
8、mples#举例,练习三 查看帮助文件,打开ape软件包的帮助文件library(ape)查找ape包中plot.phylo函数的帮助输入?plot.phylo将其中的Example文件粘贴到Console中,查看运行的结果。,图形界面之一:R Commander,图6 R commander 界面 library(Rcmdr),界面操作代码,结果输出,为什么要学习编程?,界面操作直观易学,但也存在一些不足:操作的过程难以保存,数据处理不够灵活,在进行步骤繁多的数据处理工作时十分费时费力;在建立模型或自己编写函数时也会遇到困难。而这些困难可以通过编程解决。学习R编程,首先要了解R的函数、对象及
9、其操作。,二 R函数与对象,数据表的行与列,行名Row names字符串,列名 Column names,每列可看做带名称的向量,表1 数据表、数据框与向量,字符串、因素,每行作为一个Entry,R的函数,R是一种解释性语言,不需要先编译成.exe文件,输入后可直接运行。函数形式function(对象,选项=)平均值 mean()线性回归 lm(yx,data=test)R处理的所有数据、变量、函数和结果都以对象的形式保存。,R的函数,每一个函数执行特定的功能,后面紧跟括号,例如:平均值 mean()求和 sum()绘图 plot()排序 sort()除了基本的运算之外,R的函数又分为高级和低
10、级函数,高级函数内部嵌套了复杂的低级函数,例如plot()是高级绘图函数,函数本身会根据数据的类型,经过程序内部的函数判别之后,绘制相应类型的图形,并有大量的参数可选择。,部分函数,计算log(x)log10(x)exp(x)sin(x)cos(x)tan(x)asin(x)acos(x)min(x)max(x)range(x)length(x),统计检验mean(x)sd(x)var(x)median(x)quantile(x,p)cor(x,y)t.test()lm(y x)wilcox.test()kruskal.test(),统计检验lm(y f+x)lm(y x1+x2+x3)bar
11、tlett.testbinom.testfisher.testchisq.testglm(y x1+x2+x3,binomial)friedman.test.,图7 箱线图修饰前后(左:默认值,右:修改属性后)boxplot(count spray,data=InsectSprays)boxplot(count spray,data=InsectSprays,col=red),R函数调用及其选项,R函数调用及其选项,函数的调用方法,函数名+()如 plot(),lm(),并将对象放入括号中,“=”表示设定参数。例如:boxplot(daytype,data=bac,col=“red“,xlab
12、=“Virus”,ylab=“days”)daytype,以type为横轴,day为纵轴绘制箱线图。data=bac 数据来源baccol=“red”箱线图为红色xlab=“Virus”横轴名称为Virusylab=“days”纵轴名称为days,练习四:查询函数帮助,查看boxplot的帮助文件?boxplot查看最后的examples 将帮助文件中的内容粘贴到控制台中,运行并观看运行结果。boxplot(count spray,data=InsectSprays,col=lightgray)选项更改boxplot(count spray,data=InsectSprays,col=“red
13、”,xlab=“spray”,ylab=“counts”),赋值与注释,在控制台中键入如下命令2+2a代替b-2c-a+bc#注释,赋值符号,为对象起名,R是区分大小写的,A与a是不同的。对象名不能用数字开头,但是数字可以放在中间或结尾。推荐用”.”作为间隔,例如 anova.result1。举例:一个向量a,包含了四个元素,a-c(10,15,21,18)该向量为数值型,长度为4。保留名称(命名对象时不要与保留名称冲突):NA,NaN,pi,LETTERS,letters,month.abb,month.name,对象的类型,数值型 Numeric 如 100,0,-4.335字符型 Cha
14、racter 如“China”逻辑型 Logical 如TRUE,FALSE因子型 Factor 表示不同类别复数型 Complex 如:2+3i,对象的类别,向量(vector)一系列元素的组合。因子(factor)因子是一个分类变量,如“a”,”a”,”a”,”a”,”b”,”b”,”b”,”c”,”c”数组(array)数组是k维的数据表。矩阵(matrix)矩阵是数组的一个特例,维数k=2。数据框(dataframe)是由一个或几个向量和(或)因子构成,它们必须是等长的,但可以是不同的数据类型。列表(list)列表可以包含任何类型的对象。(据Paradis,2005),运算符,数学运算
15、 运算后给出数值结果+,-,*,/,比较运算 运算后给出判别结果(TRUE FALSE),=,=,!=逻辑运算 与、或、非!,&,&,|,|,外部数据读取,最为常用的数据读取方式是用read.table()函数或read.csv()函数读取外部txt或csv格式的文件。txt文件,制表符间隔 csv文件,逗号间隔 一些R程序包(如foreign)也提供了直接读取Excel,SAS,dbf,Matlab,spss,systat,Minitab文件的函数。,read.table()的使用,例:test.data-read.table(D:/R/test2.txt,header=T)header=T
16、表示将数据的第一行作为标题。read.table(file=file.choose(),header=T)可以弹出对话框,选择文件。,实例:从数据输入到t检验,表2 六名患者的身高和体重,现有6名患者的身高和体重,检验体重除以身高的平方是否等于22.5。,第一种方式:从控制台输入数据,数据量较少时可以从控制台直接输入:height-c(1.75,1.80,1.65,1.90,1.74,1.91)weight-c(60,72,57,90,95,72)sq.height-height2ratio-weight/sq.heightt.test(ratio,mu=22.5),第二种方式 从外部读取数据
17、,数据量较大时用read.table函数从外部txt文件读取第1步 将Excel中的数据另存为.txt格式(制表符间隔)或.csv格式。第2步 用read.table()或read.csv()函数将数据读入R工作空间,并赋值给一个对象。,图8 在Excel中将数据存为txt文件,实例:t检验(续),一般从txt文档读取数据。每一行作为一个观测值。每一行的变量用制表符,空格或逗号间隔开。read.table(”位置”,header=T)read.csv(”位置”,header=T)#从外部读取数据data1-read.table(d:/t.test.data.txt,header=T)bmi-d
18、ata1$weight/data1$height2t.test(bmi,mu=22.5)#t检验,练习五:数据读取和t检验,将表2中的数据录入Excel中,另存为文件。用read.table函数读取该文件。t.test.data-read.table(“X:/t.test.txt”,header=T)对变量中的attach(t.test.data)ratio-weight/height2t.test(ratio),实例:从数据输入到单因素方差分析,将三种不同菌型的伤寒病毒a,b,c分别接种于10,9,和11只小白鼠上,观察其存活天数,问三种菌型下小白鼠的平均存活天数是否有显著差异。a菌株:2,
19、4,3,2,4,7,7,2,5,4 b菌株:5,6,8,5,10,7,12,6,6 c菌株:7,11,6,6,7,9,5,10,6,3,10,准备数据表,图9 数据表的准备day和type 各为一列,实例:方差分析(续),#数据读取,将test1.txt中的内容保存到bac中,header=T表示保留标题行。bac-read.table(d:/anova.data.txt,header=T)#将ba数据框中的type转换为因子(factor)bac$type-as.factor(bac$type)ba.an-aov(lm(daytype,data=bac)summary(ba.an)boxpl
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 语言 入门教程
![提示](https://www.31ppt.com/images/bang_tan.gif)
链接地址:https://www.31ppt.com/p-5447036.html