logo资料库

R命令速查手册.pdf

第1页 / 共10页
第2页 / 共10页
第3页 / 共10页
第4页 / 共10页
第5页 / 共10页
第6页 / 共10页
第7页 / 共10页
第8页 / 共10页
资料共10页,剩余部分请下载后查看
R 语言命令速查手册 R 的安装载入与帮助查询 .......................................................................................... - 2 - 一、 二、 数据对象的类型与建立 .............................................................................................. - 2 - 三、 数据的浏览与编辑 ...................................................................................................... - 3 - 四、 数据的运算 .................................................................................................................. - 3 - 五、 数据的存储与读取 ...................................................................................................... - 3 - 六、 程序命令 ...................................................................................................................... - 4 - 七、 绘图函数 ...................................................................................................................... - 4 - 八、 绘图参数 ...................................................................................................................... - 5 - 九、 常用概率分布命令 ...................................................................................................... - 6 - 十、 基本统计分析函数 ...................................................................................................... - 7 - - 1 -
R 语言命令速查手册 一、 R 的安装载入与帮助查询 1 2 3 4 5 6 7 8 9 命令 install.packages(“程序包 ”) library(“程序包”) help.start( ) help( 函数) 或 ?(函数) help(“字符”) 解释 安装指定程序包 载入指定程序包(已安装) R 基本知识的查询 获取指定函数的帮助页面 获 取 指 定 字 符 的 帮 助 页 面 , 选 项 try.all.packages=FALSE/TRUE, 或 package=“程序包” apropos(“字符”) 或 apropos(字符) 找出所有名中含指定字符的函数 help.search(“字符”) find(函数) 或 find(“函数”) args(函数) 或 args(“函数”) 列出所有在帮助页面含指定字符的函数 得到含指定函数的程序包 得到含指定函数的自变量列表 二、 数据对象的类型与建立 类型 向量 建立命令 seq(from=,to=,by= )或: rep( ) c( ) scan( ) 解释 产生较简单的序列 通过重复产生复杂序列 无规律的向量 通过键盘逐个输入 因子 factor(x,levels=sort(unique(x),na.last=T RUE),labels=levels,exclude=NA,ordere levels 指定水平,labels 指定水平名字,exclude 剔除水平值,ordered 水平是否排序 d=is.ordered(x)) gl(k,n) 数组 array(data,dim=向量,dimnames=向量) 矩阵 matrix(data,row,col ) 产生 k 个水平的因子序列,每个水平重复 n 次, 选项 length=个数, label=因子名. data 为 构 建 数 组 之 数 据 ,dim 为 维 数 向 量,dimnames 为各维名称 选 项 byrow=FALSE 按 列 填 充 , rownames(),colnames()给行列赋名 提取对角元 diag( ) t()转置,diag()提对角元,rbind()按行合并,cbind()按列合并,*逐元乘积,%*%代数积,det() 方阵行列式, data.frame(变量名=数据, 变量名= 数据) with(数据集,新变量) 在原数据框中添加新变量 transform(数据集,新变量 1,新变量 2) 一次性添加多个新定义变量 subset(data,条件) 提取满足条件的子集 不同类型的数据 x,y,z…组成的对象 list(x,y,z) ts(data=NA,start=1,end=numeric(0),frequency=1,deltat=1,ts.eps=getOption(“ts.eps”),class, names) - 2 - 数据 框 列表 时间 序列
三、 数据的浏览与编辑 解释 显示数据集的前 6 个观测值 显示数据集的后 6 个观测值 显示数据集中的变量 命令 head(数据集) tail(数据集) names(数据集) data.entry(数据集) 通过数据编辑器打开数据集(可编辑) edit(数据集) fix(数据集) attach(数据集) detach(数据集) 1 2 3 4 5 6 7 8 9 通过数据编辑器编辑数据集 通过数据编辑器编辑数据集 激活或挂接数据集,使之成为当前数据集 卸载或挂起当前数据集 显示所有在内存中的对象, 选项 pat=“字符”只显示名称带指定字 符的对象 显示内存中所有对象的详细信息, 选项 max.level=-1 规定详细级 别 删除内存中的对象 ls( ) 10 ls.str( ) 11 rm( 对象) 四、 数据的运算 + 加法 - 减法 * 乘法(逐元乘积) / 除法 ^ 乘方 < 小于 > 大于 <= 小于或等于 >= 大于或等于 == 等于 !x 逻辑非 x&y 逻辑与 x&&y 逻辑与(只作用第一 个元素) x|y 逻辑或 x||y 逻辑或(只作用第一 个元素) xor(x,y) 异或 det(A) 方阵的行列式 cbind(A,B) 按列合并矩阵 %% 模 %/% 整除 %*% 矩阵的代数积 apply(X, MARGIN=, FUN=)对 X 按 MARGIN 采取 FUN 运算,MARGIN=1 按列,=2 按行 sweep(X,MARGIN,STATS,FUN)对 X 按 MARGIN 采取 FUN 计算 STATS,并从 X 中除去 != 不等于 t(矩阵) 矩阵转置 rbind(A,B) 按行合并矩阵 五、 数据的存储与读取 命令 解释 write.table(数据,file=“存储路 径”) write.csv( 数 据 ,file=“ 存 储 路 径”) save(数据,file=“存储路径”) 保存为 R 格式文件.Rdata 保 存 为 文 本 文 件 .txt, 选 项 row.names=F 行 名 不 写 入 文 件 , quote=F 变量名不放双引号中 保存为用逗号分割的文本文件.csv save.image( ) read.table(“文件地址”) read.csv( )或 read.csv2( ) read.delim()或 read.delim2() 读取用其他分割符分割的数据 scan(“文件名”,what=list(变量 what=为名义列表,可直接命名对象 保存工作空间的映像 读取表格形式数据,选项 header=TRUE 将第一行作为表头行 读取用逗号分割的数据 - 3 -
名=变量类型) ) read.fwf(“文件地址”,widths= 向量,col.names=向量 ) Excel 数据读取:先 Ctrl+C 复制内容,再用命令 read.delim(“clipboard”) Excel 数据读取:library(RODBC)再 z<-odbcConnectExcel(“Excel 文件地址”)再 sqlFetch(z, 读取文件中固定宽度格式的数据 “Sheet1”), close(z) data( ) data( 数 据 集 ,package=“ 程 序 包” ) load(“R 文件地址”) 六、 程序命令 列出 R 的全部数据集 载入指定程序包中指定数据集 重新加载 R 数据 1 2 3 4 5 6 if(条件) 表达式 1 else 表达式 2 ifelse(条件,满足执行语句,否则执行) for(变量 in 向量) 表达式 while(条件) 表达式 repeat 表达式 if(条件)break 函数名=function(参数列表){函数体} 七、 绘图函数 命令 1 2 plot(x) plot(x,y) 3 sunflowerplot(x,y) 4 5 6 7 8 pie(x) boxplot(x) stripchart(x) coplot(x~y|z) interaction.plot(f1,f2,y) 9 matplot(x,y) 10 dotchart(x) 11 fourfoldplot(x) 12 assocplot(x) 13 mosaicplot(x) 14 pairs(x) 15 plot.ts(x) 解释 以序号为横坐标,以 x 的元素值为纵坐标绘图 以 x 为横 y 为纵坐标绘图 type="p" for points, "l" for lines, "b" for both, "c" for the lines part alone of "b", "o" for both „overplotted‟, "h" for „histogram‟ like (or „high-density‟) vertical lines, "s" for stair steps, "S" for other steps, see „Details‟ below, "n" for no plotting 以 x 为横 y 为纵坐标绘图, 相似坐标的点为花朵,花瓣 数目为点的个数 饼图 箱形图 将 x 的值画在一条线段上 关于 z 的每个值绘 x 与 y 的二元图 以 f1 为 x 轴,f2 的不同值对应不同曲线,作 y 的均值图, 选项 fun=函数,指定 y 的其他统计量 x 与 y 的相应列匹配作二元图, 各图在同一作图区域上 若 x 是数据框,作 Cleveland 点图(逐行逐列累加图) 用四个四分之一圆显示 2×2 列联表情况 Cohen-Friendly 图,显示在二维列联表中行、列变量偏离 独立性的程度 列联表的对数线性回归残差的马赛克图 如果 x 是矩阵或数据框,作 x 的各列之间的二元图 作 x 的时间序列曲线,x 多元时须有相同的频率和时间 - 4 -
16 ts.plot(x) 17 hist(x,probability=T) 18 barplot(x) 19 qqnorm(x) 20 qqplot(x,y) 21 contour(x,y,z) 22 23 filled.contour(x,y,z) image(x,y,z) 24 persp(x,y,z) 25 26 27 stars(x) symbols(x,y,…) termplot(mod.obj) 28 points(x,y) 29 30 lines(x,y) text(x,y,labels,) 31 mtext(text,side=3,line=0,…) 32 segments(x0,y0,x1,y1) 33 arrows (x0,y0,x1,y1,angle=30,code=2) 34 abline(a,b) 35 abline(h=y) 36 abline(v=x) 37 abline(lm.obj) 38 rect(x1,y1,x2,y2) 39 polygon(x,y) 40 41 legend(x,y,legend=“ ”) title( ) 42 axis(side,…) 43 box( ) rug(x) locator(n,type= “n”,…) 作 x 的时间序列曲线,x 多元时须有相同的频率 x 的频率直方图 x 的条形图 正态分位数-分位数图 y 对 x 的分位数-分位数图 等 高 线 图 ,x 、 y 须 为 向 量 ,z 为 矩 阵 dim(z)=c(length(x),length(y)) 等高线之间的区域是彩色的 同上,实际数据大小用不同色彩表示 同上, 但为透视图 若 x 是矩阵或数据框,星形和线段画出 在由 x 和 y 给定坐标画符号 回归模型(mod.obj)的(偏)影响图 添加点 添加线 在(x,y)处添加 labels 指定的文字 在边空添加用 text 指定的文字,side 指定添加在哪边,line 指定添加文字距绘图区域的行数 从(x0,y0)到(x1,y1)画线段 同上,code=1,箭头从(x0,y0)到(x1,y1),code=2, (x1,y1) 到 (x0,y0),code=3,两端都有. 斜率为 b 截距为 a 的直线 水平线 垂直线 由 lm.obj 确定的回归线 绘长方形 绘多边形 在(x,y)处添加图例 添加标题 画 坐 标 轴 ,side=1 画 在 下 边 ,side=2 左 边 ,side=3 上 边,side=4 右边 当前图上加边框 在 x 轴上用短线标出 x 数据的位置 鼠标点击 n 次后返回 n 个位置的坐标,并按 type 划点或 线 44 45 46 47 text(x,y,expression(表达式)) 在图上加数学表达式 text(x,y,as.expression(substitut e(表达式,参数值))) 在表达式中代入某个变量值 48 curve(x ) 49 persp(x) 八、 绘图参数 命令 画曲线 三维透视图 解释 - 5 -
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 add=FALSE axes=TRUE type= “p” xlim=, ylim= xlab=, ylab= main= sub= adj= bg= “ ” bty= “ ” cex col font las lty lwd mar mfcol=c(nr,nc) mfrow= c(nr,nc) pch=1:25 ps pty tck tcl xaxt= yaxt= par( ) TRUE 时表叠加图形到前一个图上 FALSE 时不绘制轴与边框 指定图形的类型.p:点,l:线,b:点连线,o:点连线,线在点上,h:垂直线,s: 阶梯式,垂直线顶端显示数据,S:垂直线底端显示数据 指定轴的上下限 坐标轴的标签,字符型值 主标题,字符型值 副标题 控制文字对齐方式.0:左对齐,0.5:居中,1:右对齐 指定背景色 控制图形边框形状. “o”, “l”, “7”, “”c, “u”, “]” 控制符号和文字大小.拓展:cex.axis,cex.lab,cex.main,cex.sub 控制符号颜色 控制文字字体.1:正常,2:斜体,3:粗体,4:粗斜体 控制坐标轴刻度数字标记方向.0:平行于轴,1:横排,2:垂直于轴,3:竖 排 控制连线线型.1:实线,2:虚线,3:点线,4:点虚线,5:长虚线,6:双虚线, 控制连线宽度的数字 控制图形边空.c(bottom,left,top,right)四个值 c(nr,nc)向量分割窗口,按列使用子窗口 c(nr,nc)向量分割窗口,按行使用子窗口 控制符号类型. 1:25 种样式 控制文字大小的整数 指定绘图区域类型的字符. “s”正方形, “m”最大利用 指定轴上刻度长度值(百分比),以图形宽、高中最小一个作基数 同上,但以文本行高度为基数 “n”设置 x 轴但不显示 “n”设置 y 轴但不显示 后续图形按 par 中设定参数绘制 九、 常用概率分布命令 Beta Binomial Cauchy 分布密度 R 命令(d,p,q,r) 参数 _beta shape1,shape2 _binom size,prob _cauchy location=0,scale=1 Chi-sqaured _chisq df,ncp - 6 - 111(;,)(1),01(,)abfxabxxxBab(;,)(1)xxnxnfxnpCpp21(;,),01[1()]xabfxabxb22212(;),02()nxnnxefxnx
Dirichlet _dirichlet alpha Exponential Fisher-Snedecor Gamma Geometric Generalized Extreme Value Generalized Pareto Hypergeometric Inverse Gamma Inverse Wishart Logistic Lognormal Multinomial _exp _f rate df1,df2,ncp _gamma shape,scale=1 _geom _gev _gpd _hyper prob xi,mu,sigma xi=1,mu=0,sigma=1 m,n,k _invgamma shape,rate _iwish _logis _lnorm v,S location=0,scale=1 meanlog=0,sdlog=1 _multinom size,prob Multivariate Normal Multivariate-t Negative binomial _mvnorm mean,sigma _mvt sigma=diag(2),df=1 _nbinom size,prob Normal _norm mean=0,sd=1 Poisson _pois lambda Student‟s Uniform Weibull Wilcoxon‟s statistics Wishart 十、 基本统计分析函数 1 max(x) 命令 _t df _unif min=0,max=1 _weibull _wilcox _signrank _wish shape,scale=1 m,n n v,S 解释 返回向量 x 中最大元 - 7 - 111111()(,,;),1()ikikkikiikiiiifxxxx(;),0xfxex222122()(;,)(1)(,)mmmnmnmnmnfxmnxxB11(;,),0()xbaafxabxexab(;)(1)xfxppp(;,,)xkxmnkmnCCfxmnkC1(1)1(;,),0()bxaafxabxexab1(;,)[1]xabfxabe2(ln)221(;,),02xfxexx11111!(,,;,),!!kkxxkkiiknfxxnpppxnxx()(;,)(1)()()kxkxfxabppkx2()221(;,)2xfxe(;)!xfxex1221221(;)(1)(,)nxnnfxnnB1(;,),fxabaxbba1(;,),0bbaxfxababxex
2 min(x) 3 which.max(x) 4 which.min(x) 5 mean(x) 6 median(x) 7 mad(x) 8 9 var(x) sd(x) 10 range(x) 11 IQR(x) 12 quantile(x) 13 summary(x) 14 length(x) 15 mode(x) 16 sum(x) 17 prod(x) 18 rev(x) 19 sort(x) 20 order(x) 21 rank(x) 22 cumsum(x) 23 cumprod(x) 24 cumin(x) 25 cummax(x) 26 var(x,y) 27 cov(x,y) 28 cor(x,y) 29 outer(x,y) 30 sample(x,n) 31 choose(n,k) 32 density(x,bw=,kernel=“ ”) 33 kde2d(x,y) 34 hist(x,breaks=“ ”,freq=T) 35 stem(x) 36 skewness(x) 37 kurtosis(x) 38 basicStats( x) lowess( )或 loesss( ) 39 40 aggregate(数据框,分组变量,函数) 返回向量 x 中最小元 返回 x 最大元的下标 返回 x 最小元的下标 计算样本 x 的均值 计算样本 x 的中位数 计 算 中 位 绝 对 离 差 1.4826median(abs(x-median(x))) 计算样本 x 的方差 计算样本 x 的标准差 返回向量 c(min(x),max(x)) 计算样本 x 的四分位数极差 计算样本 x 的常用分位数 计算样本 x 的常用描述性统计量(五数概括) 返回向量 x 的长度 返回对象 x 的类型 给出向量 x 的总和 给出向量 x 的乘积 取向量 x 的逆序 按升序排序, 选项 decreasing=TRUE 表降序 返回 x 的秩(升序), 选项 decreasing=TRUE 表 降序 返回 x 的秩 返回向量 x 的累积和 返回向量 x 的累积积 返回向量 x 的累积最小值 返回向量 x 的累积最大值 计算样本 x,y 的协方差 计算样本 x,y 的协方差 计算样本 x,y 的相关系数 计算样本 x,y 的外积 从样本 x 中抽取 n 个个体,选项 replace=TRUE 表有放回抽样,prob=y 表 x 中元素出现的概率 从 n 中抽 k 个组合 x 的核密度估计,bw 为窗宽,kernel 为选择光滑 化函数 MASS 程序包中二维核密度估计 x 的频数直方图 茎叶图 样本的偏度系数 (需加载 fBasics 程序包) 样本的峰度系数 (需加载 fBasics 程序包) fBasics 包中的命令,计算常用的统计特征量 用一条非线性曲线拟合散点图 对数据框的指定分组变量按指定函数统计分 - 8 -
分享到:
收藏