R 语言命令速查手册
R 的安装载入与帮助查询 .......................................................................................... - 2 -
一、
二、 数据对象的类型与建立 .............................................................................................. - 2 -
三、 数据的浏览与编辑 ...................................................................................................... - 3 -
四、 数据的运算 .................................................................................................................. - 3 -
五、 数据的存储与读取 ...................................................................................................... - 3 -
六、 程序命令 ...................................................................................................................... - 4 -
七、 绘图函数 ...................................................................................................................... - 4 -
八、 绘图参数 ...................................................................................................................... - 5 -
九、 常用概率分布命令 ...................................................................................................... - 6 -
十、 基本统计分析函数 ...................................................................................................... - 7 -
- 1 -
R 语言命令速查手册
一、 R 的安装载入与帮助查询
1
2
3
4
5
6
7
8
9
命令
install.packages(“程序包 ”)
library(“程序包”)
help.start( )
help( 函数) 或 ?(函数)
help(“字符”)
解释
安装指定程序包
载入指定程序包(已安装)
R 基本知识的查询
获取指定函数的帮助页面
获 取 指 定 字 符 的 帮 助 页 面 , 选 项
try.all.packages=FALSE/TRUE, 或 package=“程序包”
apropos(“字符”) 或 apropos(字符) 找出所有名中含指定字符的函数
help.search(“字符”)
find(函数) 或 find(“函数”)
args(函数) 或 args(“函数”)
列出所有在帮助页面含指定字符的函数
得到含指定函数的程序包
得到含指定函数的自变量列表
二、 数据对象的类型与建立
类型
向量
建立命令
seq(from=,to=,by= )或:
rep( )
c( )
scan( )
解释
产生较简单的序列
通过重复产生复杂序列
无规律的向量
通过键盘逐个输入
因子
factor(x,levels=sort(unique(x),na.last=T
RUE),labels=levels,exclude=NA,ordere
levels 指定水平,labels 指定水平名字,exclude
剔除水平值,ordered 水平是否排序
d=is.ordered(x))
gl(k,n)
数组 array(data,dim=向量,dimnames=向量)
矩阵 matrix(data,row,col )
产生 k 个水平的因子序列,每个水平重复 n 次,
选项 length=个数, label=因子名.
data 为 构 建 数 组 之 数 据 ,dim 为 维 数 向
量,dimnames 为各维名称
选 项 byrow=FALSE 按 列 填 充 ,
rownames(),colnames()给行列赋名
提取对角元
diag( )
t()转置,diag()提对角元,rbind()按行合并,cbind()按列合并,*逐元乘积,%*%代数积,det()
方阵行列式,
data.frame(变量名=数据, 变量名= 数据)
with(数据集,新变量)
在原数据框中添加新变量
transform(数据集,新变量 1,新变量 2) 一次性添加多个新定义变量
subset(data,条件)
提取满足条件的子集
不同类型的数据 x,y,z…组成的对象
list(x,y,z)
ts(data=NA,start=1,end=numeric(0),frequency=1,deltat=1,ts.eps=getOption(“ts.eps”),class,
names)
- 2 -
数据
框
列表
时间
序列
三、 数据的浏览与编辑
解释
显示数据集的前 6 个观测值
显示数据集的后 6 个观测值
显示数据集中的变量
命令
head(数据集)
tail(数据集)
names(数据集)
data.entry(数据集) 通过数据编辑器打开数据集(可编辑)
edit(数据集)
fix(数据集)
attach(数据集)
detach(数据集)
1
2
3
4
5
6
7
8
9
通过数据编辑器编辑数据集
通过数据编辑器编辑数据集
激活或挂接数据集,使之成为当前数据集
卸载或挂起当前数据集
显示所有在内存中的对象, 选项 pat=“字符”只显示名称带指定字
符的对象
显示内存中所有对象的详细信息, 选项 max.level=-1 规定详细级
别
删除内存中的对象
ls( )
10
ls.str( )
11
rm( 对象)
四、 数据的运算
+ 加法
- 减法
* 乘法(逐元乘积)
/ 除法
^ 乘方
< 小于
> 大于
<= 小于或等于
>= 大于或等于
== 等于
!x 逻辑非
x&y 逻辑与
x&&y 逻辑与(只作用第一
个元素)
x|y 逻辑或
x||y 逻辑或(只作用第一
个元素)
xor(x,y) 异或
det(A) 方阵的行列式
cbind(A,B) 按列合并矩阵
%% 模
%/% 整除
%*% 矩阵的代数积
apply(X, MARGIN=, FUN=)对 X 按 MARGIN 采取 FUN 运算,MARGIN=1 按列,=2 按行
sweep(X,MARGIN,STATS,FUN)对 X 按 MARGIN 采取 FUN 计算 STATS,并从 X 中除去
!= 不等于
t(矩阵) 矩阵转置
rbind(A,B) 按行合并矩阵
五、 数据的存储与读取
命令
解释
write.table(数据,file=“存储路
径”)
write.csv( 数 据 ,file=“ 存 储 路
径”)
save(数据,file=“存储路径”) 保存为 R 格式文件.Rdata
保 存 为 文 本 文 件 .txt, 选 项 row.names=F 行 名 不 写 入 文 件 ,
quote=F 变量名不放双引号中
保存为用逗号分割的文本文件.csv
save.image( )
read.table(“文件地址”)
read.csv( )或 read.csv2( )
read.delim()或 read.delim2() 读取用其他分割符分割的数据
scan(“文件名”,what=list(变量 what=为名义列表,可直接命名对象
保存工作空间的映像
读取表格形式数据,选项 header=TRUE 将第一行作为表头行
读取用逗号分割的数据
- 3 -
名=变量类型) )
read.fwf(“文件地址”,widths=
向量,col.names=向量 )
Excel 数据读取:先 Ctrl+C 复制内容,再用命令 read.delim(“clipboard”)
Excel 数据读取:library(RODBC)再 z<-odbcConnectExcel(“Excel 文件地址”)再 sqlFetch(z,
读取文件中固定宽度格式的数据
“Sheet1”), close(z)
data( )
data( 数 据 集 ,package=“ 程 序
包” )
load(“R 文件地址”)
六、 程序命令
列出 R 的全部数据集
载入指定程序包中指定数据集
重新加载 R 数据
1
2
3
4
5
6
if(条件) 表达式 1 else 表达式 2
ifelse(条件,满足执行语句,否则执行)
for(变量 in 向量) 表达式
while(条件) 表达式
repeat 表达式 if(条件)break
函数名=function(参数列表){函数体}
七、 绘图函数
命令
1
2
plot(x)
plot(x,y)
3
sunflowerplot(x,y)
4
5
6
7
8
pie(x)
boxplot(x)
stripchart(x)
coplot(x~y|z)
interaction.plot(f1,f2,y)
9 matplot(x,y)
10 dotchart(x)
11
fourfoldplot(x)
12 assocplot(x)
13 mosaicplot(x)
14 pairs(x)
15 plot.ts(x)
解释
以序号为横坐标,以 x 的元素值为纵坐标绘图
以 x 为横 y 为纵坐标绘图 type="p" for points, "l" for
lines, "b" for both, "c" for the lines part alone of "b",
"o" for both „overplotted‟, "h" for „histogram‟ like (or
„high-density‟) vertical lines, "s" for stair steps, "S" for
other steps, see „Details‟ below, "n" for no plotting
以 x 为横 y 为纵坐标绘图, 相似坐标的点为花朵,花瓣
数目为点的个数
饼图
箱形图
将 x 的值画在一条线段上
关于 z 的每个值绘 x 与 y 的二元图
以 f1 为 x 轴,f2 的不同值对应不同曲线,作 y 的均值图,
选项 fun=函数,指定 y 的其他统计量
x 与 y 的相应列匹配作二元图, 各图在同一作图区域上
若 x 是数据框,作 Cleveland 点图(逐行逐列累加图)
用四个四分之一圆显示 2×2 列联表情况
Cohen-Friendly 图,显示在二维列联表中行、列变量偏离
独立性的程度
列联表的对数线性回归残差的马赛克图
如果 x 是矩阵或数据框,作 x 的各列之间的二元图
作 x 的时间序列曲线,x 多元时须有相同的频率和时间
- 4 -
16
ts.plot(x)
17 hist(x,probability=T)
18 barplot(x)
19 qqnorm(x)
20 qqplot(x,y)
21 contour(x,y,z)
22
23
filled.contour(x,y,z)
image(x,y,z)
24 persp(x,y,z)
25
26
27
stars(x)
symbols(x,y,…)
termplot(mod.obj)
28 points(x,y)
29
30
lines(x,y)
text(x,y,labels,)
31 mtext(text,side=3,line=0,…)
32
segments(x0,y0,x1,y1)
33 arrows
(x0,y0,x1,y1,angle=30,code=2)
34 abline(a,b)
35 abline(h=y)
36 abline(v=x)
37 abline(lm.obj)
38
rect(x1,y1,x2,y2)
39 polygon(x,y)
40
41
legend(x,y,legend=“ ”)
title( )
42 axis(side,…)
43 box( )
rug(x)
locator(n,type= “n”,…)
作 x 的时间序列曲线,x 多元时须有相同的频率
x 的频率直方图
x 的条形图
正态分位数-分位数图
y 对 x 的分位数-分位数图
等 高 线 图 ,x 、 y 须 为 向 量 ,z 为 矩 阵
dim(z)=c(length(x),length(y))
等高线之间的区域是彩色的
同上,实际数据大小用不同色彩表示
同上, 但为透视图
若 x 是矩阵或数据框,星形和线段画出
在由 x 和 y 给定坐标画符号
回归模型(mod.obj)的(偏)影响图
添加点
添加线
在(x,y)处添加 labels 指定的文字
在边空添加用 text 指定的文字,side 指定添加在哪边,line
指定添加文字距绘图区域的行数
从(x0,y0)到(x1,y1)画线段
同上,code=1,箭头从(x0,y0)到(x1,y1),code=2, (x1,y1) 到
(x0,y0),code=3,两端都有.
斜率为 b 截距为 a 的直线
水平线
垂直线
由 lm.obj 确定的回归线
绘长方形
绘多边形
在(x,y)处添加图例
添加标题
画 坐 标 轴 ,side=1 画 在 下 边 ,side=2 左 边 ,side=3 上
边,side=4 右边
当前图上加边框
在 x 轴上用短线标出 x 数据的位置
鼠标点击 n 次后返回 n 个位置的坐标,并按 type 划点或
线
44
45
46
47
text(x,y,expression(表达式)) 在图上加数学表达式
text(x,y,as.expression(substitut
e(表达式,参数值)))
在表达式中代入某个变量值
48 curve(x )
49 persp(x)
八、 绘图参数
命令
画曲线
三维透视图
解释
- 5 -
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
add=FALSE
axes=TRUE
type= “p”
xlim=, ylim=
xlab=, ylab=
main=
sub=
adj=
bg= “ ”
bty= “ ”
cex
col
font
las
lty
lwd
mar
mfcol=c(nr,nc)
mfrow= c(nr,nc)
pch=1:25
ps
pty
tck
tcl
xaxt=
yaxt=
par( )
TRUE 时表叠加图形到前一个图上
FALSE 时不绘制轴与边框
指定图形的类型.p:点,l:线,b:点连线,o:点连线,线在点上,h:垂直线,s:
阶梯式,垂直线顶端显示数据,S:垂直线底端显示数据
指定轴的上下限
坐标轴的标签,字符型值
主标题,字符型值
副标题
控制文字对齐方式.0:左对齐,0.5:居中,1:右对齐
指定背景色
控制图形边框形状. “o”, “l”, “7”, “”c, “u”, “]”
控制符号和文字大小.拓展:cex.axis,cex.lab,cex.main,cex.sub
控制符号颜色
控制文字字体.1:正常,2:斜体,3:粗体,4:粗斜体
控制坐标轴刻度数字标记方向.0:平行于轴,1:横排,2:垂直于轴,3:竖
排
控制连线线型.1:实线,2:虚线,3:点线,4:点虚线,5:长虚线,6:双虚线,
控制连线宽度的数字
控制图形边空.c(bottom,left,top,right)四个值
c(nr,nc)向量分割窗口,按列使用子窗口
c(nr,nc)向量分割窗口,按行使用子窗口
控制符号类型. 1:25 种样式
控制文字大小的整数
指定绘图区域类型的字符. “s”正方形, “m”最大利用
指定轴上刻度长度值(百分比),以图形宽、高中最小一个作基数
同上,但以文本行高度为基数
“n”设置 x 轴但不显示
“n”设置 y 轴但不显示
后续图形按 par 中设定参数绘制
九、 常用概率分布命令
Beta
Binomial
Cauchy
分布密度
R 命令(d,p,q,r)
参数
_beta
shape1,shape2
_binom
size,prob
_cauchy
location=0,scale=1
Chi-sqaured
_chisq
df,ncp
- 6 -
111(;,)(1),01(,)abfxabxxxBab(;,)(1)xxnxnfxnpCpp21(;,),01[1()]xabfxabxb22212(;),02()nxnnxefxnx
Dirichlet
_dirichlet
alpha
Exponential
Fisher-Snedecor
Gamma
Geometric
Generalized Extreme Value
Generalized Pareto
Hypergeometric
Inverse Gamma
Inverse Wishart
Logistic
Lognormal
Multinomial
_exp
_f
rate
df1,df2,ncp
_gamma
shape,scale=1
_geom
_gev
_gpd
_hyper
prob
xi,mu,sigma
xi=1,mu=0,sigma=1
m,n,k
_invgamma
shape,rate
_iwish
_logis
_lnorm
v,S
location=0,scale=1
meanlog=0,sdlog=1
_multinom
size,prob
Multivariate Normal
Multivariate-t
Negative binomial
_mvnorm
mean,sigma
_mvt
sigma=diag(2),df=1
_nbinom
size,prob
Normal
_norm
mean=0,sd=1
Poisson
_pois
lambda
Student‟s
Uniform
Weibull
Wilcoxon‟s statistics
Wishart
十、 基本统计分析函数
1 max(x)
命令
_t
df
_unif
min=0,max=1
_weibull
_wilcox
_signrank
_wish
shape,scale=1
m,n
n
v,S
解释
返回向量 x 中最大元
- 7 -
111111()(,,;),1()ikikkikiikiiiifxxxx(;),0xfxex222122()(;,)(1)(,)mmmnmnmnmnfxmnxxB11(;,),0()xbaafxabxexab(;)(1)xfxppp(;,,)xkxmnkmnCCfxmnkC1(1)1(;,),0()bxaafxabxexab1(;,)[1]xabfxabe2(ln)221(;,),02xfxexx11111!(,,;,),!!kkxxkkiiknfxxnpppxnxx()(;,)(1)()()kxkxfxabppkx2()221(;,)2xfxe(;)!xfxex1221221(;)(1)(,)nxnnfxnnB1(;,),fxabaxbba1(;,),0bbaxfxababxex
2 min(x)
3 which.max(x)
4 which.min(x)
5 mean(x)
6 median(x)
7 mad(x)
8
9
var(x)
sd(x)
10
range(x)
11
IQR(x)
12 quantile(x)
13
summary(x)
14
length(x)
15 mode(x)
16
sum(x)
17 prod(x)
18
rev(x)
19
sort(x)
20 order(x)
21
rank(x)
22 cumsum(x)
23 cumprod(x)
24 cumin(x)
25 cummax(x)
26 var(x,y)
27 cov(x,y)
28 cor(x,y)
29 outer(x,y)
30
sample(x,n)
31 choose(n,k)
32 density(x,bw=,kernel=“ ”)
33 kde2d(x,y)
34 hist(x,breaks=“ ”,freq=T)
35
stem(x)
36
skewness(x)
37 kurtosis(x)
38 basicStats( x)
lowess( )或 loesss( )
39
40 aggregate(数据框,分组变量,函数)
返回向量 x 中最小元
返回 x 最大元的下标
返回 x 最小元的下标
计算样本 x 的均值
计算样本 x 的中位数
计 算 中 位 绝 对 离 差
1.4826median(abs(x-median(x)))
计算样本 x 的方差
计算样本 x 的标准差
返回向量 c(min(x),max(x))
计算样本 x 的四分位数极差
计算样本 x 的常用分位数
计算样本 x 的常用描述性统计量(五数概括)
返回向量 x 的长度
返回对象 x 的类型
给出向量 x 的总和
给出向量 x 的乘积
取向量 x 的逆序
按升序排序, 选项 decreasing=TRUE 表降序
返回 x 的秩(升序), 选项 decreasing=TRUE 表
降序
返回 x 的秩
返回向量 x 的累积和
返回向量 x 的累积积
返回向量 x 的累积最小值
返回向量 x 的累积最大值
计算样本 x,y 的协方差
计算样本 x,y 的协方差
计算样本 x,y 的相关系数
计算样本 x,y 的外积
从样本 x 中抽取 n 个个体,选项 replace=TRUE
表有放回抽样,prob=y 表 x 中元素出现的概率
从 n 中抽 k 个组合
x 的核密度估计,bw 为窗宽,kernel 为选择光滑
化函数
MASS 程序包中二维核密度估计
x 的频数直方图
茎叶图
样本的偏度系数 (需加载 fBasics 程序包)
样本的峰度系数 (需加载 fBasics 程序包)
fBasics 包中的命令,计算常用的统计特征量
用一条非线性曲线拟合散点图
对数据框的指定分组变量按指定函数统计分
- 8 -