R初步接触
R is a free software environment for statistical computing and graphics. It compiles and runs on a wide variety of UNIX platforms, Windows and MacOS. To download R, please choose your preferred CRAN mirror.
准备工作
安装包
自定义CRAN和Bioconductor的下载镜像
1 | # options函数 设置R运行过程中的一些选项设置 |
1 | options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") |
安装bioconductor的包(比以往的source然后bioclite更安全)
1 | if (!requireNamespace("BiocManager", quietly = TRUE)) |
安装cran包
1 | install.packages('WGCNA') |
CRAN:
install.packages()
Biocductor:
BiocManager::install()
Github:
devools::install_github()
library()
包安装目录
1 | .libPaths() |
镜像配置
在R的配置文件.Rprofile中写入
1 | options(BioC_mirror="https://mirrors.ustc.edu.cn/bioc/") |
重启R,就不用每次都再配置一遍镜像了
1 | file.edit('~/.Rprofile') |
但是我现在觉得最好不要在.Rprofile里面自己写东西,有可能会遇到类似这样的错误
1 | Error: Failed to install 'ggradar' from GitHub: |
关联jupyter notebook
这是一件无所谓的事情,玩玩而已
1 | install.packages(c('repr', 'IRdisplay', 'evaluate', 'crayon', 'pbdZMQ', 'devtools', 'uuid', 'digest')) |
1 | # 只在当前用户下安装 |
第一份脚本
使用Rprojcet,工作路径为project所在工作目录
创建Rproject,然后创建Rscript.
数据类型
as 族函数实现数据类型之间的转换
as.numeric () 将其他数据类型转换为数值型
as.logical () 将其他数据类型转换为逻辑型
as.charactor () 将其他数据类型转换为字符型
is 族函数,判断,返回值为 TRUE 或 FALSE
is.numeric () 是否数值型数据
is.logical () 是否逻辑型数据
is.charactor () 是否字符型数据
数据结构:向量、数据框、矩阵、列表
- 数据框约等于“表格”。
- 向量则是数据框单独拿出的一列,视为一个整体。
- 一个向量只能有一种数据类型,可以有重复值。
统计函数
1 | sort() #排序 |
- practice1 判断数据类型
1 | class("a") |
- 循环输出变量类型
1 | Lst<-list("a", TRUE, 3, c(4,7,9)); |
- practice2 向量生成
1 | c("a", TRUE, 3, c(4,7,9)) |
- practice3 向量取子集
1 | # 1.将基因名"ACTR3B","ANLN","BAG1","BCL2","BIRC5","RAB","ABCT","ANF","BAD","BCF","BARC7","BALV"组成一个向量,赋值给x |
Q:’<-‘与’=’有什么区别
The operators
<-
and = assign into the environment in which they are evaluated. The operator<-
can be used anywhere, whereas the operator=
is only allowed at the top level (e.g., in the complete expression typed at the command prompt) or as one of the subexpressions in a braced list of expressions.In a function call you can’t assign an object with
=
because=
means assigning arguments there.
Q:如何多条件选取
加‘|’ :
1 | (x %in% c("ANLN", "BCL2","TP53")) | (x %in% c("BIRC5")) |
- practice4 数据框处理
1 | # 1.新建这个数据框 |
ctrl+l 清空控制台
点扫把 或 rm(list = ls())
清空变量
数据读取
read.csv () –通常读取CSV格式
read.table() –通常用于读取txt格式
sep:分隔符:逗号,\t,空格
header:表头(是否设置第一行为列名)
row.names :第一列作为行名
R特有的数据格式:Rdata
是R语言特有的数据存储格式,无法用其他软件打开;保存的是变量,不是表格文件;save()保存—load()加载
- practice5 数据读取
1 | #1.读取complete_set.txt(已保存在工作目录) |