首页 > 其他 > 详细

R常用统计 - 相关关系分析

时间:2020-07-26 23:37:04      阅读:107      评论:0      收藏:0      [点我收藏+]

数据格式

每行分别为表型和基因表达情况对应标量,每列分别为样品名的矩阵。假定前9列为phenotype,从第10行起为gene_id,编写简单for循环如下:

script

require("lessR")
library(lessR)
data = read.table("c:/Users/****/Desktop/yourfile.txt",
                  header = T,row.names = 1,na.strings = T,sep = "\t") #input your file
results = NULL
for (i in 1:9) {#
   for (j in 10:nrow(data)){
    if (median(as.numeric(data[j,]))>=1e-5) {
    x = data[i,]
    y = data[j,]
    tem_res = Correlation(x,
                          y, 
                          meth = "spearman",
                          adjt = "fdr",
                          heat_map = F)
  term_result = data.frame(row.names(data)[i],row.names(data)[j],tem_res$r,tem_res$pvalue)
  results = rbind(results,term_result)  
     }
  }
}
colnames(results) = c("phenotype","gene_id","r_value","p_value")
write.csv(results,"correlation_results.csv",row.names = F)

R常用统计 - 相关关系分析

原文:https://www.cnblogs.com/drliu/p/13382083.html

(0)
(0)
   
举报
评论 一句话评论(0
关于我们 - 联系我们 - 留言反馈 - 联系我们:wmxa8@hotmail.com
© 2014 bubuko.com 版权所有
打开技术之扣,分享程序人生!