samtools将sam文件转成bam并且排序,为下游汾析做准备
string是什么意思tie对每个样本进行转录本组装
string是什么意思tie 将所有样本的转录本进行合并 注意:此处的mergelist.txt是自己创建的
计算表达量并且为Ballgown包提供输入文件
Ballgown的安装 分析需提供一个分组信息;
。。。明天整理更新!!!
注:*.bam 格式的文件为二进制文件;
注: mergelist.txt 文件包含所有*.gtf 攵件名的列表, 并且每个文件名占据一行
师兄推荐这篇文章按照里面的命令,先做一套转录组分析
我是借鉴的简书上的一篇博文,谢谢这个博主啦!
文章背景: 见文章
转录组分析 背景知识:
从原始RNA-Seq数据着掱,质控——建立索引文件——比对、拼接、排序——初组装——合并——计算表达量并输出为baoogown格式——进行差异分析——作图,这里輸出结果包括基因list、转录本及每个样本的表达量,能表现差异表达基因的表格 并完成显著性计算
3. 使用线性模型进行差异表达分析,由於FPKM对于转录本解读过于曲解所以这里需要使用log转化处理数据,随后再使用线性模型进行差异分析
#这是一个循环语句,文件12个一个一個来就很累了,但是我也没有理解这个循环语句照葫芦画瓢而已,改一下路径
四、 检测转录本与参考注释的比较
评估表达量并为ballgown包提供输入文件
genefilter(用于快速计算均值和方差)
dplyr(用于分类和排列结果)
devtools(用于再现性和安装包)
#查看某一基因位置上所有转录本
# plotTranscripts函数可以根据指定基因的id画出在特定区段的转录本
#以性别为区分,查看表达情况
# 这里以id=575的基因为例(对应上一步作图)
还有一个图没有做成功慢慢去找原因吧,ganbade
版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。