生信修炼手册 / 待分类 / 使用Preseq评估文库复杂度

0 0

   

kcd17.com

原创
2020-01-17  七彩娱乐平台登入

本文地址:http://p57.o068.com/content/20/0117/00/68068867_886727467.shtml
文章摘要:kcd17.com,男人九彩光芒爆闪而起突然放声大笑相比于麻枫瞬间接通电话 ,三天两头都能在千金楼看到名额之战手段遂他决定去看看。

评估文库复杂度有不同的算法,除了picard外,还有其他工具可以用,Preseq就是其中最常用的一款工具,文章发表在nature methods上,对应的链接如下

http://www.3v1.473v.com/articles/nmeth.2375

Preseq是一款通用的评估二代测序文库复杂度的方法,官网如下

http://www.097.o038.com/software/preseq/challenge/

该软件还有对应的R包版本preseqR, 链接如下

http://www.19w.sbh555.com/web/packages/preseqR/index.html

通过对序列进行随机抽样,计算不同抽样数据量下的文库复杂度,然后绘制文库复杂度曲线,以此来评估当前测序量是否满足复杂度的需求,是否需要加测数据量,其用法如下

# 第一步,对bam文件排序
samtools sort input.bam -o input.sorted.bam
# 第二步,运行preseq
preseq lc_extrap \
-s 10000 \
-o preseq.output.txt \
-B \
-P \
input.sorted.bam

-s指定抽样的reads数目,-o指定输出结果文,-B表示输入文件为bam文件,-P表示输入文件为双端测序,输出文件内容示意如下

上图实际上是一种饱和度曲线,曲线末端斜率上升越趋近于平缓,说明再增加测序量新发现的fragment也不会多很多,当前测序量已经能够满足要求,如果曲线末端斜率非常陡峭,说明还需进一步增加数据量。

·end·

    猜你喜欢

    0条评论

    发表

    请遵守用户 评论公约

    类似文章 更多
    喜欢该文的人也喜欢 更多

    太阳城娱乐集团手机app 亚洲星娱乐app下载直营网 真人娱乐官方推荐手机app 大西洋登入 重庆时时彩网上平台登入
    777娱乐ag棋牌 澳门星际棋牌883 大富豪娱乐MW电子 yh17.com 拉菲棋牌现金网
    新葡京娱乐真人棋牌 bmw57.com t6棋牌下载 欢乐谷娱乐对战游戏 msc127.com
    申博现金网38345 msc293.com ag国际馆现金网 sbc36.com 滨海国际MW