新聞中心
怎么使用SICER進行peak calling,針對這個問題,這篇文章詳細介紹了相對應的分析和解答,希望可以幫助更多想解決這個問題的小伙伴找到更簡單易行的方法。
創(chuàng)新互聯(lián)堅持“要么做到,要么別承諾”的工作理念,服務領域包括:網站制作、做網站、企業(yè)官網、英文網站、手機端網站、網站推廣等服務,滿足客戶于互聯(lián)網時代的臺州網站設計、移動媒體設計的需求,幫助企業(yè)找到有效的互聯(lián)網解決方案。努力成為您成熟可靠的網絡建設合作伙伴!
chip_seq數(shù)據(jù)中peak的長度范圍跨度較大,既有覆蓋幾個核小體的幾百bp的peak, 也有包含多個基因長度在上千kb的peak。比如H3K4me2和H3K4me3這兩種組蛋白修飾中peak在幾百bp左右, 而H3K27me3中則為長度在幾十到幾百kb之間。組蛋白修飾中peak長度跨度大,弱信號分散都特點,使得基于轉錄因子TF結合位點的peak calling軟件在分析這類數(shù)據(jù)時準確度較差。
SICER是一款專門針對組蛋白修飾的chip數(shù)據(jù)進行peak calling的軟件,核心思想也是基于滑動窗口和局部泊松分布的方式來識別富集區(qū)域,下圖所示為該軟件用默認參數(shù)識別到的H3K27me3的peak區(qū)域
黑色區(qū)域為ENCODE分析得到的peak區(qū)域,紅色區(qū)域為SICER分析得到的peak區(qū)域。該軟件官網如下
https://home.gwu.edu/~wpeng/Software.htm
為例方便使用,有人對該軟件進行了分裝,使用起來更加方便,源代碼托管在github上,網址如下
https://github.com/dariober/SICERpy
基本用法如下
python SICERpy \
-c input.bam \
-w 200 \
-g 3 \
-t ip.bam \
> peak.bed
-w
參數(shù)表示滑動窗口的大小,默認值為200。數(shù)值越小, 識別到的peak區(qū)間長度相對越短且越分散;數(shù)值越大,會造成過渡擬合,識別到的peak區(qū)間過長,丟失掉真實的信息,示意如下
對于轉錄因子,官方推薦滑動窗口設置為50-100bp, 對于組蛋白修飾,推薦設置為200bp。
-g
參數(shù)代表gap的大小,默認值為3。和windows size類似,該參數(shù)也直接影響peak區(qū)間的定義,示意如下
對于轉錄因子,官方推薦該數(shù)值和滑動窗口數(shù)值保持相同;對于組蛋白修飾,推薦值為3。
輸出文件為bed格式,共8列,每列含義如下
chrom
start
end
chip read count
input read count
pvalue
fold_enrichment
fdr
可以最后一列的fdr值,來篩選得到高可信度的peak信息,用法如下
awk '$8 < 0.01' peaks.bed > peaks.01.bed
關于怎么使用SICER進行peak calling問題的解答就分享到這里了,希望以上內容可以對大家有一定的幫助,如果你還有很多疑惑沒有解開,可以關注創(chuàng)新互聯(lián)行業(yè)資訊頻道了解更多相關知識。
當前題目:怎么使用SICER進行peakcalling
轉載來源:http://www.dlmjj.cn/article/pghghj.html