哈哈,搜了壹圈沒發現網上有關於MAnorm的中文教程或者是說明,本文將是第壹篇~撒花?ヽ(°▽°)ノ?那就要用心寫了,感到鴨梨.jpg==
首先,MAnorm是什麽,可以做什麽呢?
簡單地說,這是壹款尋找兩個ChIP-Seq樣本之間差異peak的軟件。壹般ChIP的流程中,若是單壹處理的細胞系,那麽callpeak之後可能會做binding motif的分析或是peak相關gene的功能分析等;但若是兩種處理的細胞系(比如饑餓組和對照組),我們肯定想要知道兩種處理下,組蛋白修飾的差異,類似於RNA-Seq中差異表達基因的分析,所以這時就需要進行差異分析。MAnorm就可以實現這樣的分析需要。
壹般來說,上述差異分析不壹定要在peaks水平進行,完全可以在reads水平,這個就叫做“壹步法”;而通過先分別callpeak再比較peaks的density或者depth等,就是所謂的“兩步法”。不同方法有不同類型的軟件可供選擇,這就是ChIP分析成熟的地方,不過技術流大可根據自己的目的寫腳本進行個性化處理,這個暫且不表。
那麽差異分析軟件如何選擇呢?根據組蛋白修飾類型、樣品是否有重復、是否需要callpeak(即predefined region set),下圖壹目了然:
我的樣品有寬峰窄峰兩種修飾、無重復,項目時間緊張盡量想用壹個軟件實現,所以選擇了MAnorm。
話不多說,直接看圖:
1.1.4版本 :
conda/PyPi
需要註意的是,此版本只支持bed格式且不支持paired-end模式,會把所有reads當成single-end處理。若reads文件想用支持更多的格式(sam/bam/bedpe等),請用v1.2.0。
1.2.0版本 :
暫時只能從Github復制源碼進行安裝。方法:
建議首先閱讀使用說明,最好從linux中 manorm --help ,或者在Github中找到相應版本的 附帶說明 ,這壹點很重要,因為有時網上搜到的說明和妳實際用的版本不壹致,會走彎路,不要問我咋知道的。
所以要準備的文件有4個:
將如上文件移動至新文件夾下待用。***tips:這裏不再需要對照組In的文件了
基本命令(--p1 --p2 --r1 --r2 -o是5個必需參數,註意是兩個-):
建議試運行壹組數據先,根據報錯文件調整格式。軟件還不太成熟,需要多調整格式。
運行約10min,產生4個結果文件:
sample1peaks_vs_sample2peaks_all_MAvalues.xls :這個是主要的結果文件,Excel格式,裏面的peak_group有標註是common/1unique/2unique的。
output_figures 文件夾 :4個圖,計算的Mvalue Avalue(MA)及校正之後的MA,大概就是這個意思,還需要讀文獻琢磨
output_filters 文件夾 :3個peaks.bed文件,可能就是條件嚴格了點之後的結果,兩個biased包括的peaks很少,壹個unbiased包括的peaks很多跟all那個文件差不了多少。
output_tracks 文件夾 :3個wig文件,是M A values的,UCSC可視的文件類型。
綜上,決定用main output file即第壹個結果,進行後面的分析。