當前位置:編程學習大全網 - 編程語言 - 獲得了大量的測序數據,可以進行哪些研究

獲得了大量的測序數據,可以進行哪些研究

隨著學科的發展,目前許多研究都涉及高通量數據分析(highthroughputdataanalysis)。比較常見的是測序結果分析,例如RNA-seq、CHIP等等。眾所周知,數據分析是高通量測序應用於生物研究最關鍵的步驟,分析不好,得到的海量數據無異於壹堆垃圾。下面是剛剛接觸高通量測序數據分析的同學可能比較關心的幾個問題。需要說明的是:這些都是基於微生物領域且數據量不是特別大的情況。其它領域(植物、動物、醫學等等)的高通量測序數據處理我暫時還不太了解。1.是不是壹定要用大型計算機?除了序列拼接組裝以外,其它分析不是壹定要大型計算機,在普通的PC上也可以進行壹些處理,當然,買壹臺或幾臺高性能的工作站電腦,能顯著加快數據處理的速度。2.是不是壹定要用Linux系統?也不壹定非用Linux不可,在Window下可以完成部分數據處理。如果妳想以後長期從事高通量測序數據分析工作,熟悉Linux是必須的,但是如果妳是為了處理壹下數據混混畢業(中國有很多研究生是這樣,這是事實),我覺得沒必要額外花些時間去學習使用Linux,雖然現在Linux已經變得不那麽難用了。3.序列拼接又要用大型計算機又要用Linux系統怎麽?方法有兩個:(1)找商業公司組裝拼接,(2)用亞馬遜的雲計算服務。4.是不是必須自己寫些程序?數據處理中經常要對文本文件中的內容進行調整、篩選、比對,據我所知現在還沒有什麽軟件可以非常靈活的完成這些操作,將來也很難有,因為這些操作都是與實際數據相關的,沒有統壹的規律。現在大部分人都是用腳本程序來完成這些任務,因此數據分析過程中需要自己寫點程序。在這方面比較適合的編程語言是Python和Perl,我覺得Python比較好用也比較有前途,但很多人還是用Perl,問其原因,得到的答復是是師兄師姐都用Perl,不得不用Perl。5.數據如何分析?這個問題太難回答了,並且我覺得目前及將來很長壹段時間,在網上應該找不到像DGGE操作步驟、T-RFLP操作步驟、DGGE數據分析方法等這類非常詳細的教程類的東西。因為高通量測序技術及其數據分析方法現在發展非常快,時刻在變。唯壹的法就是自己去研究Paper,研究相關軟件的說明書。6.高通量測序數據處理軟件下面是幾個被廣泛使用的高通量測序數據分析軟件,主要是針對微生物的,並且主要用於分析16SrDNAPCR產物或宏基因組(Metagenome)高通量測序數據,了解樣品中細菌或古菌等微生物的種群及功能的多樣性和豐度。

  • 上一篇:建構區中班教案
  • 下一篇:如何在大學期間兼顧好學習和“搞技術”,同時如何提高自己的動手能力?
  • copyright 2024編程學習大全網