當前位置:編程學習大全網 - 人物素材 - 生物信息學有哪些方面的應用?

生物信息學有哪些方面的應用?

1,測序與序列比對(SequenceAlignment)\x0d\測序是生物信息學的基礎和主要數據來源,可以是人類數據也可以是其他的數據。序列比對的基本問題是比較兩個或兩個以上符號序列的相似性或不相似性.從生物學的初衷來看,這壹問題包含了以下幾個意義:從相互重疊的序列片斷中重構DNA的完整序列.在各種試驗條件下從探測數據(probedata)中決定物理和基因圖存貯,遍歷和比較數據庫中的DNA序列比較兩個或多個序列的相似性在數據庫中搜索相關序列和子序列尋找核苷酸(nucleotides)的連續產生模式找出蛋白質和DNA序列中的信息成分序列比對考慮了DNA序列的生物學特性,如序列局部發生的插入,刪除(前兩種簡稱為indel)和替代,序列的目標函數獲得序列之間突變集最小距離加權和或最大相似性和,對齊的方法包括全局對齊,局部對齊,代溝懲罰等.兩個序列比對常采用動態規劃算法,這種算法在序列長度較小時適用,然而對於海量基因序列(如人的DNA序列高達109bp),這壹方法就不太適用,甚至采用算法復雜性為線性的也難以奏效.因此,啟發式方法的引入勢在必然,著名的BALST和FASTA算法及相應的改進方法均是從此前提出發的.\x0d\\x0d\2,蛋白質結構比對和預測\x0d\\x0d\基本問題是比較兩個或兩個以上蛋白質分子空間結構的相似性或不相似性.蛋白質的結構與功能是密切相關的,壹般認為,具有相似功能的蛋白質結構壹般相似.蛋白質是由氨基酸組成的長鏈,長度從50到1000~3000AA(AminoAcids),蛋白質具有多種功能,如酶,物質的存貯和運輸,信號傳遞,抗體等等.氨基酸的序列內在的決定了蛋白質的3維結構.壹般認為,蛋白質有四級不同的結構.研究蛋白質結構和預測的理由是:醫藥上可以理解生物的功能,尋找dockingdrugs的目標,農業上獲得更好的農作物的基因工程,工業上有利用酶的合成.直接對蛋白質結構進行比對的原因是由於蛋白質的3維結構比其壹級結構在進化中更穩定的保留,同時也包含了較AA序列更多的信息.蛋白質3維結構研究的前提假設是內在的氨基酸序列與3維結構壹壹對應(不壹定全真),物理上可用最小能量來解釋.從觀察和總結已知結構的蛋白質結構規律出發來預測未知蛋白質的結構.同源建模(homologymodeling)和指認(Threading)方法屬於這壹範疇.同源建模用於尋找具有高度相似性的蛋白質結構(超過30%氨基酸相同),後者則用於比較進化族中不同的蛋白質結構.然而,蛋白結構預測研究現狀還遠遠不能滿足實際需要.\x0d\3,基因識別,非編碼區分析研究.\x0d\\x0d\基因識別的基本問題是給定基因組序列後,正確識別基因的範圍和在基因組序列中的精確位置.非編碼區由內含子組成(introns),壹般在形成蛋白質後被丟棄,但從實驗中,如果去除非編碼區,又不能完成基因的復制.顯然,DNA序列作為壹種遺傳語言,既包含在編碼區,又隱含在非編碼序列中.分析非編碼區DNA序列目前沒有壹般性的指導方法.在人類基因組中,並非所有的序列均被編碼,即是某種蛋白質的模板,已完成編碼部分僅占人類基因總序列的3~5%,顯然,手工的搜索如此大的基因序列是難以想象的.偵測密碼區的方法包括測量密碼區密碼子(codon)的頻率,壹階和二階馬爾可夫鏈,ORF(OpenReadingFrames),啟動子(promoter)識別,HMM(HiddenMarkovModel)和GENSCAN,SpliceAlignment等等.\x0d\\x0d\4,分子進化和比較基因組學\x0d\\x0d\分子進化是利用不同物種中同壹基因序列的異同來研究生物的進化,構建進化樹.既可以用DNA序列也可以用其編碼的氨基酸序列來做,甚至於可通過相關蛋白質的結構比對來研究分子進化,其前提假定是相似種族在基因上具有相似性.通過比較可以在基因組層面上發現哪些是不同種族中***同的,哪些是不同的.早期研究方法常采用外在的因素,如大小,膚色,肢體的數量等等作為進化的依據.近年來較多模式生物基因組測序任務的完成,人們可從整個基因組的角度來研究分子進化.在匹配不同種族的基因時,壹般須處理三種情況:Orthologous:不同種族,相同功能的基因;Paralogous:相同種族,不同功能的基因;Xenologs:有機體間采用其他方式傳遞的基因,如被病毒註入的基因.這壹領域常采用的方法是構造進化樹,通過基於特征(即DNA序列或蛋白質中的氨基酸的堿基的特定位置)和基於距離(對齊的分數)的方法和壹些傳統的聚類方法(如UPGMA)來實現.\x0d\5,序列重疊群(Contigs)裝配\x0d\根據現行的測序技術,每次反應只能測出500或更多壹些堿基對的序列,如人類基因的測量就采用了短槍(shortgun)方法,這就要求把大量的較短的序列全體構成了重疊群(Contigs).逐步把它們拼接起來形成序列更長的重疊群,直至得到完整序列的過程稱為重疊群裝配.從算法層次來看,序列的重疊群是壹個NP-完全問題.\x0d\6,遺傳密碼的起源\x0d\通常對遺傳密碼的研究認為,密碼子與氨基酸之間的關系是生物進化歷史上壹次偶然的事件而造成的,並被固定在現代生物的***同祖先裏,壹直延續至今.不同於這種"凍結"理論,有人曾分別提出過選擇優化,化學和歷史等三種學說來解釋遺傳密碼.隨著各種生物基因組測序任務的完成,為研究遺傳密碼的起源和檢驗上述理論的真偽提供了新的素材.\x0d\\x0d\7,基於結構的藥物設計\x0d\人類基因工程的目的之壹是要了解人體內約10萬種蛋白質的結構,功能,相互作用以及與各種人類疾病之間的關系,尋求各種治療和預防方法,包括藥物治療.基於生物大分子結構及小分子結構的藥物設計是生物信息學中的極為重要的研究領域.為了抑制某些酶或蛋白質的活性,在已知其蛋白質3級結構的基礎上,可以利用分子對齊算法,在計算機上設計抑制劑分子,作為候選藥物.這壹領域目的是發現新的基因藥物,有著巨大的經濟效益.\x0d\8.生物系統的建模和仿真\x0d\隨著大規模實驗技術的發展和數據累積,從全局和系統水平研究和分析生物學系統,揭示其發展規律已經成為後基因組時代的另外壹個研究熱點-系統生物學。目前來看,其研究內容包括生物系統的模擬(CurrOpinRheumatol,2007,463-70),系統穩定性分析(NonlinearDynamicsPsycholLifeSci,2007,413-33),系統魯棒性分析(ErnstScheringResFoundWorkshop,2007,69-88)等方面。以SBML(Bioinformatics,2007,1297-8)為代表的建模語言在迅速發展之中,以布爾網絡(PLoSComputBiol,2007,e163)、微分方程(MolBiolCell,2004,3841-62)、隨機過程(NeuralComput,2007,3262-92)、離散動態事件系統等(Bioinformatics,2007,336-43)方法在系統分析中已經得到應用。很多模型的建立借鑒了電路和其它物理系統建模的方法,很多研究試圖從信息流、熵和能量流等宏觀分析思想來解決系統的復雜性問題(AnalQuantCytolHistol,2007,296-308)。當然,建立生物系統的理論模型還需要很長時間的努力,現在實驗觀測數據雖然在海量增加,但是生物系統的模型辨識所需要的數據遠遠超過了目前數據的產出能力。例如,對於時間序列的芯片數據,采樣點的數量還不足以使用傳統的時間序列建模方法,巨大的實驗代價是目前系統建模主要困難。系統描述和建模方法也需要開創性的發展。\x0d\9.生物信息學技術方法的研究\x0d\生物信息學不僅僅是生物學知識的簡單整理和、數學、物理學、信息科學等學科知識的簡單應用。海量數據和復雜的背景導致機器學習、統計數據分析和系統描述等方法需要在生物信息學所面臨的背景之中迅速發展。巨大的計算量、復雜的噪聲模式、海量的時變數據給傳統的統計分析帶來了巨大的困難,需要像非參數統計(BMCBioinformatics,2007,339)、聚類分析(QualLifeRes,2007,1655-63)等更加靈活的數據分析技術。高維數據的分析需要偏最小二乘(partialleastsquares,PLS)等特征空間的壓縮技術。在計算機算法的開發中,需要充分考慮算法的時間和空間復雜度,使用並行計算、網格計算等技術來拓展算法的可實現性。\x0d\10,生物圖像\x0d\沒有血緣關系的人,為什麽長得那麽像呢?\x0d\外貌是像點組成的,像點愈重合兩人長得愈像,那兩個沒有血緣關系的人像點為什麽重合?\x0d\有什麽生物學基礎?基因是不是相似?我不知道,希望專家解答。\x0d\11,其他\x0d\如基因表達譜分析,代謝網絡分析;基因芯片設計和蛋白質組學數據分析等,逐漸成為生物信息學中新興的重要研究領域;在學科方面,由生物信息學衍生的學科包括結構基因組學,功能基因組學,比較基因組學,蛋白質學,藥物基因組學,中藥基因組學,腫瘤基因組學,分子流行病學和環境基因組學,成為系統生物學的重要研究方法.從現在的發展不難看出,基因工程已經進入了後基因組時代.我們也有應對與生物信息學密切相關的如機器學習,和數學中可能存在的誤導有壹個清楚的認識.

  • 上一篇:如何制作網頁教程制作網頁的流程
  • 下一篇:骷髏對稱插畫-怎麽畫骷髏
  • copyright 2024編程學習大全網