gene Ontology 是生物中Ontology中壹個重要應用。go項目最初是由研究三種模式生物(果蠅、小鼠和酵母)基因組的研究者***同發起。是生物信息分析中很重要的壹個方法
go是在生物領域應用非常廣,可以幫助生物學家對基因產物進行準確的定義(功能、位置),節省時間。
因為在最開始的時候,生物學家們更多是專註於自己研究的物種/課題,而且每個生物學家對功能等的定義是存在差異的,導致不同實驗室/物種不能實現直接的對接(比如A物種內的x基因的功能使用的是a這個詞匯進行註釋,而B物種內的x基因的功能卻使用的是與a同義的詞匯b進行註釋,這種情況計算機無法識別),就像講兩種語言的人,無法直接進行語言交流。這種情況導致的問題是,出現了壹種阻礙,讓問題復雜化了。所以就有了Ontology在生物領域中的應用,實現“書同文”。
go定義了基因/基因產物的功能(通過術語)且定義了它們各自之間功能是怎樣聯系的(關系)。它組成了壹個具有大量term的詞匯庫,並定義各種term之間的關系(is_a part_of R)。
GO通過三個方面的術語對基因/基因產物的功能進行描述:分子功能(molecular function) -由基因/基因產物行使的分子水平上的功能; 細胞組件(cellular component)-基因/基因產物產生功能時其在細胞結構上的位置;生物學過程(biological process)-在哪個生物學通路/生物過程發揮作用。
目前,GO 註釋主要有兩種方法:
(1)序列相似性比對(BLAST):例如blast2go(將blast結果轉化為GO註釋)
(2)結構域相似性比對(InterProScan)
blast2go的本地化教程:
在blast2go軟件正確安裝的情況下,使用blast2go進行go註釋,出現無法得到註釋結果的問題:
另外還有可能出錯的原因是,blast2go無法識別blast高的版本號,當使用高版本的blast的時候,直接將版本號給修改為低版本的就行了,例如(BLASTX 2.2.25+)
GO 的圖形是壹個有向無環圖