當前位置:編程學習大全網 - 站長素材 - 轉錄測序中的nr,nt,swissprot,cog,kegg,go分別是什麽意思

轉錄測序中的nr,nt,swissprot,cog,kegg,go分別是什麽意思

NR庫屬於非冗余蛋白序列數據庫,是NCBI官方的蛋白序列數據庫,數據來源於GenPept、SwissProt、PIR、PDF、PDB以及NCBI RefSeq,是默認的蛋白比對數據庫。

NT數據庫是美國國家生物技術信息中心NCBI官方的核酸序列數據庫,NT庫屬於非冗余核酸序列數據庫,數據來源於GenBank、EMBL 以及 DDBJ,是NCBI默認的核酸blast比對數據庫。

SwissProt數據庫是檢查過的、手工註釋的蛋白數據庫,我們將Unigene註釋到SwissProt數據庫,以得到更加高質量的註釋結果。

COG (clusters of orthologous groups)主要是原核生物和單細胞真核生物的直系同源物,KOG(clusters of euKaryotic Orthologous Groups)數據庫包含了7個完整基因組的真核生物的直系同源家族蛋白, 構成每個 KOG 的蛋白集是被假定為來自於壹個祖先蛋白,根據系統發生進行分類,壹般COG指原核生物,KOG指真核生物,KOG與COG提供了相似的基因同源物的分類信息。

KEGG (Kyoto Encyclopedia of Genes and Genomes) 是處理基因組、生物通路、疾病、藥物和化學物質之間聯系的集成數據庫。 KEGG用於生物信息研究等,包括基因組,代謝組學等其他組學的數據分析,涵蓋了Drug Development(藥物開發)、 Cellular Processes(細胞過程)、 Environmental Information Processing(環境信息處理)、Genetic Information Processing(遺傳信息處理)、 Human Diseases(人類疾病), Metabolism(代謝)、 Organismal Systems(有機系統)等方面。

GO( Gene Ontology ): 基因本體。生物技術的發展迅速,數據越來越多,不同數據庫命名標準不統壹,為了解決不同的生物學數據庫可能會使用不同的術語的問題,從而基因本體聯合會(Gene Onotology Consortium)開發GO來描述基因在分子、細胞和組織水平的功能體現。GO的基本描述單元是GO terms。GO主要包括三個分支: 生物過程(biological processes)、分子功能(molecular function)和細胞組成(cellular components),用於描述基因產物的功能。GO中使用了is_a、part_of和regulates三種互作關系。

  • 上一篇:原神無名武士的刀華麗寶箱怎麽開?
  • 下一篇:怎麽制作小品動畫
  • copyright 2024編程學習大全網