首页 > 技术文章 > 38、生物数据库

renping 2017-12-10 18:09 原文

核酸数据库:一级:NCBI---NIH            EMBL---ENA               DDBJ---NIG (共同组成INSDC)            ENsemble           JCVI(宏基因组,HMP: Human Microbiome Project)等

                     二级:wormBase    FlyBase       Unigene等

蛋白数据库:

一级:蛋白序列数据库

                   Swisspro(人工注释的蛋白序列数据库)

                    TREMBL(Translation form EMBL 计算机注释的蛋白序列数据库)

                     PIR(Protein information Resource 支持基因组学,蛋白组学和系统生物学研究)

                    ###共同组成联合蛋白序列数据库(Uniprot: Universal Protein Rsouce)三个层次的数据库http://www.uniprot.org/

                      UniParc:收录其所有子库的蛋白序列,量大,粗糙

                      Uniref:    :收录其几个主要数据库,并将重复序列去除

                      UniProtKB:有详细的注释并与其余数据库有链接,分为UniProtKB/Swiss-Prot      UniProtKB/TrEMBL

一级:蛋白结构数据库(PDB,Protein Data Bank),共蛋白结构

                 世界上唯一生物大分子3D结构数据库。大分子除了蛋白质以外还有核算以及两者的复合物。数据库分为四级,一级结构primary structure:氨基酸序列 ;二级结构Secondary structure :周期性的结构构想,α螺旋,β折叠;三级结构Tertiary structure:整条多肽链的空间结构,3D结构;四级结构Quaternary structure:几个蛋白质分子(亚基)形成的复合体,如四聚体等。http://www.rcsb.org/pdb/home/home.do     例子:3H6X         JSmol可视化软件

 

二级:Pfam数据库http://pfam.xfam.org/

 

                是一个蛋白质结构域家族集合,目前有16712个蛋白质家族蛋白质有一个或者多个功能区域组成,这些功能区域通常称为结构域。

 

 

                 

                                            

                               

                                                

 

                      

                                           

                                          

推荐阅读