UniProt是(shi)Universal Protein的(de)英文縮寫(xie),是(shi)信息(xi)(xi)最豐富(fu)、資源最廣的(de)蛋(dan)白質(zhi)數(shu)(shu)據(ju)庫。它由(you)整合(he)Swiss-Prot、TrEMBL和 PIR-PSD三大數(shu)(shu)據(ju)庫的(de)數(shu)(shu)據(ju)而成(cheng)。他的(de)數(shu)(shu)據(ju)主(zhu)要來自于基(ji)因組測(ce)序項(xiang)目完成(cheng)后(hou),后(hou)續獲(huo)得的(de)蛋(dan)白質(zhi)序列。它包含(han)了大量來自文獻的(de)蛋(dan)白質(zhi)的(de)生物功能的(de)信息(xi)(xi)。
UniProtKB全稱(cheng)UniProt Knowledgebase(UniProt知識庫)它是經過專(zhuan)家(jia)校驗(yan)的(de)數據集,主要由兩部(bu)分組(zu)成:UniProtKB/Swiss-Prot(包(bao)(bao)含(han)檢查過的(de)、手(shou)工注(zhu)釋(shi)(shi)的(de)條(tiao)目(mu))和(he)UniProtKB/TrEMBL(包(bao)(bao)含(han)未(wei)校驗(yan)的(de)、自動注(zhu)釋(shi)(shi)的(de)條(tiao)目(mu)),在2010年8月是10日發布的(de)版本中,UniProtKB/Swiss-Prot包(bao)(bao)含(han)519,348條(tiao)注(zhu)釋(shi)(shi)條(tiao)目(mu),UniProtKB/TrEMBL包(bao)(bao)含(han)11,636,205條(tiao)注(zhu)釋(shi)(shi)條(tiao)目(mu)。
UniProtKB/Swiss-Prot
高質(zhi)量(liang)(liang)的、手(shou)工(gong)注(zhu)釋的、非冗余的數(shu)據集;主(zhu)要來自文獻中的研(yan)究(jiu)成果和E-value校(xiao)驗過計算(suan)分析結果。有質(zhi)量(liang)(liang)保證(zheng)的數(shu)據才(cai)被加入該數(shu)據庫。
UniProtKB/TrEMBL
該(gai)數(shu)據(ju)(ju)集包含高質量(liang)的(de)計算分析結果,一(yi)般都在自動注釋中(zhong)富集,主要應對基因組(zu)項目獲得的(de)大(da)量(liang)數(shu)據(ju)(ju)流以人工校驗在時間上和人力上的(de)不足。他(ta)能注釋所有(you)可用(yong)的(de)蛋白序(xu)列(lie)(lie)。在三大(da)核酸數(shu)據(ju)(ju)庫(EMBL-Bank/GenBank/DDBJ)中(zhong)注釋的(de)編(bian)碼序(xu)列(lie)(lie)都被自動翻譯(yi)并加(jia)入該(gai)數(shu)據(ju)(ju)庫中(zhong)。它(ta)也有(you)來(lai)自PDB數(shu)據(ju)(ju)庫的(de)序(xu)列(lie)(lie),以及Ensembl、Refeq和CCDS基因預測的(de)序(xu)列(lie)(lie)。
UniParc
UniParc全稱(cheng)是(shi)UniProt Archive,他是(shi)一(yi)個綜合性(xing)的(de)非冗余數(shu)(shu)(shu)據(ju)庫(ku)(ku)(ku),他包含了(le)所有(you)(you)主要(yao)的(de)、公開的(de)數(shu)(shu)(shu)據(ju)庫(ku)(ku)(ku)的(de)蛋白(bai)質序(xu)(xu)列。 由于蛋白(bai)質可能在不同的(de)數(shu)(shu)(shu)據(ju)庫(ku)(ku)(ku)中(zhong)存在,并且(qie)可能在同一(yi)個數(shu)(shu)(shu)據(ju)庫(ku)(ku)(ku)中(zhong)有(you)(you)多個版本(ben),為了(le)去冗余,UniaraParc對每條(tiao)唯一(yi)的(de)序(xu)(xu)列只存一(yi)次。無論是(shi)否為同一(yi)物種(zhong)的(de)序(xu)(xu)列,只要(yao)序(xu)(xu)列相(xiang)同就被合并為一(yi)條(tiao),每條(tiao)序(xu)(xu)列提供穩定(ding)的(de)、唯一(yi)的(de)編號UPI。該數(shu)(shu)(shu)據(ju)庫(ku)(ku)(ku)只含有(you)(you)蛋白(bai)質的(de)序(xu)(xu)列信息,而沒有(you)(you)注釋數(shu)(shu)(shu)據(ju)。