UniProt是Universal Protein的(de)英文(wen)縮寫,是信(xin)息最豐富、資源最廣的(de)蛋白質(zhi)數(shu)據庫。它(ta)由整合(he)Swiss-Prot、TrEMBL和(he) PIR-PSD三大數(shu)據庫的(de)數(shu)據而(er)成(cheng)。他的(de)數(shu)據主(zhu)要(yao)來(lai)自于(yu)基因(yin)組測序項目完成(cheng)后(hou),后(hou)續獲得的(de)蛋白質(zhi)序列(lie)。它(ta)包(bao)含了大量來(lai)自文(wen)獻的(de)蛋白質(zhi)的(de)生物功能的(de)信(xin)息。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫(ku))它是(shi)經過專家校驗的數據集,主要由(you)兩(liang)部分組成:UniProtKB/Swiss-Prot(包(bao)(bao)含檢查過的、手工(gong)注釋的條(tiao)(tiao)目(mu))和UniProtKB/TrEMBL(包(bao)(bao)含未校驗的、自動注釋的條(tiao)(tiao)目(mu)),在2010年8月是(shi)10日發布的版本中(zhong),UniProtKB/Swiss-Prot包(bao)(bao)含519,348條(tiao)(tiao)注釋條(tiao)(tiao)目(mu),UniProtKB/TrEMBL包(bao)(bao)含11,636,205條(tiao)(tiao)注釋條(tiao)(tiao)目(mu)。
UniProtKB/Swiss-Prot
高(gao)質量的(de)、手(shou)工注釋的(de)、非冗余(yu)的(de)數據(ju)集;主(zhu)要來自文獻中的(de)研(yan)究(jiu)成果和(he)E-value校驗過(guo)計算(suan)分析(xi)結果。有質量保(bao)證(zheng)的(de)數據(ju)才被加入該數據(ju)庫。
UniProtKB/TrEMBL
該數(shu)(shu)據(ju)集包含(han)高質量的(de)(de)計算分析結果,一般都在(zai)自(zi)動注(zhu)(zhu)釋中富集,主要應對基(ji)因組(zu)項目獲得的(de)(de)大(da)量數(shu)(shu)據(ju)流以人(ren)(ren)工校驗在(zai)時(shi)間上(shang)和人(ren)(ren)力上(shang)的(de)(de)不足。他能注(zhu)(zhu)釋所(suo)有(you)可用的(de)(de)蛋白序(xu)(xu)列(lie)。在(zai)三大(da)核酸(suan)數(shu)(shu)據(ju)庫(ku)(EMBL-Bank/GenBank/DDBJ)中注(zhu)(zhu)釋的(de)(de)編碼(ma)序(xu)(xu)列(lie)都被自(zi)動翻(fan)譯并(bing)加(jia)入該數(shu)(shu)據(ju)庫(ku)中。它(ta)也有(you)來(lai)自(zi)PDB數(shu)(shu)據(ju)庫(ku)的(de)(de)序(xu)(xu)列(lie),以及Ensembl、Refeq和CCDS基(ji)因預測的(de)(de)序(xu)(xu)列(lie)。
UniParc
UniParc全稱是UniProt Archive,他是一(yi)(yi)個(ge)綜合性的(de)非冗余(yu)數(shu)據(ju)庫,他包含了所有(you)主要的(de)、公開的(de)數(shu)據(ju)庫的(de)蛋(dan)白(bai)質(zhi)(zhi)序(xu)列。 由于(yu)蛋(dan)白(bai)質(zhi)(zhi)可能在不(bu)同的(de)數(shu)據(ju)庫中(zhong)存在,并(bing)(bing)且(qie)可能在同一(yi)(yi)個(ge)數(shu)據(ju)庫中(zhong)有(you)多個(ge)版(ban)本,為了去冗余(yu),UniaraParc對每條(tiao)唯(wei)一(yi)(yi)的(de)序(xu)列只(zhi)存一(yi)(yi)次。無論是否為同一(yi)(yi)物種的(de)序(xu)列,只(zhi)要序(xu)列相同就被合并(bing)(bing)為一(yi)(yi)條(tiao),每條(tiao)序(xu)列提供穩定的(de)、唯(wei)一(yi)(yi)的(de)編號UPI。該(gai)數(shu)據(ju)庫只(zhi)含有(you)蛋(dan)白(bai)質(zhi)(zhi)的(de)序(xu)列信(xin)息,而沒(mei)有(you)注釋數(shu)據(ju)。