UniProt是(shi)Universal Protein的(de)(de)英文(wen)縮寫(xie),是(shi)信(xin)息最豐富、資源最廣的(de)(de)蛋白質(zhi)數(shu)據庫。它(ta)由整合Swiss-Prot、TrEMBL和 PIR-PSD三大數(shu)據庫的(de)(de)數(shu)據而成。他的(de)(de)數(shu)據主要來(lai)自(zi)于基因(yin)組測序項目完成后,后續獲得的(de)(de)蛋白質(zhi)序列。它(ta)包(bao)含了大量來(lai)自(zi)文(wen)獻的(de)(de)蛋白質(zhi)的(de)(de)生物(wu)功能(neng)的(de)(de)信(xin)息。
UniProtKB全稱UniProt Knowledgebase(UniProt知識庫(ku))它是(shi)經過專家校驗(yan)的數據集,主要由兩部分組(zu)成:UniProtKB/Swiss-Prot(包(bao)含檢(jian)查過的、手工注釋(shi)的條(tiao)(tiao)(tiao)目)和UniProtKB/TrEMBL(包(bao)含未校驗(yan)的、自動注釋(shi)的條(tiao)(tiao)(tiao)目),在2010年8月是(shi)10日發布的版本中,UniProtKB/Swiss-Prot包(bao)含519,348條(tiao)(tiao)(tiao)注釋(shi)條(tiao)(tiao)(tiao)目,UniProtKB/TrEMBL包(bao)含11,636,205條(tiao)(tiao)(tiao)注釋(shi)條(tiao)(tiao)(tiao)目。
UniProtKB/Swiss-Prot
高(gao)質量的、手工注釋(shi)的、非(fei)冗余的數據(ju)集;主要(yao)來自文獻中(zhong)的研究成果和E-value校(xiao)驗過計算分(fen)析結果。有(you)質量保證的數據(ju)才被加(jia)入該(gai)數據(ju)庫。
UniProtKB/TrEMBL
該(gai)數據集包含高(gao)質(zhi)量的(de)計算分(fen)析(xi)結果,一般都在(zai)自(zi)動(dong)注(zhu)(zhu)釋中(zhong)富集,主要應對基(ji)因(yin)組項目獲得的(de)大量數據流以(yi)人工校(xiao)驗在(zai)時間上(shang)和人力上(shang)的(de)不足。他能注(zhu)(zhu)釋所有可用的(de)蛋白序(xu)列(lie)。在(zai)三大核酸數據庫(ku)(ku)(EMBL-Bank/GenBank/DDBJ)中(zhong)注(zhu)(zhu)釋的(de)編碼序(xu)列(lie)都被自(zi)動(dong)翻譯并加(jia)入該(gai)數據庫(ku)(ku)中(zhong)。它也有來自(zi)PDB數據庫(ku)(ku)的(de)序(xu)列(lie),以(yi)及Ensembl、Refeq和CCDS基(ji)因(yin)預測(ce)的(de)序(xu)列(lie)。
UniParc
UniParc全(quan)稱是UniProt Archive,他是一(yi)個綜(zong)合性的(de)(de)(de)(de)非冗余數據庫(ku),他包含(han)了所有(you)主要(yao)(yao)的(de)(de)(de)(de)、公(gong)開的(de)(de)(de)(de)數據庫(ku)的(de)(de)(de)(de)蛋(dan)白(bai)質序(xu)(xu)(xu)列(lie)。 由于蛋(dan)白(bai)質可(ke)能在(zai)不同(tong)的(de)(de)(de)(de)數據庫(ku)中(zhong)存在(zai),并且可(ke)能在(zai)同(tong)一(yi)個數據庫(ku)中(zhong)有(you)多(duo)個版本,為了去冗余,UniaraParc對每條(tiao)唯一(yi)的(de)(de)(de)(de)序(xu)(xu)(xu)列(lie)只存一(yi)次(ci)。無論是否(fou)為同(tong)一(yi)物種的(de)(de)(de)(de)序(xu)(xu)(xu)列(lie),只要(yao)(yao)序(xu)(xu)(xu)列(lie)相同(tong)就被合并為一(yi)條(tiao),每條(tiao)序(xu)(xu)(xu)列(lie)提供穩(wen)定的(de)(de)(de)(de)、唯一(yi)的(de)(de)(de)(de)編號UPI。該(gai)數據庫(ku)只含(han)有(you)蛋(dan)白(bai)質的(de)(de)(de)(de)序(xu)(xu)(xu)列(lie)信息,而沒有(you)注釋數據。