根據組成蛋白質的20種氨基酸的物理和化學性質可以辨析電泳等實驗中的未知蛋白質,也可以分析已知蛋白質的物化性質。
ExPASy工具包包涵的程序:http://www.expasy.ch/tools/
AACompIdent:與把氨基酸序列在SWISS-PROT庫中搜索不同,AACompIdent工具利用未知蛋白的氨基酸組成去確認具有相同組成的已知蛋白。該程序分析時需提交的相關信息包括:蛋白質的氨基酸組成、等電點pI和分子量(如果知道)、正確的物種分類及特別的關鍵詞。此外,用戶還需在六種氨基酸“組合”中作出選擇,這影響到分析如何進行。例如,某種“組合”會把殘基Asp/Asn(D/N)和Gln/Glu(Q/E)組合成
Asx(B)和Glx(Z);或者某種殘基會在分析中被完全除去。
對數據庫中的每一個蛋白序列,算法會對其氨基酸組成與所查詢的氨基酸組成的差異打分。由電子郵件返回的結果被組織成三級列表:第一張列表中的蛋白都基于特定的物種分類而不考慮pI和分子量;第二張列表包含了不考慮物種分類、pI和分子量的全體蛋白;第三張列表中的蛋白不但基于特定物種分類,并且將
pI和分子量也考慮在內。
雖然計算所得結果各不相同,但零分表明了該序列與提出的組成完全相符。
AACompSim:AACompIdent的一個變種,AACompSim提供類似的分析,但與前者以實驗所得的氨基酸組成為依據進行搜索不同,后者使用SWISS-PROT中的序列為依據。有報道稱,氨基酸組成在物種之間是十分保守的(Cordwell等,1995),并且通過分析氨基酸的組成,研究者能從低于25%序列相似性的蛋白之間發現弱相似性(Hobohm和Sander,1995)。因此,在“傳統的”數據庫搜索基礎上輔以組成分析,能為蛋白質之間關系提供更多見解。
PROSEARCH:http://www.embl-heidelberg.de/prs.html
PROPSEARCH也提供基于氨基酸組成的蛋白質辨識功能。用144種不同的物化性質來分析蛋白質,包括分子量、巨大殘基的含量、平均疏水性、平均電荷等,把查詢序列的這些屬性構成的“查詢向量”與SWISS-PROT和PIR中預先計算好的各個已知蛋白質的屬性向量進行比較。這個工具能有效的發現同一蛋白質家族的成員。可以通過Web使用這個工具,用戶只需輸入查詢序列本身。
分子量搜索(MOWSE)
分子量搜索(MolecularWeightSearch,MOWSE)算法利用了通過質譜(MS)技術獲得的信息。利用完整蛋白質的分子量及其被特定蛋白酶消化后產物的分子量,一種未知蛋白質能被準確無誤地確認,給出由若干實驗才能決定的結果。由于未知蛋白無需再全部或部分測序,這一方法顯著地減少了實驗時間。
MOWSE的輸入是一個純文本文件,包含一張實驗測定的肽段列表,分子量范圍在0.7到4.0Kda之間。計算過程基于在OWL非冗余蛋白質序列庫中包含的信息。打分基于在一定分子量范圍內蛋白中一個片段分子量出現的次數。輸出的結果是得分最佳的30個蛋白的列表,包括它們在OWL中的條目名稱、相符肽段序列、和其它統計信息。模擬研究得出在使用5個或更少輸入肽段分子量時,準確率為99%。