Pfam
Pfam è un database di famiglie di proteine che include le loro annotazioni e gli allineamenti di sequenze multiple generati usando i modelli di Markov nascosti.[1][2][3]
Caratteristiche
modificaPer ogni famiglia di proteine presente su Pfam si possono ottenere:
- La vista di molteplici allineamenti
- La vista delle architetture del domain proteico
- Esaminare la distribuzione delle specie
- Seguire i collegamenti ad altri database
- Osservare le strutture proteiche note
All'incirca il 74% delle sequenze proteiche hanno almeno un collegamento a Pfam. Questo numero viene chiamato la copertura delle sequenze.
Pfam-A
modificaIl database Pfam-A contiene informazione circa i domain proteici e le famiglie di proteine Pfam-A è a parte del database curata da operatori umani che contiene più di 10.000 voci. In ogni articolo sono archiviati un allineamento della sequenza aminoacidica e il corrispettivo Modello di Markov nascosto. Questi modelli di Markov nascosti possono essere usati per cercare databse di sequenze grazie al pacchetto di programmi HMMER scritto da Sean Eddy. Dal momento che le voci di Pfam-A attualmente non coprono tutte le proteine note, è stato generato automaticamente un supplemento denominato Pfam-B.
Pfam-B
modificaLa sezione Pfam-B contiene un gran numero di piccole famiglie proteiche derivate da clusters prodotti da un algoritmo denominato ADDA.[4] Anche se di minore qualità, la sezione di famiglie contenute in Pfam-B può essere utile quando non si trova una famiglia proteica in Pfam-A.
iPfam
modificaIl database iPfam[5] viene costruito in base alla descrizione del domain di Pfam. Questo database investiga se le differenti proteine descritte assieme (in base alla struttura proteica derivata dal database Protein Data Bank) sono davvero lo sufficientemente vicine per interagire potenzialmente.
Nell'ottobre del 2009, la release "Pfam 24.0" conteneva 11.912 famiglie proteiche.
Note
modifica- ^ Finn RD, Tate J, Mistry J, Coggill PC, Sammut SJ, Hotz HR, Ceric G, Forslund K, Eddy SR, Sonnhammer EL, Bateman A, The Pfam protein families database., in Nucleic Acids Res, vol. 36, Database issue, 2008, pp. D281–8, DOI:10.1093/nar/gkm960, PMID 18039703.
- ^ PMID 16381856
- ^ PMID 14681378
- ^ PMID 15608174
- ^ PMID 15353450
Voci correlate
modifica- Protein Data Bank
- Proteopedia
- TrEMBL Database performing an automated protein sequence annotation
- InterPro Integration of protein domain and protein family databases
Collegamenti esterni
modifica- (EN) Pfam - Protein family database at Sanger Institute UK
- (EN) Pfam - Protein family database at Janelia Farm Research Campus USA
- (EN) Pfam - Protein family database at Center for Genomics and Bioinformatics Sweden
- (EN) iPfam - Interactions of Pfam domains in PDB