Práctica 4 - Adriana Aranda
Práctica 4 - Adriana Aranda
Práctica 4 - Adriana Aranda
4ALINEAMIENTOS
MÚLTIPLES.
Biología molecular
Dra. Teresa Sandoval
En todos los casos los algoritmos de alineamiento múltiple asumen que las secuencias que
estamos alineando descienden de un antepasado común y lo que intentamos hacer es alinear
las posiciones homólogas.
Objetivos
1. Identificar los medios electrónicos de información de biotecnología.
2. Analizar con programas de biología molecular los alineamientos múltiples
Material
• Computadora
• Internet
Metodología
Guardar en
Buscar al un Ingresar
Ingresar a
menos 6 documento al
la
secuencias todos los programa
plataform
deseadas códigos y MUSCLE.
a NCBI.
(proteasas). secuencias.
Agregar
Dar en el todas las
Analizar los botón Submit secuencias
resultados y esperar los que se
obtenidos. resultados. desean
analizar.
Resultados
SECUENCIAS POR ANALIZAR.
>AAA45759.1 protease, partial [Human rhinovirus sp.]
AFRPCNVNTKIGNAKCCPFVCGKAVTFKDRSTCSTYNLSSSLHHILEEDKRRRQVVDVMSAIFQGPISLD
APPPPAIADLLQSVRTPRVIKYCQIIMGHPAECQVERDLNIANSIIAIIANIISIAGIIFVIYKLFCSLQ
GPYSGEPKPKTKVPERRVVAQGPEEEFGRSILKNNTCVITTGNGKFTGLGIHDRILIIPTHADPGREVQV
NGVHTKVLDSYDLYNRDGVKLEITVIQLDRNEKFRDIRKYIPETEDDYPECNLALSANQDEPTIIKVGDV
VSYGNILLSGNQTARMLKYNYPTKSGYCGGVLYKIGQILGIHVGGNGRDGFSAMLLRSYFTGQIKVNKHA
TECGLPDIQTIHTPSKTKLQPSVFYDVFPGSKEPAVLTDNDPRLEVNFKEA
>AVB05520.1 Protease [Salmonella enterica]
MRTLWRFIAGFFKWTWRVLNFVREMVLNLFFIFLVLVGVGIWMQIGNGSNSEQTARGALLLDISGVIVDK
PSTNHRLGALGRQLFGASSDRLQENSLFDIVNAIRQAKDDRNITGIVLDLKNFTGADQPSMRYIGKALRE
FRDSGKPVFAVGENYSQGQYYLASFANKIWLSPQGQVDLHGFATNGLYYKTLLDKLKVSTHVFRVGTYKS
AVEPFIRDDMSPAAREADSRWIGELWQNYLHTVSANRQISPQQLFPGAQAIIDGLTSVGGDTAKYALDHK
LVDALASSADVEKALTKQFGWSKTENNYRAISYYDYSLKTPADTGGTIAVIFANGAIMDGEETPGNVGGD
TTASQIRDARLDPKVKAIVLRVNSPGGSVNASEVIRAELAAARAAGKPVVVSMGGMAASGGYWISTPANY
IVASPSTLTGSIGIFGVINTVENSLSSIGVHSDGVSTSPLADISMTKALSPEVQQMMQLSIEYGYKRFIT
LVADARKRTPEQIDKIAQGHVWTGEDAKANGLVDSLGDFDDAVAKAAELAKLKQWHLDYYQDEPTVLDMV
MDSMTGSVRAMLPEAIQAMLPAPLVSAANTVKAEGDKLAAFNDPQNRYAFCLTCANVR
>OSM89143.1 protease [Escherichia coli SHECO002]
MQAGHQSDADIYIYDEIGFWGVTAKQFISDLNALGDITHINLNINSPGGDVFEGIAIFNALKTHGASITV
YVDGVAASMASVIAMVGKPVIMPENSFMMIHKPFGFTGGDAEDMRTYADLLDKVEAVLLPAYAQKTGKTT
DEIAAMLADETWMSGAECLAHGFADQVTPAVKAMACIQSKRTEEFKKMPESIRNMITPPRNSAPRVQDDG
PAASRTPVQAAAPVVDENSIRAQVLAEQKARVNGINDLFAMFGGRYQTLQAQCLADPECSLEQAREKLLN
EMGRESTPSNKNTPAHIYAGNGNFVGDGIRQALMARAGFEKTERDNVYNGMTLREYARMSLTERGIGVSS
YNPMQMVGAAFTHSTSDFGNILLDVANKAILQGWEDAPETYEQWTRKGQLSDFKIAHRVGMGGFSALRQV
REGAEYKYVTTGDKQATIALATYGELFSITRQAIINDDLNMLTDVPMKLGRAAKSTIADLVYAILTSNPK
ISTDNVSLFDKAKHANVLESAAMDVASLDKARQLMRVQKEGERHLNIRPAFVLVPTAMESVANQVIRSSS
VKGADINAGIINPVKDFATVIAEPRLDDNSQTTFYLAASKGSDTIEVAYLNGVDTPYIDQMEGFSVDGVT
TKVRIDAGVAPVDHRGLVKCTA
>BBA24256.1 protease [Staphylococcus aureus]
MKTIEEIKSTPKTVMKKPELLAPAGNLEKLKIAVHYGADAVFLGGQEYGLRSNADNFTMEEIAEGVEFAN
RYGAKIYVTTNIIAHDENIEGLESYLRNLEKTGATGIIVADPLIIETCKEVAPKLEIHLSTQQSLSNYKA
VEYWKEEGLDRVVLARETGAMEMREMKEKVDIEIEAFIHGAMCIAYSGRCTLSNHMTARDSNRGGCCQSC
RWDYELLEVDDNGELDVFYNQGEVTPFAMSPKDLKLIESIPQMMDIGVDSLKIEGRMKSIHYIATVVSVY
RKVIDAYAADPDNFKINPEWLIELDKCANRDTAPAFFEGTPGYEEQMFGQQQSKKSPFDFCGLVLDYNED
TKIATIQQRNNFKPGQEIEFFGPEIETFTQVVEAIYDEEGNSLDAARHPLQIVQIKVDRPIYPNNMMRKE
IG
>OAB69389.1 protease [Streptococcus pneumoniae]
MTKTLKRPEVLSPAGTLEKLKVAVQYGADAVFIGGQAYGLRSRAGNFTFEQMEEGVQFATKYGAKVYVAA
NMVMHEGNEAGAGEWFRKLRDIGIAAVIVSDPALIMIAATEAPGLEIHLSTQASATNYETLEFWKELGLT
RVVLAREVSMEELAEIRKRTDVEIEAFVHGAMCISYSGRCTLSNHMSMRDANRGGCSQSCRWKYDLYDMP
FGKERKSLQGEIPEEFSMSAVDMSMIDHIPDMIENGVDSLKIEGRMKSIHYVSTVTNCYKAAVDVYLESP
EKFEAIKQDLVDEMWKVAQRELATGFYYGIPSENEQLFGARRKIPEYKFVAEVVSYDDAAQTATIRQRNV
INEGDQVEFYGPGFRHFETYIEDLHDAKGNKIDRAPNPMELLTIKVPQPVQSGDMVRALKEGLINFYKED
GTSVTVRA
>PLV50787.1 protease [Mycobacterium tuberculosis variant microti OV254]
MSRWARLLTVLLIAVVPILAPARAAAIGPPPIPPGDPLPGAVAPPDPTEQKTACGVGTLSPGTRLELRPS
ADVMLNYTSAWRFSRGTGQKVAVIDTGVAPNPRLHALEAGGDYVSSSDGLVDCDAHGTLVAGLIAAAPSP
DDAFAGVAPDAAILSIRQNSDLYSVKGTGSAQGDPNAVSPGYGNTRTLALAIVHAVDMGATVINLSETAC
APVGGGLDDAAVGQAVRYAFERNVVVVAAAGNVSTQGLCSAQNEVRDPNLPLADAWNSVRTVASPAWFRE
YVLAVAAVAPNGQPSDFSLHGPWVSLAAPGEQLISLSPNGPGLMNAWQDPQRGLVPVNGTSFAAPLVSGL
VALVRARFPTMTAGEVMTRIKRTAQTPQTGPNAATGYGVIDPVAALTADLPPARDMPDPLAGRPISGPPR
LSKSDTRARDISLVVVASCAALAAVALTVAKSRSRDHE
Evaluación
Árbol filogenético
Cladograma Real
Análisis de resultados
Gracias al árbol filogenético se puede apreciar que las secuencias analizadas son algo
parecidas.
Cuestionario
1. ¿Para qué sirven los alineamientos múltiples? Para analizar el alineamiento de dos
o más secuencias.
2. ¿Qué es un dominio? Es un término más genérico que designa una región de una
proteína con interés biológico funcional o estructural. También se llama dominio a
una región de la estructura tridimensional de una proteína con una función concreta,
que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos.
3. ¿Qué es un motivo? Es un elemento conservado en la secuencia de aminoácidos, que
habitualmente se asocia con una función concreta. Los motivos se generan a partir de
alineamientos múltiples de regiones con elementos funcionales o estructurales
conocidos, por lo que son útiles para predecir la existencia de esos mismos elementos
en otras proteínas de función y estructura desconocida.
4. ¿Se pueden hacer alineamientos solo de proteínas? No, ya que estos análisis
también pueden proceder de ADN o ARN
5. Mencione otros programas para realizar alineamientos.
CLUSTALW-Ebi, DBClustal, DIALIGN 2, MultAlin, Parallel PRRN, T-COFFEE
MACAW, entre otros.
Bibliografía
• Bioinformatics at COMAV. (--). Alineamientos múltiples. 31/03/19, de
Bioinformatics at COMAV Sitio web:
https://bioinf.comav.upv.es/courses/intro_bioinf/multiple.html
• GuateQuímica. (--). Dominios y Motivos. 31/03/19, de GuateQuímica
Sitio web:
http://www.guatequimica.com/tutoriales/proteinas/Dominios_y_Motivos.h
tm
• Rodrigo Santamaría. (--). Alineamientos Múltiples. 31/03/19, de
vis.usal.es Sitio web:
http://vis.usal.es/rodrigo/documentos/bioinfo/temas/5_Alineamientos%20
m%C3%BAltiples.pdf