Práctica 4 - Adriana Aranda

PRÁCTICA
4ALINEAMIENTOS
MÚLTIPLES.
Biología molecular
Dra. Teresa Sandoval
Adriana Guadalupe Aranda Vázquez

31/03/2019
Introducción
Un alineamiento múltiple de secuencias es un alineamiento de más de dos secuencias. Estas
secuencias, como en el caso de los alineamientos por parejas pueden ser ADN, ARN o
proteína.
Las secuencias biológicas a menudo se agrupan en familias
➢ Genes relacionados de un organismo (parálogos)
➢ Genes relacionados de distintas especies (ortólogos).
➢ Secuencias dentro de una población (variantes polimórficas).
Dos secuencias pueden tener un alineamiento no muy bueno entre ellas, pero pueden
alinearse vía una tercera.
▪ Identificación de familias y regiones conservadas.
Las aplicaciones más habituales de los alineamientos múltiples son:
➢ La reconstrucción filogenética.
➢ El análisis estructural de proteínas.
➢ La búsqueda de dominios conservados.
➢ La búsqueda de regiones conservadas en promotores.
➢ Dar información acerca de la función, estructura y evolución de una secuencia.
• Al conocer cómo se alinea respecto a un grupo de secuencias.
• Válido para análisis de genes, proteínas o poblaciones.
• Encontrar miembros distantes de una familia de proteínas.
➢ Es muy frecuente que estén distantes, y el alineamiento de pares no suele ser lo
suficientemente preciso para encontrarlos.
➢ Clasificación y generación de BBDD de proteínas una vez secuenciado el genoma
completo de un organismo.
➢ Primer paso (y el más importante) en la generación de árboles filogenéticos.
En todos los casos los algoritmos de alineamiento múltiple asumen que las secuencias que
estamos alineando descienden de un antepasado común y lo que intentamos hacer es alinear
las posiciones homólogas.
Objetivos
1. Identificar los medios electrónicos de información de biotecnología.
2. Analizar con programas de biología molecular los alineamientos múltiples
Material
• Computadora
• Internet
Metodología
1. Buscar al menos 6 secuencias de proteínas similares gene bank.

2. Realizar por medio del programa MUSCLE el alineamiento múltiple.
Guardar en
Buscar al un Ingresar
Ingresar a
menos 6 documento al
la
secuencias todos los programa
plataform
deseadas códigos y MUSCLE.
a NCBI.
(proteasas). secuencias.
Agregar
Dar en el todas las
Analizar los botón Submit secuencias
resultados y esperar los que se
obtenidos. resultados. desean
analizar.
Resultados
SECUENCIAS POR ANALIZAR.
>AAA45759.1 protease, partial [Human rhinovirus sp.]
AFRPCNVNTKIGNAKCCPFVCGKAVTFKDRSTCSTYNLSSSLHHILEEDKRRRQVVDVMSAIFQGPISLD
APPPPAIADLLQSVRTPRVIKYCQIIMGHPAECQVERDLNIANSIIAIIANIISIAGIIFVIYKLFCSLQ
GPYSGEPKPKTKVPERRVVAQGPEEEFGRSILKNNTCVITTGNGKFTGLGIHDRILIIPTHADPGREVQV
NGVHTKVLDSYDLYNRDGVKLEITVIQLDRNEKFRDIRKYIPETEDDYPECNLALSANQDEPTIIKVGDV
VSYGNILLSGNQTARMLKYNYPTKSGYCGGVLYKIGQILGIHVGGNGRDGFSAMLLRSYFTGQIKVNKHA
TECGLPDIQTIHTPSKTKLQPSVFYDVFPGSKEPAVLTDNDPRLEVNFKEA
>AVB05520.1 Protease [Salmonella enterica]
MRTLWRFIAGFFKWTWRVLNFVREMVLNLFFIFLVLVGVGIWMQIGNGSNSEQTARGALLLDISGVIVDK
PSTNHRLGALGRQLFGASSDRLQENSLFDIVNAIRQAKDDRNITGIVLDLKNFTGADQPSMRYIGKALRE
FRDSGKPVFAVGENYSQGQYYLASFANKIWLSPQGQVDLHGFATNGLYYKTLLDKLKVSTHVFRVGTYKS
AVEPFIRDDMSPAAREADSRWIGELWQNYLHTVSANRQISPQQLFPGAQAIIDGLTSVGGDTAKYALDHK
LVDALASSADVEKALTKQFGWSKTENNYRAISYYDYSLKTPADTGGTIAVIFANGAIMDGEETPGNVGGD
TTASQIRDARLDPKVKAIVLRVNSPGGSVNASEVIRAELAAARAAGKPVVVSMGGMAASGGYWISTPANY
IVASPSTLTGSIGIFGVINTVENSLSSIGVHSDGVSTSPLADISMTKALSPEVQQMMQLSIEYGYKRFIT
LVADARKRTPEQIDKIAQGHVWTGEDAKANGLVDSLGDFDDAVAKAAELAKLKQWHLDYYQDEPTVLDMV
MDSMTGSVRAMLPEAIQAMLPAPLVSAANTVKAEGDKLAAFNDPQNRYAFCLTCANVR
>OSM89143.1 protease [Escherichia coli SHECO002]
MQAGHQSDADIYIYDEIGFWGVTAKQFISDLNALGDITHINLNINSPGGDVFEGIAIFNALKTHGASITV
YVDGVAASMASVIAMVGKPVIMPENSFMMIHKPFGFTGGDAEDMRTYADLLDKVEAVLLPAYAQKTGKTT
DEIAAMLADETWMSGAECLAHGFADQVTPAVKAMACIQSKRTEEFKKMPESIRNMITPPRNSAPRVQDDG
PAASRTPVQAAAPVVDENSIRAQVLAEQKARVNGINDLFAMFGGRYQTLQAQCLADPECSLEQAREKLLN
EMGRESTPSNKNTPAHIYAGNGNFVGDGIRQALMARAGFEKTERDNVYNGMTLREYARMSLTERGIGVSS
YNPMQMVGAAFTHSTSDFGNILLDVANKAILQGWEDAPETYEQWTRKGQLSDFKIAHRVGMGGFSALRQV
REGAEYKYVTTGDKQATIALATYGELFSITRQAIINDDLNMLTDVPMKLGRAAKSTIADLVYAILTSNPK
ISTDNVSLFDKAKHANVLESAAMDVASLDKARQLMRVQKEGERHLNIRPAFVLVPTAMESVANQVIRSSS
VKGADINAGIINPVKDFATVIAEPRLDDNSQTTFYLAASKGSDTIEVAYLNGVDTPYIDQMEGFSVDGVT
TKVRIDAGVAPVDHRGLVKCTA
>BBA24256.1 protease [Staphylococcus aureus]
MKTIEEIKSTPKTVMKKPELLAPAGNLEKLKIAVHYGADAVFLGGQEYGLRSNADNFTMEEIAEGVEFAN
RYGAKIYVTTNIIAHDENIEGLESYLRNLEKTGATGIIVADPLIIETCKEVAPKLEIHLSTQQSLSNYKA
VEYWKEEGLDRVVLARETGAMEMREMKEKVDIEIEAFIHGAMCIAYSGRCTLSNHMTARDSNRGGCCQSC
RWDYELLEVDDNGELDVFYNQGEVTPFAMSPKDLKLIESIPQMMDIGVDSLKIEGRMKSIHYIATVVSVY
RKVIDAYAADPDNFKINPEWLIELDKCANRDTAPAFFEGTPGYEEQMFGQQQSKKSPFDFCGLVLDYNED
TKIATIQQRNNFKPGQEIEFFGPEIETFTQVVEAIYDEEGNSLDAARHPLQIVQIKVDRPIYPNNMMRKE
IG
>OAB69389.1 protease [Streptococcus pneumoniae]
MTKTLKRPEVLSPAGTLEKLKVAVQYGADAVFIGGQAYGLRSRAGNFTFEQMEEGVQFATKYGAKVYVAA
NMVMHEGNEAGAGEWFRKLRDIGIAAVIVSDPALIMIAATEAPGLEIHLSTQASATNYETLEFWKELGLT
RVVLAREVSMEELAEIRKRTDVEIEAFVHGAMCISYSGRCTLSNHMSMRDANRGGCSQSCRWKYDLYDMP
FGKERKSLQGEIPEEFSMSAVDMSMIDHIPDMIENGVDSLKIEGRMKSIHYVSTVTNCYKAAVDVYLESP
EKFEAIKQDLVDEMWKVAQRELATGFYYGIPSENEQLFGARRKIPEYKFVAEVVSYDDAAQTATIRQRNV
INEGDQVEFYGPGFRHFETYIEDLHDAKGNKIDRAPNPMELLTIKVPQPVQSGDMVRALKEGLINFYKED
GTSVTVRA
>PLV50787.1 protease [Mycobacterium tuberculosis variant microti OV254]
MSRWARLLTVLLIAVVPILAPARAAAIGPPPIPPGDPLPGAVAPPDPTEQKTACGVGTLSPGTRLELRPS
ADVMLNYTSAWRFSRGTGQKVAVIDTGVAPNPRLHALEAGGDYVSSSDGLVDCDAHGTLVAGLIAAAPSP
DDAFAGVAPDAAILSIRQNSDLYSVKGTGSAQGDPNAVSPGYGNTRTLALAIVHAVDMGATVINLSETAC
APVGGGLDDAAVGQAVRYAFERNVVVVAAAGNVSTQGLCSAQNEVRDPNLPLADAWNSVRTVASPAWFRE
YVLAVAAVAPNGQPSDFSLHGPWVSLAAPGEQLISLSPNGPGLMNAWQDPQRGLVPVNGTSFAAPLVSGL
VALVRARFPTMTAGEVMTRIKRTAQTPQTGPNAATGYGVIDPVAALTADLPPARDMPDPLAGRPISGPPR
LSKSDTRARDISLVVVASCAALAAVALTVAKSRSRDHE
Evaluación
Árbol filogenético
Cladograma Real
Análisis de resultados
Gracias al árbol filogenético se puede apreciar que las secuencias analizadas son algo
parecidas.
Cuestionario
1. ¿Para qué sirven los alineamientos múltiples? Para analizar el alineamiento de dos
o más secuencias.
2. ¿Qué es un dominio? Es un término más genérico que designa una región de una
proteína con interés biológico funcional o estructural. También se llama dominio a
una región de la estructura tridimensional de una proteína con una función concreta,
que incluye regiones no necesariamente contiguas en la secuencia de aminoácidos.
3. ¿Qué es un motivo? Es un elemento conservado en la secuencia de aminoácidos, que
habitualmente se asocia con una función concreta. Los motivos se generan a partir de
alineamientos múltiples de regiones con elementos funcionales o estructurales
conocidos, por lo que son útiles para predecir la existencia de esos mismos elementos
en otras proteínas de función y estructura desconocida.
4. ¿Se pueden hacer alineamientos solo de proteínas? No, ya que estos análisis
también pueden proceder de ADN o ARN
5. Mencione otros programas para realizar alineamientos.
CLUSTALW-Ebi, DBClustal, DIALIGN 2, MultAlin, Parallel PRRN, T-COFFEE
MACAW, entre otros.
Bibliografía
• Bioinformatics at COMAV. (--). Alineamientos múltiples. 31/03/19, de
Bioinformatics at COMAV Sitio web:
https://bioinf.comav.upv.es/courses/intro_bioinf/multiple.html
• GuateQuímica. (--). Dominios y Motivos. 31/03/19, de GuateQuímica
Sitio web:
http://www.guatequimica.com/tutoriales/proteinas/Dominios_y_Motivos.h
tm
• Rodrigo Santamaría. (--). Alineamientos Múltiples. 31/03/19, de
vis.usal.es Sitio web:
http://vis.usal.es/rodrigo/documentos/bioinfo/temas/5_Alineamientos%20
m%C3%BAltiples.pdf

Práctica 4 - Adriana Aranda

Cargado por

Copyright:

Formatos disponibles

Práctica 4 - Adriana Aranda

Cargado por

Información del documento

Descripción original:

Título original

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Práctica 4 - Adriana Aranda

Cargado por

Copyright:

Formatos disponibles

PRÁCTICA

Adriana Guadalupe Aranda Vázquez

1. Buscar al menos 6 secuencias de proteínas similares gene bank.

También podría gustarte