Práctica N°10-Introducción A La Bioinformática Como Recurso Biotecnológico
Práctica N°10-Introducción A La Bioinformática Como Recurso Biotecnológico
Práctica N°10-Introducción A La Bioinformática Como Recurso Biotecnológico
COMPETENCIAS
INTRODUCCIÓN
Al encontrar similitudes entre secuencias, los científicos pueden inferir la función de genes
secuenciados recientemente, predecir nuevos miembros de familias de genes y explorar
relaciones evolutivas. Ahora que se han secuenciado genomas completos la búsqueda de
similitud de secuencias es una tarea obligada que permite saber en cuantos otros organismos
se encuentran secuencias similares, en que regiones del genoma están codificadas, en cuantos
procesos metabólicos participan e incluso conocer regiones importantes para la regulación de
su función.
BLAST es el acrónimo de Basic Local Alignment Search Tool y es la herramienta más utilizada
para buscar secuencias similares en bases de datos. BLAST integra diferentes variantes de
programas que se pueden utilizar para buscar diferentes tipos de secuencias contra diferentes
bases de datos. A su vez, BLAST es un algoritmo heurístico para buscar similitudes locales en
grandes bases de datos.
1
El algoritmo BLAST trata de localizar los segmentos más significativos de residuos alineados
entre dos secuencias, para lo cual el programa asume que un alineamiento significativo entre
dos secuencias relacionadas está integrado por palabras que tienen en común ambas
secuencias. Para alcanzar esta tarea el programa BLAST extrae todas las palabras de una
longitud predefinida w que integran a la secuencia problema.
BLAST utiliza teoría estadística para decidir qué tan significativos son los alineamientos desde
el punto de vista biológico.
Recursos informáticos:
PROCEDIMIENTO
Consultar en la base de datos del NCBI la información relativa a la secuencia de la proteína con
número de acceso (NP_524326) y de la secuencia del mRNA mensajero con número deacceso
NM_079602. Identifique de que secuencias se tratan y a que organismo pertenecen
2
Figura 1: Secciones principales de la interfaz de usuario del programa BLAST del
NCBI. La primera de las secciones permite realizar búsquedas con BLAST en los
genomas de los organismos disponibles en el NCBI. La segunda sección permite utilizar
las aplicaciones “tradicionales” de BLAST para realizar búsquedas en bases de datos de
secuencias de aminoácidos o de nucleótidos. La tercera sección permite el acceso a
aplicaciones especializadas de BLAST
BLAST Assembled RefSeq genomes: Permite utilizar BLAST para realizar búsquedas de
similitudes en genomas específicos. En la página se muestran los accesos de BLAST para los
organismos más comunes, pero se dispone también de un acceso a la lista completa de los
genomas disponibles.
1. Basic BLAST: Contiene accesos directos a las diferentes aplicaciones básicas de BLAST para
la búsqueda en bases de datos de secuencias de aminoácidos y de nucleótidos, así como para
las opciones de BLAST traducido.
2. Specialized BLAST: Contiene accesos directos para aplicaciones especiales de BLAST tales
como la búsqueda de dominios conservados, analizar la posible contaminación de secuencias
con vectores, etc.
Previamente…
- El ADN total se extrajo de cultivos bacterianos con el kit Invitrogen siguiendo las instrucciones
del fabricante.
- Los genes 16S rRNAs se amplifican por PCR utilizando los cebadores forward D1 y reverse D1
y luego es secuenciado por Sanger.
- Obtener la secuencia del 16S rRNAs:
- >Cepa 1
- ATGTTAGCGGCGGACGGGTGAGTAACACGTGGGTAACCTGCCTGTAAGACTGGGAT
AACTCCGGGAAACCGGGGCTAATACCGGATGCTTGTTTGAACCGCATGGTTCAAAC
ATAAAAGGTGGCTTCGGCTACCACTTACAGATGGACCCGCGGCGCATTAGCTAGTT
GGTGAGGTAATGGCTCACCAAGGCAACGATGCGTAGCCGACCTGAGAGGGTGATC
GGCCACACTGGGACTGAGACACGGCCCAGACTCCTACGGGAGGCAGCAGTAGGGA
ATCTTCCGCAATGGACGAAAGTCTGACGGAGCAACGCCGCGTGAGTGATGAAGGTT
TTCGGATCGTAAAGCTCTGTTGTTAGGGAAGAACAAGTACCGTTCGAATAGGGCGG
TACCTTGACGGTACCTAACCAGAAAGCCACGGCTAACTACGTGCCAGCAGCCGCGG
TAATACGTAGGTGGCAAGCGTTGTCCGGAATTATTGGGCGTAAAGGGCTCGCAGGC
GGTTCCTTAAGTCTGATGTGAAAGCCCCCGGCTCAACCGGGGAGGGTCATTGGAAA
CTGGGGAACTTGAGTGCAGAAGAGGAGAGTGGAATTCCACGTGTAGCGGTGAAAT
GCGTAGAGATGTGGAGGAACACCAGTGGCGAAGGCGACTCTCTGGTCTGTAACTGA
CGCTGAGGAGCGAAAGCGTGGGGAGCGAACAGGATTAGATACCCTGGTAGTCCAC
GCCGTAAACGATGAGTGCTAAGTGTTAGGGGGTTTCCGCCCCTTAGTGCTGCAGCT
AACGCATTAAGCACTCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGA
ATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGAAGCAACGCGA
AGAACCTTA
3
- Ingresar a la página web del NCBI: https://www.ncbi.nlm.nih.gov/
- Ingresar a Submit para registrar data en la base de datos del NCBI
- Ingresar el tipo de secuencia que desea procesar y seleccionar suggest tool: Colocar
16S RNAr
- Seleccionar GenBank:
4
- A continuación, revisar el menú del proceso que se desea hacer: Overview, data, fasta,
source, processing. Luego seleccionar SUBMIT.
5
- Crear una nueva cuenta seleccionando Google Account y luego seleccionar crear
nueva cuenta en NCBI:
6
- Ingresar la data solicitada tal como se observa en la imagen:
7
- Culminar el proceso y obtener el número de accesión:
Ejemplo:
Cepa Accession number
IcBac1.4 MT712198
IcBac2.1 MT733835
IcBac2.9 MT712198
8
3. En la database, hacer click en rRNA/ITS database y en la lista seleccionar 16S RNA
ribosomal RNA sequence (Bacteria and Archaea) y click en BLAST:
9
4. Por cada cepa elegir los 10 primeros alineamientos (tiene que tener código y accesión)
que NCBI arroja en el análisis, las cuales deben tener porcentaje de similitud por
encima de 98%.
10
NOTA: REALIZAR ESTE PROCESO POR CADA CEPA DE MANERA INDEPENDIENTE.
REPETIR ESTE PROCESO.
2) Investigue otros métodos más modernos que existan para buscar secuencias similares
en bases de datos.
11