Vázquez Alejandra P9
Vázquez Alejandra P9
Vázquez Alejandra P9
1
Práctica de Bases de datos y BLAST
Comienza leyendo el apartado 9.7.1 Bases de datos de secuencias del libro de Biología
Molecular y Citogenética, a continuación contesta a las siguientes preguntas:
a) ¿Qué es la GenBank?
https://mediateca.educa.madrid.org/video/9j116dq9qxa9o9jl
2
a) ¿En qué consiste el formato FASTA?
Es un formato de base de datos mucho más sencillo que GenBank. Se centra casi
exclusivamente en la secuencia nucleotídica, no en nada relacionado con el registro como
definiciones o referencias.
La segunda sección esta formada por la parte central donde están las características
principales de la secuencia a estudiar.
Una vez hayas visto el vídeo, busca información sobre los siguientes genes, en la base
de datos “Nucleotide” escribiendo las siglas del gen en el campo “Title” y Homo sapiens
en el campo “Organism”, como has visto en el vídeo.
3
IGF1 insulin like growth ARNm linear 1097 4 1
factor 1
Actividad 3. BLAST
Se utiliza para comparar la secuencia estudiada con todas las secuencias guardadas en la
base de datos mostrando en pantalla las coincidencias encontradas entre la secuencia
analizada y las secuencias acumuladas en la base de datos. Además, muestra los enlaces a
las secuencias de referencia.
También existen otras herramientas de la aplicación, que alinean todas las secuencias para
detectar mutaciones.
b) Imagina que a tu laboratorio han llegado unas semillas de una planta que desconoces.
Has realizado una extracción de ADN a partir de ellas, y consigues secuenciar el
fragmento de ADN que aparece abajo. Ahora vas a realizar un BLAST para identificar la
secuencia, para ello entra en el siguiente enlace:
https://blast.ncbi.nlm.nih.gov/Blast.cgi
CCAAAAAAATAAAAAAAGACCGTCGTACAGTGAATTAGTAATCTAAAACTTTATAAAAAT
CGGTCGTAAAAATTGAAGGACTTACACATCCTCCGGTGACGAATTTGAGGAGGAAGCAAG
CTACAGCGGCGCCGGTAAGTTGAGCAAGCATGTAGAAGGAGCCAGTGATAAAGGTAATAT
GTCCGCCGAAGGTTAATCCACAGGTGACCGCAGGGTTAACATGACCACCGGAGATGTTAG
4
CGGAAATCGAAACGGCTACGAATAGAGCAAATCCATGGCAAACTGCAATAGCTACAAGCC
CAGCCGGATCAAGTGCAGCATTTGTTGTCAACTTGCCTGTATCCAAACAATACCAAATTT
AAAATCTCTCATACATCGATCAATAGTAAAAATACACAAAAATAGAATATATATTACTTG
ATCAGAAGCGGATCTAGTAAAAGGATATGATTTTGGTATAACTTATAAACCTGAATCAAT
CTATTTGATATGAATTCAAAATAAGCATTAACCATATTATGCGGGGCATAATTCCGAGTC
AGAAGCAATAAATCAAACTTGGAACCGCAGAATTCGTTAACAATTAAAATGAAAAGAGGG
ATCGGATCGGAGTTATTAACCGTAAGCAATGGCGGACCAACTCCGGCGAAGACAAAGATG
AGTGTGGAGATGAATTCGGCAAGATAGGACTTAAGAGAGACAACGCTGAATGAATCACTA
ACTC
En el cromosoma 3.
Hay un 99% de similitudes ya que de 710 secuencias de referencia con las que se compara
nuestra secuencia introducida, 700 son coincidentes.
c) Imagina que se ha realizado un estudio para detectar mutaciones en el exón 9 del gen
de la calreticulina mediante PCR y secuenciación del producto amplificado. La
secuencia obtenida ha sido la siguiente:
AAGCAAGGGCTATCGGGTATCACCTCTGACCATCCTTCCCATTCATCCTCCAGGTCAAGTCT
GGCACCATCTTTGACAACTTCCTCATCACCAACGATGAGGCATACGCTGAGGAGTTTGGCA
ACGAGACGTGGGGCGTAACAAAGGTGAGGCCTGGTCCTGGTCCTGATGTCGGGGGCGGGC
AGGGCTGGCAGGGGGCAAGGCCCTGAGGTGTGTGCTCTGCCTGCAGGCAGCAGAGAAAC
5
AAATGAAGGACAAACAGGACGAGGAGCAGAGGCTTAAGGAGGAGGAAGAAGACAGGAG
GCAGAGGACAAGGAGGATGATGAGGACAAAGATGAGGATGAGGAGGATGAGGAGGACAA
GGAGGAAGATGAGGAGGAAGATGTCCCCGGCCAGGCCAAGGACGAGCTGTAGAGAGGCC
TGCCTCCAGGGCTGGACTGAGGCCTGAGCGCTCCTGCCGCAGAGCTTGCCGCGCCAAATA
ATGTCTCTGTGAGACTCGAGAAC
Utilizando BLAST, compara esta secuencia (Query) con la secuencia de referencia (Sbjct)
del gen humano de la calreticulina.
En el cromosoma 19.
Un 96% ya que de 520 secuencias almacenadas del Homo sapiens con el que se compara
nuestra secuencia, en este caso coinciden 501 de la base de datos.