Práctica 1 Bases de Datos

UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
DEPARTAMENTO DE CIENCIAS DE LA VIDA Y LA AGRICULTURA FECHA ULTIMA
REVISIÓN: 26/10/16
CARRERA:
GUÍA PARA LAS PRÁCTICAS DE LABORATORIO, TALLER O CAMPO

PERIODO Octubre 2016-
ASIGNATURA: Bioinformática NIVEL: 6to
LECTIVO: Febrero 2017
DOCENTE: Francisco Flores- Cristian Peña NRC: 1665-1666 PRÁCTICA N°: 1
LABORATORIO DONDE SE DESARROLLARÁ LA
H 205
PRÁCTICA:
TEMA DE LA Bases de datos biológicas y formatos de secuencias
PRÁCTICA:
INTRODUCCIÓN:
El conocimiento de las diferentes bases de datos biológicas, su uso y estructura, son de vital importancia en la búsqueda de
información científica relevante en cualquier ámbito de la biotecnología moderna. En éstas se encuentra almacenada toda la
información biológica que ha sido analizada hasta la presente fecha. En este sentido, Existen bases de datos primarias que
contienen secuencias de DNA y de proteínas, estructuras de proteínas y perfiles de expresión de genes y proteínas. Cada registro
de estas bases de datos contiene una secuencia y su correspondiente "anotación" (comentarios que incluyen información acerca
de esa secuencia, habitualmente hechos de modo manual por algún anotador). Por otro lado, las bases de datos secundarias
archivan los datos que son fruto del análisis de las bases de datos primarias, tales como familias de proteínas, motivos o dominios
proteicos, familias de genes, mutaciones, polimorfismos, implicación en enfermedades, etc.
Asimismo, todas las secuencias almacenadas se encuentran en distintos formatos dependiendo de la base de datos donde se
encuentren. El conocimiento de estos formatos, y su inter-conversión en formatos útiles, será de vital importancia a la hora de
manipular y analizar secuencias en la gran variedad de programas bioinformáticos disponibles.
OBJETIVOS:
 Revisar y entender el uso de las diferentes bases de datos biológicas disponibles en la red.
 Aprender a realizar búsquedas de secuencias biológicas en las bases de datos.
 Conocer los diferentes formatos de secuencias existentes para su uso en herramientas bioinformáticas.
MATERIALES:
REACTIVOS: N/A INSUMOS: N/A
EQUIPOS: Computador
MUESTRA:
Diferentes secuencias obtenidas de las bases de datos.
INSTRUCCIONES:
- I Verifique su conexión a internet y utilice de preferencia el navegador Chrome o Firefox
ACTIVIDADES POR DESARROLLAR:
1. Bases de datos biológicas

a) Ingresar y familiarizarse con cada una de las siguientes bases de datos biológicas:
• NCBI
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
REVISIÓN: 26/10/16
CARRERA:
• SWISS-PROT
• GEN BANK
• GENE (dentro de NCBI)
• KEGG
• OMIM
• RCSB PDB
• Pub Med
• EMBL-EBI
• DDBJ
2. Búsqueda simple de una secuencia biológica y conversión de formatos:
a) Ingresar a la base de datos de NCBI (https://www.ncbi.nlm.nih.gov/)
b) Seleccionar la base de datos “nucleotide” e ingresar en el cuadro de búsqueda: “BRC1”
c) Ingresar al primer resultado y obtener la secuencia en formato Genbank:
d) Convertir la secuencia encontrada en los siguientes formatos (usar EMBOSS Seqret):

http://www.ebi.ac.uk/Tools/sfc/emboss_seqret/
• PEARSON/FASTA/fa
• EMBL/em
• GCG
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
REVISIÓN: 26/10/16
CARRERA:
• PLAIN/Raw
3. Manipulación básica de secuencias

a) De forma similar, buscar la secuencia PROTEICA: Pyruvate dehydrogenase (Seleccionar la base de datos
“protein”)
b) Seleccionar cualquiera de las proteínas encontradas
c) Observar cada sección y comentar: locus, definition, accesion, features: regions, sites, cds, etc
d) Manipular y comentar el formato GRAFICO
e) Obtener la secuencia codificante de la proteína (nucleótidos) (haciendo click derecho en CDS y abriendo nueva
pestaña)
f) Traducir la secuencia de nucleótidos obtenida en secuencias de aminoácidos, con ayuda de la herramienta

TRANSEQ http://www.ebi.ac.uk/Tools/st/emboss_transeq/ (escoger los seis MARCOS DE LECTURA - FRAMES)
g) Encontrar el MARCO DE LECTURA correspondiente a la proteína “original” observando entre los SEIS obtenidos.
Fijarse en la existencia de asteriscos “*”. Comparar con la proteína original encontrada en NCBI.
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
REVISIÓN: 26/10/16
CARRERA:
h) Encontrar ORFs (Open Reading Frames) con ayuda de la herramienta ORF finder de NCBI
https://www.ncbi.nlm.nih.gov/orffinder/
i) Encontrar el marco de lectura abierto correspondiente a la proteína original y señalarlo.
4. Ejercicios de soporte (No necesarios en el informe, solo para practicar)
a) Números de acceso en Genbank (NCBI) de secuencias proteicas (Repetir los pasos e) hasta i) de las instrucciones
del numeral 3)
KQY40102.1, KQX42690.1, KQX26069.1, KQW94497.1, KQW83797.1, KQW22974.1, KQU88239.1,
KQU69897.1, NP_001260113.1, KQX88612.1, BAB50165.1, BAB50080.1, BAB50039.1, NP_001259175.1,
BAB50049.1, CDX11043.1, WP_015809624.1, KQY28128.1,
RESULTADOS OBTENIDOS:
Presentar un informe de la práctica con los siguientes puntos a completar:
1. Bases de datos biológicas

De cada base de datos visitada completar la siguiente información:
 LINK o dirección web de la Base de datos
 Logo principal
 Significado de las siglas (de ser el caso)
 Descripción general de la base de datos luego de una navegación rápida en la página web
 Enumerar otras bases de datos relacionadas que estén dentro de esta base de datos
2. Búsqueda simple de una secuencia biológica y conversión de formatos

 Realizar capturas de pantalla (sin recortar) de todas los pasos dados en las instrucciones.
 Comentar los formatos utilizados (ventajas y desventajas entre los mismos)
3. Manipulación básica de secuencias

 Realizar capturas de pantalla (sin recortar) de todas los pasos dados en las instrucciones.
 Realizar los comentarios respectivos en los pasos que se indican
CONCLUSIONES:
 El conocimiento y uso de las diferentes bases de datos permitirá que el estudiante acceda rápidamente a la información
biológica requerida para las futuras prácticas de bioinformática y su desarrollo profesional en general.
 Los diferentes formatos de secuencias biológicas permiten al investigador obtener la información necesaria para manipular y
analizar las secuencias correctamente en las distintas aplicaciones bioinformáticas.
RECOMENDACIONES:
 Se recomienda realizar la práctica en orden secuencial ya que los pasos previos sirven de base para el resto de la
práctica.
 Las capturas de pantalla insertadas en el informe deberán ser íntegras, sin ningún tipo de recorte ni modificación con
editores de gráficos.
FIRMAS
F: ……………………………………………..
F: ………………………………………….
Nombre:
F: …………………………………………. Nombre: COORDINADOR DE LABORATORIOS
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
REVISIÓN: 26/10/16
CARRERA:
COORDINADOR DE ÁREA DE
Nombre: CONOCIMIENTO
DOCENTE

Práctica 1 Bases de Datos

Cargado por

Copyright:

Formatos disponibles

Práctica 1 Bases de Datos

Cargado por

Información del documento

Descripción original:

Derechos de autor

Formatos disponibles

Compartir este documento

Compartir o incrustar documentos

Opciones para compartir

¿Le pareció útil este documento?

¿Este contenido es inapropiado?

Copyright:

Formatos disponibles

Práctica 1 Bases de Datos

Cargado por

Copyright:

Formatos disponibles

UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE

GUÍA PARA LAS PRÁCTICAS DE LABORATORIO, TALLER O CAMPO

REACTIVOS: N/A INSUMOS: N/A

- I Verifique su conexión a internet y utilice de preferencia el navegador Chrome o Firefox

ACTIVIDADES POR DESARROLLAR:

1. Bases de datos biológicas

d) Convertir la secuencia encontrada en los siguientes formatos (usar EMBOSS Seqret):

3. Manipulación básica de secuencias

f) Traducir la secuencia de nucleótidos obtenida en secuencias de aminoácidos, con ayuda de la herramienta

1. Bases de datos biológicas

2. Búsqueda simple de una secuencia biológica y conversión de formatos

3. Manipulación básica de secuencias

También podría gustarte