Práctica 1 Bases de Datos
Práctica 1 Bases de Datos
Práctica 1 Bases de Datos
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
DEPARTAMENTO DE CIENCIAS DE LA VIDA Y LA AGRICULTURA FECHA ULTIMA
REVISIÓN: 26/10/16
CARRERA:
El conocimiento de las diferentes bases de datos biológicas, su uso y estructura, son de vital importancia en la búsqueda de
información científica relevante en cualquier ámbito de la biotecnología moderna. En éstas se encuentra almacenada toda la
información biológica que ha sido analizada hasta la presente fecha. En este sentido, Existen bases de datos primarias que
contienen secuencias de DNA y de proteínas, estructuras de proteínas y perfiles de expresión de genes y proteínas. Cada registro
de estas bases de datos contiene una secuencia y su correspondiente "anotación" (comentarios que incluyen información acerca
de esa secuencia, habitualmente hechos de modo manual por algún anotador). Por otro lado, las bases de datos secundarias
archivan los datos que son fruto del análisis de las bases de datos primarias, tales como familias de proteínas, motivos o dominios
proteicos, familias de genes, mutaciones, polimorfismos, implicación en enfermedades, etc.
Asimismo, todas las secuencias almacenadas se encuentran en distintos formatos dependiendo de la base de datos donde se
encuentren. El conocimiento de estos formatos, y su inter-conversión en formatos útiles, será de vital importancia a la hora de
manipular y analizar secuencias en la gran variedad de programas bioinformáticos disponibles.
OBJETIVOS:
Revisar y entender el uso de las diferentes bases de datos biológicas disponibles en la red.
Aprender a realizar búsquedas de secuencias biológicas en las bases de datos.
Conocer los diferentes formatos de secuencias existentes para su uso en herramientas bioinformáticas.
MATERIALES:
EQUIPOS: Computador
MUESTRA:
Diferentes secuencias obtenidas de las bases de datos.
INSTRUCCIONES:
CARRERA:
• SWISS-PROT
• GEN BANK
• GENE (dentro de NCBI)
• KEGG
• OMIM
• RCSB PDB
• Pub Med
• EMBL-EBI
• DDBJ
2. Búsqueda simple de una secuencia biológica y conversión de formatos:
a) Ingresar a la base de datos de NCBI (https://www.ncbi.nlm.nih.gov/)
b) Seleccionar la base de datos “nucleotide” e ingresar en el cuadro de búsqueda: “BRC1”
c) Ingresar al primer resultado y obtener la secuencia en formato Genbank:
• PEARSON/FASTA/fa
• EMBL/em
• GCG
UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
DEPARTAMENTO DE CIENCIAS DE LA VIDA Y LA AGRICULTURA FECHA ULTIMA
REVISIÓN: 26/10/16
CARRERA:
• PLAIN/Raw
e) Obtener la secuencia codificante de la proteína (nucleótidos) (haciendo click derecho en CDS y abriendo nueva
pestaña)
CARRERA:
h) Encontrar ORFs (Open Reading Frames) con ayuda de la herramienta ORF finder de NCBI
https://www.ncbi.nlm.nih.gov/orffinder/
i) Encontrar el marco de lectura abierto correspondiente a la proteína original y señalarlo.
4. Ejercicios de soporte (No necesarios en el informe, solo para practicar)
a) Números de acceso en Genbank (NCBI) de secuencias proteicas (Repetir los pasos e) hasta i) de las instrucciones
del numeral 3)
KQY40102.1, KQX42690.1, KQX26069.1, KQW94497.1, KQW83797.1, KQW22974.1, KQU88239.1,
KQU69897.1, NP_001260113.1, KQX88612.1, BAB50165.1, BAB50080.1, BAB50039.1, NP_001259175.1,
BAB50049.1, CDX11043.1, WP_015809624.1, KQY28128.1,
RESULTADOS OBTENIDOS:
Presentar un informe de la práctica con los siguientes puntos a completar:
CONCLUSIONES:
El conocimiento y uso de las diferentes bases de datos permitirá que el estudiante acceda rápidamente a la información
biológica requerida para las futuras prácticas de bioinformática y su desarrollo profesional en general.
Los diferentes formatos de secuencias biológicas permiten al investigador obtener la información necesaria para manipular y
analizar las secuencias correctamente en las distintas aplicaciones bioinformáticas.
RECOMENDACIONES:
Se recomienda realizar la práctica en orden secuencial ya que los pasos previos sirven de base para el resto de la
práctica.
Las capturas de pantalla insertadas en el informe deberán ser íntegras, sin ningún tipo de recorte ni modificación con
editores de gráficos.
FIRMAS
F: ……………………………………………..
F: ………………………………………….
Nombre:
F: …………………………………………. Nombre: COORDINADOR DE LABORATORIOS
UNIVERSIDAD DE LAS FUERZAS ARMADAS – ESPE
CÓDIGO: SGC.DI.505
VERSIÓN: 1.0
DEPARTAMENTO DE CIENCIAS DE LA VIDA Y LA AGRICULTURA FECHA ULTIMA
REVISIÓN: 26/10/16
CARRERA:
COORDINADOR DE ÁREA DE
Nombre: CONOCIMIENTO
DOCENTE