Tutorial UniProt
Tutorial UniProt
Tutorial UniProt
Bioinformática
Grupo 2051
TUTORIAL UNIPROT
EQUIPO: Profesoras:
Hernández Badillo Daniela LBD. Larisa Andrea González Salcedo
Salas López Blanca María LBD. Rosa María de los Ángeles López Cabrera
SEMESTRE 2021-II
Acerca de UniProt
Universal Protein Resource (UniProt) es una base de datos que brinda secuencias
de proteínas y sus datos de anotación. UniProt es el producto de una
colaboración entre el Instituto Europeo de Bioinformática (EMBL-EBI), el Instituto
Suizo de Bioinformática (SIB) y el Recurso de Información sobre Proteínas (PIR).
En adición, dentro de esta base de datos se encuentran: la Base de conocimiento
de UniProt (UniProtKB), los Clústeres de referencia de UniProt (UniRef) y el
Archivo de UniProt (UniParc).
URL: https://www.uniprot.org/ 2
Página principal
UniProtKB. Recopila información
funcional sobre proteínas:
básicos obligatorios
datos
(nombre, Página principal
descripción, secuencia de aa,
taxonomía), ontología biológica,
clasificación, referencias cruzadas, etc.
Swiss-Prot: acceso a las entradas
anotadas y revisadas manualmente
(literatura y análisis computacional
evaluado por el curador).
TrEMBL: acceso a entradas analizadas
computacionalmente que esperan
revisión manual.
UniRef: proporciona conjuntos de
secuencias de UniProt (incluidas las
isoformas) y UniParc; oculta secuencias
redundantes
UniParc: almacena secuencias únicas
de proteínas solo una vez, con un
identificador único y estable (UPI).
Proteomes: posee conjuntos de
proteínas para especies con genomas
completamente secuenciados.
Supporting Data: orientar la búsqueda
apoyándose de citas literarias,
taxonomía, palabras clave,
localizaciones subcelulares, bases de
datos con reÿerencias cruzadas y
enfermedades.
4
Nuevo acceso a entradas de Página principal
proteínas del SARS-CoV-2.
“
Acceso rápido a descargar la última versión de UniProt,
estadísticas, citas, envío de datos, acceso programático.
“ Se puede
búsqueda
realizar
avanzada
una
con
operadores booleanos AND,
OR, NOT.
7
Gen TP53
9
Entrada: ID otorgado por UniProt.
Nombre de la entrada: identificador de la entrada en UniProtKB.
Nombre de la proteína. Elección del número de
resultados por página.
Nombre del gen que codifica la proteína.
Nombre científico y sinónimo del organismo del que se aisló el gen.
Longitud de la secuencia.
BLAST vs UniProt.
Align: alinear la entrada
con sus isoformas.
Format: ver la entrada
en un formato distinto.
Add to basket: añadir al
Proporciona información básica acerca de la carrito.
Se puede acceder a entrada: nombre de la proteína, gen que History: historial de la
publicaciones relacionadas codifica la proteína, organismo del que entrada.
a la entrada, visor de proviene, estado de la información (revisado o
funciones, tabla de no revisado), junto con una puntuación
características o seguir en otorgada de acuerdo al tipo de evidencia que
la entrada. respalda la información (entre más evidencia
mayor es el puntaje).
11
FUNCTION
Descripción acerca de la función de la proteína a nivel biológico.
En este apartado
también puede
incluirse más
información
como:
Precauciones:
aspectos a tener
en cuenta
respecto al gen.
Cofactor de la
proteína.
12
Sitios y regiones
Keywords: palabras
clave sobre el contenido
de la entrada.
Enzyme and pathway
databases: redirecciona
hacia bases de datos de
vías y enzimas de la
entrada.
Protein family/group
databases: redirecciona
hacia bases de datos
sobre la familia de
proteínas o grupos que
presenta la entrada.
14
NAMES & TAXONOMY
Proporciona los
nombres recomendados
y alternativos de la
proteína, gen que la
codifica, organismo al
que pertenece,
identificador
taxonómico (asignado
por NCBI), linaje
taxonómico y proteoma
al que pertenece la
proteína.
Utiliza anotaciones de
localización subcelular
de UniProt.
Imagen de la
ubicación de la
proteína dentro de la
célula resaltada con
colores: amarillo
(anotación manual) o
azul (anotación
automática).
Enlista todos los componentes celulares en los que se ubica la proteína, incluyendo sus isoformas.
Al colocar el cursor sobre cualquier componente se muestra una breve descripción de dicho componente.
Utiliza
anotaciones de
localización
subcelular de
Gene Ontology
(GO).
19
PTM/PROCESSING
Esta sección describe las modificaciones postraduccionales (PTM) y eventos de
procesamiento de la proteína, ya sea en forma de tabla o como texto.
20
También se
enlistan otras
bases de datos
donde es posible
encontrar
información de la
proteína respecto
a PTM o eventos
de procesamiento.
21
EXPRESSION
Proporciona información sobre la expresión del gen a nivel del mRNA o a nivel de proteína, en las
células o en tejidos de organismos multicelulares, así como su etapa de inducción.
Se muestra un listado de
las bases de datos que
proporcionan mayor
información sobre la
expresión del gen y
organismos específicos.
22
INTERACTION
Proporciona información
sobre la estructura
cuaternaria de la proteína
y sus interacciones con
otra proteína o complejos
de proteínas.
Describe sitios de
aminoácidos únicos
que no son
contemplados en
ninguna sección de
UniProt. Proporciona
la posición y
descripción del sitio,
su ubicación de
forma gráfica y
longitud.
Muestra información acerca de interacciones binarias
proteína-proteína derivadas de IntAct Database.
Presenta un listado de los
términos GO acerca de la función
molecular de la proteína.
25
Al dar click en show more details se despliega una tabla en la que aparece la posición de cada
alfa hélice, cada giro y cada hoja beta que presenta la proteína, junto con su vista gráfica y la
longitud de cada una.
26
FAMILY & DOMAINS
Las regiones de interés en la secuencia se muestran en una tabla que indica la posición en la
cadena, la descripción de la región, su vista gráfica y la longitud.
De igual modo, se muestran los motivos de la proteína, sus posiciones, descripción, vista
gráfica y longitud. 27
FAMILY & DOMAINS
Enlaces externos a
bases de datos
Describe la posición de las regiones de sesgo de filogenómicas y de
composición dentro de la proteína y el tipo familias y dominios.
particular de aminoácidos que están
sobrerrepresentados dentro de esas regiones.
En las pestañas superiores se muestran proteínas que tienen un 100%, 90% y 50% de identidad, esto
se refiere al porcentaje de similitud de una proteína de humano o de otro ser vivo con respecto a la
proteína buscada.
31
CROSS-REFERENCES
32
ENTRY INFORMATION
Entry information provee información general sobre la proteína buscada, como el nombre, el
número de acceso, el historial de la entrada, el estado de la entrada, anotaciones y un
descargo de responsabilidad.
33
MISCELLANEOUS
34