Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Tutorial UniProt

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 34

Universidad Nacional Autónoma de México

Facultad de Estudios Superiores Cuautitlán


Licenciatura en Bioquímica Diagnóstica
Clave 10569

Bioinformática
Grupo 2051

TUTORIAL UNIPROT
EQUIPO: Profesoras:
Hernández Badillo Daniela LBD. Larisa Andrea González Salcedo
Salas López Blanca María LBD. Rosa María de los Ángeles López Cabrera

SEMESTRE 2021-II
Acerca de UniProt

Universal Protein Resource (UniProt) es una base de datos que brinda secuencias
de proteínas y sus datos de anotación. UniProt es el producto de una
colaboración entre el Instituto Europeo de Bioinformática (EMBL-EBI), el Instituto
Suizo de Bioinformática (SIB) y el Recurso de Información sobre Proteínas (PIR).
En adición, dentro de esta base de datos se encuentran: la Base de conocimiento
de UniProt (UniProtKB), los Clústeres de referencia de UniProt (UniRef) y el
Archivo de UniProt (UniParc).

URL: https://www.uniprot.org/ 2
Página principal
UniProtKB. Recopila información
funcional sobre proteínas:
básicos obligatorios
datos
(nombre, Página principal
descripción, secuencia de aa,
taxonomía), ontología biológica,
clasificación, referencias cruzadas, etc.
Swiss-Prot: acceso a las entradas
anotadas y revisadas manualmente
(literatura y análisis computacional
evaluado por el curador).
TrEMBL: acceso a entradas analizadas
computacionalmente que esperan
revisión manual.
UniRef: proporciona conjuntos de
secuencias de UniProt (incluidas las
isoformas) y UniParc; oculta secuencias
redundantes
UniParc: almacena secuencias únicas
de proteínas solo una vez, con un
identificador único y estable (UPI).
Proteomes: posee conjuntos de
proteínas para especies con genomas
completamente secuenciados.
Supporting Data: orientar la búsqueda
apoyándose de citas literarias,
taxonomía, palabras clave,
localizaciones subcelulares, bases de
datos con reÿerencias cruzadas y
enfermedades.

4
Nuevo acceso a entradas de Página principal
proteínas del SARS-CoV-2.


Acceso rápido a descargar la última versión de UniProt,
estadísticas, citas, envío de datos, acceso programático.

Acceso rápido a búsqueda de Artículo del mes.


texto, BLAST, alineaciones de
secuencias, mapeo de ID,
Noticias recientes. búsqueda de péptidos.
5
Barra de búsqueda

“ Se puede
búsqueda
realizar
avanzada
una
con
operadores booleanos AND,
OR, NOT.

Desde la barra de búsqueda se


puede cambiar a otra base de
datos de UniProt, como
UniRef, Uniparc, etc.
6
Ejemplo de
búsqueda

7
Gen TP53

Para iniciar la búsqueda se introduce el nombre del gen (en inglés)


o su símbolo en la barra de búsqueda. Hacer clic en “Search”.

Total de resultados encontrados.

Inmediatamente después de iniciada la búsqueda se desplegará


8
una tabla con los resultados que coinciden con la búsqueda.
Los resultados se
Los resultados se pueden pueden visualizar
filtrar por: por taxonomía,
Revisado (Swiss-Prot): palabras clave,
registros revisados ontología de genes,
manualmente con análisis clase de enzima,
computacional y literatura. ruta o en forma de
→ Mayor confiabilidad. tabla.
No revisado (TrEMBL):
registros analizados sólo
computacionalmente.
Organismos populares: UniRef agrupa los
especies que contienen al resultados en
secuencias con
gen, también es posible identidad de 100, 90 o
buscar otros organismos 50%, ocultando
que no se muestran en la secuencias
lista. redundantes.

Términos de búsqueda: por Es posible acceder al


nombre del gen, de la vídeo de apoyo para el
proteína, cepa o taxonomía. uso de UniProt.

9
Entrada: ID otorgado por UniProt.
Nombre de la entrada: identificador de la entrada en UniProtKB.
Nombre de la proteína. Elección del número de
resultados por página.
Nombre del gen que codifica la proteína.
Nombre científico y sinónimo del organismo del que se aisló el gen.
Longitud de la secuencia.

Agregar o eliminar columnas de la tabla.


Descargar resultados.
Compartir resultados.

Tipo de revisión. Seleccionar la entrada que contenga el gen de interés, en este


caso es TP53 en humano.
10
ENTRY Añadir
publicaciones o
Enviar actualizaciones
o correcciones.
Entrada y nombre de la entrada. anotaciones a
una entrada de
UniProt.

BLAST vs UniProt.
Align: alinear la entrada
con sus isoformas.
Format: ver la entrada
en un formato distinto.
Add to basket: añadir al
Proporciona información básica acerca de la carrito.
Se puede acceder a entrada: nombre de la proteína, gen que History: historial de la
publicaciones relacionadas codifica la proteína, organismo del que entrada.
a la entrada, visor de proviene, estado de la información (revisado o
funciones, tabla de no revisado), junto con una puntuación
características o seguir en otorgada de acuerdo al tipo de evidencia que
la entrada. respalda la información (entre más evidencia
mayor es el puntaje).
11
FUNCTION
Descripción acerca de la función de la proteína a nivel biológico.

En este apartado
también puede
incluirse más
información
como:

Precauciones:
aspectos a tener
en cuenta
respecto al gen.
Cofactor de la
proteína.

12
Sitios y regiones

Feature key: función del sitio o región de la proteína.


Position(s): posición en la que se encuentra el sitio o región dentro de la
proteína.
Description: descripción breve acerca de la actividad del sitio o región.
Vista gráfica: indica la posición del sitio o región dentro de la proteína
gráficamente.
Length: longitud del sitio o región.
13
Muestra los términos GO referentes a la función Muestra los términos GO referentes a los procesos
molecular de la proteína. biológicos en los que participa la proteína.

Keywords: palabras
clave sobre el contenido
de la entrada.
Enzyme and pathway
databases: redirecciona
hacia bases de datos de
vías y enzimas de la
entrada.
Protein family/group
databases: redirecciona
hacia bases de datos
sobre la familia de
proteínas o grupos que
presenta la entrada.
14
NAMES & TAXONOMY

Proporciona los
nombres recomendados
y alternativos de la
proteína, gen que la
codifica, organismo al
que pertenece,
identificador
taxonómico (asignado
por NCBI), linaje
taxonómico y proteoma
al que pertenece la
proteína.

Muestra una lista de bases de datos externas que


proporcionan más información del gen y proteína.
15
SUBCELLULAR LOCATION

Utiliza anotaciones de
localización subcelular
de UniProt.

Imagen de la
ubicación de la
proteína dentro de la
célula resaltada con
colores: amarillo
(anotación manual) o
azul (anotación
automática).

Enlista todos los componentes celulares en los que se ubica la proteína, incluyendo sus isoformas.
Al colocar el cursor sobre cualquier componente se muestra una breve descripción de dicho componente.
Utiliza
anotaciones de
localización
subcelular de
Gene Ontology
(GO).

Imagen de la ubicación de la proteína


dentro de la célula resaltada con colores: Muestra una lista de los términos GO de componentes
amarillo (anotación manual) o azul celulares en los que se encuentra la proteína.
(anotación automática). Al colocar el cursor sobre cualquier componente se muestra una
breve descripción de dicho componente.
17
PATHOLOGY & BIOTECH
Esta sección proporciona información sobre las enfermedades asociadas con las variaciones
genéticas en la proteína. Proporciona el nombre y abreviación de la enfermedad, enlace a OMIM y
una breve descripción de la enfermedad.
También se incluyen tablas de las variantes de algunas enfermedades o tabla de
mutagénesis.

Estas tablas proporcionan el nombre asignado a ese cambio, su posición dentro


de la secuencia de aminoácidos, breve descripción del cambio de aminoácidos y
lo que provoca, posición del cambio dentro de la proteína de forma gráfica, así
como la longitud de este cambio.

19
PTM/PROCESSING
Esta sección describe las modificaciones postraduccionales (PTM) y eventos de
procesamiento de la proteína, ya sea en forma de tabla o como texto.

Estas tablas proporcionan el nombre asignado al proceso, su posición dentro de la secuencia de


aminoácidos, breve descripción, posición dentro de la proteína de forma gráfica, así como la
longitud de este.

20
También se
enlistan otras
bases de datos
donde es posible
encontrar
información de la
proteína respecto
a PTM o eventos
de procesamiento.

21
EXPRESSION
Proporciona información sobre la expresión del gen a nivel del mRNA o a nivel de proteína, en las
células o en tejidos de organismos multicelulares, así como su etapa de inducción.

Se muestra un listado de
las bases de datos que
proporcionan mayor
información sobre la
expresión del gen y
organismos específicos.
22
INTERACTION
Proporciona información
sobre la estructura
cuaternaria de la proteína
y sus interacciones con
otra proteína o complejos
de proteínas.

Describe sitios de
aminoácidos únicos
que no son
contemplados en
ninguna sección de
UniProt. Proporciona
la posición y
descripción del sitio,
su ubicación de
forma gráfica y
longitud.
Muestra información acerca de interacciones binarias
proteína-proteína derivadas de IntAct Database.
Presenta un listado de los
términos GO acerca de la función
molecular de la proteína.

Este apartado proporciona


accesos a otras bases de datos en
los que se puede encontrar
información de referente a las
interacciones que presenta la
proteína. .
STRUCTURE
Se muestra la estructura en 3D de
la proteína, esta se puede girar
manteniendo oprimido el click
derecho para observar la
estructura desde diferentes
ángulos.

La tabla indica la entrada de


PDB, el método por el que
fue obtenida la estructura
de la proteína, su resolución
dada en Angstroms, las
cadenas y su posición, así
como enlaces externos a
otras bases de datos.
En estructura secundaria se
puede observar el número de alfa
hélices, giros y hojas beta.

25
Al dar click en show more details se despliega una tabla en la que aparece la posición de cada
alfa hélice, cada giro y cada hoja beta que presenta la proteína, junto con su vista gráfica y la
longitud de cada una.

26
FAMILY & DOMAINS

Las regiones de interés en la secuencia se muestran en una tabla que indica la posición en la
cadena, la descripción de la región, su vista gráfica y la longitud.

De igual modo, se muestran los motivos de la proteína, sus posiciones, descripción, vista
gráfica y longitud. 27
FAMILY & DOMAINS

Enlaces externos a
bases de datos
Describe la posición de las regiones de sesgo de filogenómicas y de
composición dentro de la proteína y el tipo familias y dominios.
particular de aminoácidos que están
sobrerrepresentados dentro de esas regiones.

Información general sobre el papel biológico del


dominio.

Similitud de la secuencia con otras proteínas. 28


SEQUENCES

Se muestra la Información general sobre las secuencias:


secuencia de
aminoácidos de El estado de la secuencia es completo, se indican el
la isoforma número de isoformas con que cuenta la proteína.

Información general sobre la isoforma:

Se indican los sinónimos, se aclara que la isoforma 1 es la


secuencia canónica, la opción de descargar el formato
FASTA, además de datos como la longitud, la masa, la
última modificación.
29
SEQUENCES
Se muestran entradas no
revisadas que probablemente
pertenezcan al mismo gen
pero mapeadas
computacionalmente.
Se muestran variantes
naturales indicando los
cambios de aminoácidos
que ocurren y la posición.
Describe la secuencia de
la isoforma de proteínas
alternativas naturales. Los
cambios en la secuencia
de aminoácidos pueden
deberse a empalmes
alternativos, etc,

Enlaces externos que dirigen hacia bases de30


datos de secuencias y de anotaciones del genoma.
SIMILAR PROTEINS

En las pestañas superiores se muestran proteínas que tienen un 100%, 90% y 50% de identidad, esto
se refiere al porcentaje de similitud de una proteína de humano o de otro ser vivo con respecto a la
proteína buscada.

Se indica el nombre de la proteína, la especie, el score y la longitud de la proteína

31
CROSS-REFERENCES

Este apartado muestra información


relacionada con la proteína buscada, las
fuentes web para consulta independiente, y
enlaces externos a bases de datos de
secuencias como EMBL, GenBank y DDBJ, u
otro tipo de bases de datos como de
estructuras 3D, química, etc.

32
ENTRY INFORMATION

Entry information provee información general sobre la proteína buscada, como el nombre, el
número de acceso, el historial de la entrada, el estado de la entrada, anotaciones y un
descargo de responsabilidad.

33
MISCELLANEOUS

Este apartado contiene


información relevante que
no aparece en los demás
apartados como enlaces a
documentos externos para
ahondar en ciertos temas.

34

También podría gustarte