Location via proxy:   [ UP ]  
[Report a bug]   [Manage cookies]                

Transcriptomica - Fitopatologia Molecular 2016

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 78

moschen.sebastian@inta.gob.

ar
la informacin gentica comn a todas
Genoma:
las clulas del organismo.

la parte del genoma que se expresa en


una clula en una etapa especfica de su
Transcriptoma: desarrollo.

las protenas que interactuan para dar a


Proteoma: la clula su carcter individual.

los metabolitos reflejan cambios en los


Metaboloma:
niveles de informacion previos.
La genmica se ha desarrollado como consecuencia
de los avances en Biologa Molecular e Informtica.

La introduccin y popularizacin de las tecnologas de


alta procesividad ha cambiado drsticamente la
manera en que se abordan los problemas biolgicos y
se prueban las hiptesis.
El objetivo de la genmica funcional es generar un catlogo de todos
los genes y de su funcin.

Para comprender el comportamiento de los sistemas biolgicos y de


los algoritmos genticos que permiten el funcionamiento celular y el
desarrollo de los organismos.

La genmica funcional engloba el estudio del:

Transcriptoma: conjunto completo de transcriptos.

Proteoma: conjunto de protenas codificadas por un genoma.

Interactoma: interaccin de estos productos.


GENMICA FUNCIONAL
Y POSTGENMICA

Planteamiento clsico:
Dirigido por una hiptesis.
Limitado el nmero de genes
estudiados.

Planteamiento genmico y
postgenmicos:
No siempre hay hiptesis de partida.
Informacin sobre miles de genes.
Tecnologa Sanger: Virus, bacterias

2002: secuenciacin completa de muchas bacterias fitopatgenas

2006: emergencia de NGS (454 Roche, ILLUMINA, SOLiD)

2009: 12 hongos fitopatgenos secuenciados (http://cpgr.plantbiology.msu.edu/)

2016: 8590 bacterias, 5500 virus, 844 hongos.


El objetivo es identificar el complemento de todos los transcriptos
de una muestra biolgica y estimar su abundancia en determinadas
condiciones fisiolgicas y/o de desarrollo.

La transcriptmica permite asimismo identificar estructura


funcional de genes (sitio de inicio y fin de transcripcin, sitios de
splicing, etc).
Colecciones
northern Display
Antes del 2000: blot
RT-PCR de ADNc
diferencial
diferencial

2000 -2010:
avances Serial
Suppression
Expressed analysis
tecnolgicos Sequence
substractive Microarreglo
gene
Biol. Mol. Tags (ESTs). expression
hybridization de ADN
Genmica y (SSH)
(SAGE).
boinformtica

2010- :
NGS RNAseq
Bioinformtica
Generacin de colecciones de ESTs
La complejidad de los genomas eucariotas
hace aconsejable no abordar inicialmente
el estudio del genoma completo.

Es preferible estudiar aquellos genes que


se estn expresando en un momento
determinado de la vida del organismo.
Genoteca de ADNc:
coleccin de Fragmentos de DNA clonados
que representan el conjunto de genes que
se estn expresando en un rgano o tejido
determinado, o bajo una situacin
particular o momento de desarrollo.

Las genotecas de ADNc se secuencian de


forma masiva para generar miles de
secuencias parciales o ESTs de 200-500 bp.
Las diferencias en la expresin de genes pueden ser
identificadas considerando el nmero de veces en que
aparece representado un EST particular.

Los ESTs por su propia naturaleza, son incompletas y,


hasta cierto punto, imprecisas.

Los ESTs tambin suelen ser suficientes para la


identificacin de los genes mediante comparacin con
las bases de datos.
Transcriptmica y descubrimiento de genes
Caracterizacin de splicing alternativo
Identificacin de sitios de poliadenilacin
Estimacin del numero de genes de una especie
Estudios de expresin gnica
Identificacin y desarrollo de marcadores
funcionales (EST SSR), SNPs
Mapeo fsico, identificacin de Sequence Tag Sites
(STS)
Identificacin de genes candidatos

ESTs RELACIONADOS CON ESTRS


BITICO Y ABITICO
(919 secuencias editadas y anotadas)

Clasificacin funcional de ESTs aislados a partir de la


clonoteca diferencial de flor en estadio R1

Clasificacin funcional de ESTs aislados a partir de la Fernandez et al. 2003. BMC Genomics. Sep
clonoteca diferencial de flor en estadio R4 30;4(1):40.
Identificacin de genes candidatos mediante
construccin de colecciones de ADNc
substractivas
Construccin de colecciones de ADNc
substractivas a partir de flores de la lnea MR

2 DPI 4 DPI

Inoculado (I)

Suspensin de
ascosporas
D2I-NI D2NI- I D4I- NI D4NI- I

Mock (NI)

Control de
inoculacin
(Mock)
Identificacin de genes candidatos mediante
construccin de colecciones de ADNc
4 DPI substractivas
Coleccin D4I-NI

Secuencias nicas: 446


No descriptas para girasol: 71
Con al menos un trmino GO: 375
Identificacin de genes candidatos mediante
construccin de colecciones de ADNc
substractivas
4 DPI
Coleccin D4NI-I

No descriptas para girasol: 42


Secuencias nicas: 295
Con al menos un trmino GO: 253
Los microarreglos de ADN surgen de la Nro. publicaciones Pubmed
necesidad de analizar la cantidad de 6000
5000
informacin procedente de los grandes 4000
proyectos de secuenciacin de genomas. 3000
2000

El anlisis de microarreglos de ADN 1000


0
permite estudiar simultneamente la
expresin de miles de genes y analizar
su expresin bajo distintas condiciones
experimentales

Permiten elaborar mapas finos de


transcripcin y proporcionan informacin
indirecta de los niveles de protenas.
El objetivo de los experimentos de microarreglos
de ADN es comparar la expresin de mltiples
genes (transcripcin) en distintas condiciones:

Momentos distintos del tiempo


Tejidos distintos
Tejidos sanos o enfermos

Se basan en tecnologas conocidas como la


hibridacin y la fluorescencia.
Microarreglos de ADNc

Microarreglos de ologonucletidos
Affymetrix
Agilent
NimbleGen
ABI
Illumina
Cada sonda del microarreglo est diseada
para unirse a un gen de forma especfica.

Diseo de sondas especficas.


Especificidad de secuencia.
Tms homogneas.
Sin estructuras secundarias.
Cada sonda est dispuesta de forma
ordenada sobre el microarreglo
Primer microarreglo de ADNc
Las muestras preparadas del RNA se Una parte de las molculas de RNA
lavan sobre el array por un periodo de 14 a encontrarn su complemento. Si la
16 horas. El nmero de molculas secuencia de bases del RNA encaja
implicado en el proceso es enorme. Hay en la del probe de DNA, habr un
millones de copias de cada probe de DNA alineamiento perfecto y la muestra
(ATCATG) en cada cuadrado del chip, y se pegar al probe.
miles de millones de molculas de RNA de
cada gen que se expresa en la muestra.
TECNOLOGA AGILENT
15 mil a 1 millon de sondas de 60 bases.

Diseo y sntesis del chip de girasol

Diseo de la micromatriz comprende un total de 42.386


sondas, derivadas de un indice de genes local (SUR)
incluyendo ademas con 1.417 controles de Agilent y 74
controles de hibridacin.

Diseo 4 x 44 K
Sunflower unigene collection and
expression chip design
SUR v.1.0
133,682 EST Genbank (versin May 2009)
Helianthus annuus L.

VecScreen
(http://www.ncbi.nlm.nih.gov/VecScreen/UniVec.html)

Trimseq EMBOSS MICROARREGLO


(http://emboss.sourceforge.net/) (Agilent 44Kx4)
42,386 sondas
10x74 controles especficos
28,089 singletons y 12,924 contigs = 1,417 controles Agilent
41,013 unigenes (ensamblador CAP3)

Anotacin funcional
Fernandez et al 2012
(BLASTX, Blast2go)
Sunflower Microarray Database
Bsqueda de los puntos (spots)
Segmentacin
Cuantificacin
Calidad de la medida
Agilent
- Estadstica Descriptiva.

- Comparacin de medias.

- Diseo de Experimentos (ANOVA).

-Correcciones para comparaciones mltiples.

- Descomposicin en valores singulares : Componentes principales,


correspondencias.

- Mtodos de clasificacin: Anlisis Discriminante y variantes.

- ANALISIS DE AGRUPAMIENTO.

- ANALISIS DE AGRUPAMIENTO DE INDIVIDUOS Y GENES


SIMULTANEAMENTE.
Mol Biotechnol (2012) 50:8797
MICROARREGLOS
Ventajas:
tecnologa madura, con aos de anlisis y validaciones
Procesamiento y comparacin simultnea de muchas
muestras en paralelo
Han sido extensamente estudiados en interacciones H-P

Desventajas:
Limitados a identificar transcriptos de genes conocidos
Background puede ser alto por seales inespecficas
Seal saturada a altos niveles de expresin gnica
TRANSCRIPTMICA
RNA-seq
La evolucin de la transcriptomica
Hybridization-based

1995 P. Brown, et. al. 2002 Affymetrix, whole 2008 many groups, mRNA-seq:
Gene expression profiling genome expression profiling direct sequencing of mRNAs
using spotted cDNA using tiling array: identifying using next generation
microarray: expression levels and profiling novel genes and sequencing techniques (NGS)
of known genes splicing variants
RNA-seq is still a technology
under active development
How RNA-seq works

Sample preparation

Next generation sequencing (NGS)

Data analysis:
Mapping reads
Visualization (Gbrowser)
De novo assembly
Quantification

Wang et. al, Nat. Rev. Genetics 10, 57-63, 2009).


Purificacin y Analisis del RNA
RNA Purificacin: Qiagen Kit o Fenol/Cloroformo.
Analisis de calidad del RNA Quality (Agilent 2100 BioAnalyzer)
RIN = RNA integrity number: 0 (malo) to 10 (bueno)

Cuantificacin del
RNA (Qubit)

RIN = 6.0 RIN = 10


Tipo de experimento diferentes plataformas
Diseo del experimento: Single End (SR) vs. Paired End
(PE)
Pipeline RNAseq
Teorica Practica
FASTQ file

INSTRUMENT NAME
Tile # ADAPTOR
INDEX
X Y
Lane #

@SN971:3:2304:20.80:100.00#0/1
NAAATTTCACATTGCGTTGGGAACAGTTGGCCCAAACTCAGGTTGCAGTAACTGTCACAATACC
ATTCTCCATCAACTTCAAGAAATGTTCAACAAAACAC
+
@P\cceeegggggiihhiiiiiiihighiiiiiiiiiiiiiifghhhhgfghiifihihfhhiiiihiggggggeeeeeeddcdddccbcdddcccccccc

Line 1: begins with @ followed by sequence identifier


Line 2: raw sequence
Line 3: +
Line 4: base quality values for sequence in Line 2
Calidad de secuencia por base
TRANSCRPTOMICA POR RNA-seq
Genoma de referencia:
Se mapean las lecturas sobre el genoma de referencia,
utilizando programas de deteccin de sitios de splicing.
Se pierden sitios no cannicos comunes en plantas, hongos,
oomicetes

Sin genoma de referencia


Ensamblado de novo.
Bioinformaticamente mas complejo que secuenciacin Genmica
de novo .
Requiere normalizacin de colecciones ADNc antes de la
secuenciacin masiva
Mapeo de lecturas
Microarray y RNAseq: necesidad de validacin!

Validacin de genes por Northern Blot y qRT-PCR:

12
Micromatriz
10
qPCR
(BU671801) 8

Log2 tasa de cambio


6

0
T1 T2 T1 T2 T1 T2 T1 T2 T1 T2 T1 T2 T1 T2 T1 T2 T1 T2 T1 T2
-2

11812
10816

11489

37540
1282

2535

3510

4383

5124
163
-4

CH SH CR SR CT ST Gel de agarosa 1,5% y


Northern Blot de los ARNs de
Relacin de intensidad normalizada diferentes rganos de
banda transcripto-especfica/banda
plantas de girasol sometidas
ribosomal utilizando la concentracin
a estrs por salinidad.
de ARN ribosomal
CH: control hoja,
1,00 7,82 1,00 1,56 1,00 1,99 SH: salinidad hoja,
CR: control raz,
SR: salinidad raz,
CT: control tallo,
ST: salinidad tallo
Ejemplos de Transcriptomica en el estudio de
relacin H-P
Identificacion de factor Avr ve1 en
Verticilliun dahliae por RNA-seq

Estrategia de secuenciacin
genmica de variantes y RNA seq
por ILLUMINA para la identificacin
del Factor de Avr Ve1 de Verticillium
dahliae (Ave1) que interactua con el
gen R Ve1 de tomate.

51105115 | PNAS | March 27, 2012 | vol. 109 | no. 13


27,6 millones de lecturas por cada
condicion biolgica (12, 24 Y 48hpi)

77% lecturas mapeadas sobre el


genoma de lechuga
RNA-seq vs. microarray
RNA-seq puede ser utilizado para caracterizar nuevos transcriptos y variantes de
splicing, as como realizar un perfil de los niveles de expresin de los transcriptos
conocidos; mientras que las tcnicas basadas en hibridacin se limitan a detectar
transcriptos correspondientes a las secuencias genmicas conocidas
RNA-seq tiene mayor resolucin
En principio, el RNAseq puede lograr la resolucin de un solo ARNm, mientras que
en los microarray depende de la densidad de sondas.
Deteccin de transcriptos desconocidos con niveles de expresin muy bajos.
RNA-seq se puede aplicar el mismo protocolo experimental para diversos fines,
mientras que los microarrays especializados necesitan ser diseadas para cada
caso.
Deteccin de polimorfismos de nucletido nico (SNP array)
Mapeo de uniones exonicas (junction array)
Deteccin de fusiones gnicas (gene fusion array)
Tecnologas de Next-generation sequencing (NGS) estn desafiando los microarrays
como la herramienta de eleccin para anlisis genmicos.
Anlisis por categoras funcionales:
FATIGO, FATISCAN, GenSet Analysis (Babelomics)

Funcin Molecular

Linea Girasol Resistente Sclerotinia I vs NI


0, 2 y 4 dpi
INTERPRETACIN DE RESULTADOS

Anlisis transcriptmico relacionado


a la senescencia foliar en girasol

Campo 10.173 7.890


Invernculo 7.517 3.714

Mapman
BINCODE NAME IDENTIFIER DESCRIPTION TYPE
1 PS
1.1 PS.lightreaction
1.1.1 PS.lightreaction.photosystem II
1.1.1.1 PS.lightreaction.photosystem II.LHC-II HeAn_C_11607 moderately similar to ( 431) AT3G47470 | Symbols:
T LHCA
1.1.1.2 PS.lightreaction.photosystem II.PSII polypeptide subunits HeAn_C_3889 moderately similar to ( 225) AT2G39050 | Symbols:
T | hy
1.1.2 PS.lightreaction.photosystem I HeAn_C_677 moderately similar to ( 260) AT1G45474 | Symbols:
T LHCA
1.1.2.1 PS.lightreaction.photosystem I.LHC-I HeAn_S_37979 moderately similar to ( 304) AT4G12800 | Symbols:
T PSAL
1.1.2.2 PS.lightreaction.photosystem I.PSI polypeptide subunits HeAn_C_3253 moderately similar to ( 229) AT2G31040 | Symbols:
T | AT
11 lipid metabolism
11.3 lipid metabolism.Phospholipid synthesis HeAn_S_18559 moderately similar to ( 222) AT3G18850 | Symbols:
T LPAT
11.3.2 lipid metabolism.Phospholipid synthesis.choline kinase HeAn_S_17701 moderately similar to ( 254) AT4G09760 | Symbols:
T | ch
3.1.1001 minor CHO metabolism.raffinose family raffinose minor CHO metabolism.raffinose M
13.1.7.1002 amino acid metabolism.synthesis.histidine histidine amino acid synthesis.histidine M
Estudio integrador relacionado a la senescencia foliar en girasol

Campo control: Tiempo 1 vs Tiempo 0


Mapman
Librera KEGG
Paintomics

(http://www.genome.jp/kegg/)
Weighted Gene Correlation
Network Analysis (WGCNA)
Fenotipo

Genmica Transcriptmica Protemica Metabolmica Fenmica

Biologa de Sistemas
GRACIAS!!

También podría gustarte