Curso de Posgrado
Bioinformática aplicada al análisis de datos de Secuenciación de Nueva Generación (NGS)
MAR DEL PLATA, 16 AL 27 DE ABRIL DE 2018
Carga horaria: 84 horas totales
Lugar: sede del INBIOTEC-CONICET y FIBA: Vieytes 3103, Mar del Plata, Argentina
DOCENTES:
Dr. Pablo Daniel Ghiringheli (Inv. Principal CONICET; Laboratorio de Ingeniería Genética y Biología Molecular y Celular. – Universidad Nacional de Quilmes).
Dra. Carolina Susana Cerrudo (Inv. Asistente CONICET; Laboratorio de Ingeniería Genética y Biología Molecular y Celular. – Universidad Nacional de Quilmes).
CONTENIDOS MÍNIMOS:
- Aplicaciones y enfoques de flujo de trabajo para las tecnologías NGS (software y herramientas de bioinformática para llevar a cabo un análisis básico de datos de NGS). Evaluación de datos de NGS. Ventajas y limitaciones de los análisis de NGS. Conceptos algorítmicos detrás de los alineamientos de lecturas cortas (“short reads”), el “llamado de variantes” (“variant calling”) y experiencia práctica usando el software.
- Organización y tipos de datos de NGS disponibles en repositorios públicos.
CRONOGRAMA
|
Día |
Tema |
Actividad |
Docente |
Día 1 |
Mañana |
- Plataformas NGS (Secuenciación de genomas: tecnologías, características y limitaciones). - Herramientas NGS |
Teórico |
Ghiringhelli |
Tarde |
- Flujos de trabajo bioinformático luego de la generación de secuencias NGS. - Determinación de las necesidades bioinformáticas y diseño experimental. |
Teórico |
Ghiringhelli |
|
Día 2 |
Mañana |
- Archivos de datos de NGS y formatos (FastQ, SAM, BAM, VCF). - Control de calidad de las secuencias (Quality Control, QC). - Introducción a la plataforma Galaxy. |
Teórico |
Cerrudo |
Tarde |
- Presentación de la plataforma Galaxy. Carga de datos, herramientas y flujos de trabajo. - Análisis de control de calidad de diversos conjuntos de datos de lecturas NGS. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 3 |
Mañana |
- NGS para genómica: ensamblado por referencia, alineamiento de secuencias, QC y llamado de variantes. |
Teórico |
Ghiringhelli |
Tarde |
Utilización de diversas herramientas del Galaxy para ensamblado de genomas con referencia. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 4 |
Mañana |
- Detección de SNPs y Variación Estructural (SVs, deleciones, duplicaciones, inversiones, translocaciones, SNP/indel). Efectos funcionales de las variantes detectadas. |
Teórico |
Ghiringhelli |
Tarde |
- Utilización de herramientas para detección de SNPs y Variación Estructural. - Predicción de efectos funcionales de las variantes detectadas. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 5 |
Mañana |
- NGS para transcriptómica: QC, mapeo, herramientas de visualización. |
Teórico |
Ghiringhelli |
Tarde |
- Utilización de herramientas del Galaxy para ensamblado de trancriptomas con referencia. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 6 |
Mañana |
- RNA-seq y análisis de expresión diferencial (tecnologías, recursos necesarios, cobertura, limitaciones). |
Teórico |
Ghiringhelli |
Tarde |
- Utilización de herramientas del Galaxy para determinar expresión diferencial a partir de lecturas de RNA-seq. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 7 |
Mañana |
- Ensamblado de genoma y transcriptoma de novo (genomas heterocigotos / polimórficos, predicción de genes y anotación funcional). |
Teórico |
Ghiringhelli |
Tarde |
Utilización de herramientas del Galaxy para ensamblado de novo |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 8 |
Mañana |
- Visualización de datos de secuencia con Integrated Genomics Viewer. - Repositorios públicos de secuencias |
Teórico |
Cerrudo |
Tarde |
- Visualización de los datos obtenidos a lo largo del curso (Integrated Genomics Viewer). - Acceso a repositorios públicos de secuencia. |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 9 |
Mañana |
- Anotación de genomas: utilizando bases de datos de referencia y por predicción. |
Teórico |
Ghiringhelli |
Tarde |
- Anotación de un genoma “muestra” por predicción y utilizando bases de datos |
Teórico / Práctico |
Cerrudo / Ghiringhelli |
|
Día 10 |
Mañana |
Repaso |
|
Cerrudo / Ghiringhelli |
Tarde |
Examen |
|
Cerrudo / Ghiringhelli |
BIBLIOGRAFÍA
The Galaxy platform for accessible, reproducible and collaborative biomedical analyses: 2016 update. Enis Afgan, Dannon Baker, Marius van den Beek, Daniel Blankenberg, Dave Bouvier, Martin Čech, John Chilton, Dave Clements, Nate Coraor, Carl Eberhard, Björn Grüning, Aysam Guerler, Jennifer Hillman-Jackson, Greg Von Kuster, Eric Rasche, Nicola Soranzo, Nitesh Turaga, James Taylor, Anton Nekrutenko, and Jeremy Goecks. Nucleic Acids Research (2016) 44(W1): W3-W10.
Critical review of NGS analyses for de novo genotyping multigene families. Lighten J, van Oosterhout C, Bentzen P. Mol Ecol. 2014 Aug;23(16):3957-72.
Understanding the Basics of NGS: From Mechanism to Variant Calling. Muzzey D, Evans EA, Lieber C. Curr Genet Med Rep. 2015;3(4):158-165.
Next-generation sequencing (NGS) in the microbiological world: How to make the most of your money. Vincent AT, Derome N, Boyle B, Culley AI, Charette SJ. J Microbiol Methods. 2017 Jul;138:60-71.
Standards and Guidelines for Validating Next-Generation Sequencing Bioinformatics Pipelines: A Joint Recommendation of the Association for Molecular Pathology and the College of American Pathologists. Roy S, Coldren C, Karunamurthy A, Kip NS, Klee EW, Lincoln SE, Leon A, Pullambhatla M, Temple-Smolkin RL, Voelkerding KV, Wang C, Carter AB. J Mol Diagn. 2018 Jan;20(1):4-27.
Next-generation sequencing applications in clinical bacteriology. Motro Y, Moran-Gilad J. Biomol Detect Quantif. 2017 Oct 23;14:1-6.
Challenges in the Setup of Large-scale Next-Generation Sequencing Analysis Workflows. Kulkarni P, Frommolt P. Comput Struct Biotechnol J. 2017 Oct 25;15:471-477.