Aprendizado de máquina na saúde
Índice
Logística
- Disciplina:
- Tópicos Avançados em Ciência da Computação IV (Aprendizado de Máquina na Saúde)
 - TCC00367 – Introdução ao Aprendizado de Máquina para Saúde
 
 - Período: 2025.2
 - Data: sextas-feiras, 14h-18h
 - Sala: 217
 - Google Classroom: --
 
Objetivo
Discutir e compreender os conceitos, métodos e aplicações do aprendizado de máquina na saúde, e os desafios da análise de dados clínicos, considerando a sua heterogeneidade e os aspectos legais e éticos da saúde, e de proteção à privacidade dos pacientes. Dentre os tópicos na disciplina, incluem:
- Desafios da heterogeneidade dos dados clínicos;
 - Aplicações do aprendizado de máquina para:
- Estratificação de risco;
 - Auxílio aos processos de triagem e raciocínio diagnóstico;
 - Modelagem da progressão da doença (prognóstico);
 - Avaliação do tratamento;
 - Auxílio aos processos de reabilitação do paciente.
 
 
Ementa
A disciplina trata dos conceitos, métodos e aplicações do aprendizado de máquina na saúde, incluindo o uso de modelos supervisionados, não supervisionados, por reforço e de aprendizado profundo em aplicações voltadas a triagem, diagnóstico, tratamento, reabilitação e bem-estar dos pacientes. Inclui tópicos sobre a estratificação de risco, modelagem do progresso de doenças e aplicações para o auxílio ao diagnóstico baseado em imagens e ao prognóstico de doenças, considerando os aspectos legais e éticos da saúde, e a proteção à privacidade dos dados dos pacientes.
Tópicos abordados
- Redes Bayesianas;
 - Causalidade;
 - Séries temporais e sinais fisiológicos;
 - Imagens médicas;
 - Processamento em linguagem natural (PNL);
 - Aprendizado profundo;
 - Interpretabilidade;
 - Interoperabilidade;
 - Automatização de diretrizes clínicas;
 - Aprendizado por transferência;
 - Fairness;
 - Ética.
 
Avaliação
- Apresentação de artigos científicos. Peso: 2. Entrega: apresentação + slides + resumo de até 2 páginas.
 - Atividades Práticas. Peso: 2. Entrega: arquivo Jupyter Notebook ou R Markdown documentado.
 - Hackathon Interdisciplinar. Peso: 2. Entrega: pitch final de 5 minutos + notebook.
 - Projeto de Aplicação. Peso: 4. Entrega: relatório final (máx. 12 páginas) no formato de artigo científico;
- Código e/ou notebook comentado;
 - Apresentação oral (15 minutos + 5 de perguntas).
 
 
Implementação
- Python.
 - R.
 - Matlab®.
 - Lista de bases de dados públicas da saúde.
 
Cronograma
| Data | Aula / Atividade | Conteúdo | Formato | Observações / Entregas | 
|---|---|---|---|---|
| 22/08/2025 | Aula 1 | O que torna os sistemas de saúde únicos? | Aula expositiva + discussão de caso | Estudo de caso: impacto de modelos de risco na triagem de pacientes | 
| 29/08/2025 | Nivelamento – Parte 1 | Introdução a Python e Jupyter Notebook; Estatística básica; Fundamentos de ML | Aula prática + Colab | Notebooks compartilhados | 
| 05/09/2025 | Nivelamento – Parte 2 | Conceitos básicos de dados clínicos; LGPD na saúde; Exemplos de datasets públicos | Aula prática | Uso do MIMIC-III, PhysioNet e OpenEHR para demonstração | 
| 12/09/2025 | Aula 2 + Atividade 1 | Análise exploratória de dados clínicos; Regressão logística aplicada | Aula prática | Atividade: prever risco de internação usando dataset simplificado | 
| 19/09/2025 | Aula 3 | Características da área clínica e fluxos de trabalho | Aula interativa | Formação das equipes (médicos + computação) e definição do tema do Projeto de Aplicação | 
| 26/09/2025 | Aula 4 + Atividade 2 | Aprendizado supervisionado e não supervisionado; Clusterização | Aula prática | Clusterização de perfis de pacientes crônicos | 
| 03/10/2025 | Revisão + Estudo de Caso | Revisão de ML + caso clínico de estratificação de risco | Aula prática | Preparação para hackathon | 
| 10/10/2025 | Hackathon Interdisciplinar – Dia 1 | Montagem de equipes, definição do problema, análise exploratória | Dinâmica de grupo | Problemas sugeridos pelos docentes | 
| 17/10/2025 | Hackathon Interdisciplinar – Dia 2 | Desenvolvimento de modelos, avaliação inicial e discussão | Trabalho em grupo | Entrega parcial do protótipo | 
| 24/10/2025 | Aula 5 + Atividade 3 | Modelos de sobrevivência e prognóstico | Aula prática | Uso de dados de seguimento para prever tempo até evento | 
| 31/10/2025 | Aula 6 | Séries temporais e sinais fisiológicos | Aula prática | Previsão de eventos cardíacos com ECG | 
| 07/11/2025 | Aula 7 | Processamento de Linguagem Natural (PNL) aplicado à saúde | Aula prática | Extração de informações de laudos médicos | 
| 14/11/2025 | Aula 8 + Atividade 4 | Inferência causal na saúde | Aula prática | Uso de DAGs para analisar impacto de tratamentos | 
| 21/11/2025 | Aula 9 | Aprendizado por reforço aplicado à saúde | Aula prática | Política ótima de tratamento em UTI (simulação) | 
| 28/11/2025 | Aula 10 | Interpretabilidade, fairness e explicabilidade de modelos clínicos | Aula prática | SHAP e Grad-CAM em imagens médicas | 
| 05/12/2025 | Apresentações – Parte 1 | Apresentação dos Projetos de Aplicação – Equipes 1 a 4 | Seminário | Avaliação parcial e feedback | 
| 12/12/2025 | Apresentações – Parte 2 | Apresentação dos Projetos de Aplicação – Equipes 5 a 8 | Seminário | Encerramento e avaliação final | 
Referências
| Tema | Referência | 
|---|---|
| Dados clínicos | 
  | 
| Estratificação de riscos | 
  | 
| Séries temporais | 
  | 
| Processamento de Linguagem Natural (PLN) | 
  | 
| Diagnóstico Diferencial | 
  | 
| Inferência Causal | 
  | 
| Aprendizado por Reforço | 
  | 
| Progressão de Doenças | 
  | 
| Automatização de workflows clínicos | 
  | 
| Medicina de Precisão | 
  | 
| Redes Bayesianas | 
  | 
Revistas e conferências relacionadas
Revistas e conferências relacionadas à computação aplicada à saúde
Bibliografia
- AGRESTI, Alan, An Introduction to Categorical Data Analysis, Wiley Series in Probability and Statistics, 3rd edition, 2019.
 - BENSON, T.; GRIEVE, G. Principles of Health Interoperability. 4o ed. Springer, 2016.
 - BERNER, Eta S., Clinical Decision Support System: Theory and Practice, Springer-Verlag New York, Second Edition, 2007.
 - BRAUNSTEIN, Mark L., Health Informatics on FHIR: How HL7's New API is Transforming Healthcare, 2018
 - GEISS, Linda S. et al. Prevalence and incidence trends for diagnosed diabetes among adults aged 20 to 79 years, United States, 1980-2012. Jama, v. 312, n. 12, p. 1218-1226, 2014.
 - KORB, K. B.; NICHOLSON, A. E. Bayesian artificial intelligence. Clayton, Victoria, Australia: Chapman & Hall/CRC, 2004.
 - PANESAR, Arjun, Machine Learning and AI for Healthcare: Big Data for Improved Health Outcomes, Apress, 2019.
 - PEARL, Judea. Causal inference in statistics: An overview. Statistics surveys, v. 3, p. 96-146, 2009.
 - SHORTLIFFE, E. H., CIMINO, J. E., Biomedical Informatics: Computer Applications in Health Care and Biomedicine, Forth Edition, Springer, 2014.
 - WANG, Ping; LI, Yan; REDDY, Chandan K. Machine learning for survival analysis: A survey. ACM Computing Surveys (CSUR), v. 51, n. 6, p. 1-36, 2019.
 
Programação:
- CRAWLEY, Michael J. The R book. John Wiley & Sons, 2012.
 - NAGARAJAN, Radhakrishnan; SCUTARI, Marco; LÈBRE, Sophie. Bayesian networks in R. Springer, v. 122, p. 125-127, 2013.