Aprendizado de máquina na saúde

Índice

1 Logística
2 Objetivo
3 Ementa
4 Tópicos abordados
5 Avaliação
6 Implementação
7 Cronograma
8 Referências
9 Revistas e conferências relacionadas
10 Bibliografia

Logística

Disciplina:
- Tópicos Avançados em Ciência da Computação IV (Aprendizado de Máquina na Saúde)
- TCC00367 – Introdução ao Aprendizado de Máquina para Saúde
Período: 2025.2
Data: sextas-feiras, 14h-18h
Sala: 217
Google Classroom: --

Objetivo

Discutir e compreender os conceitos, métodos e aplicações do aprendizado de máquina na saúde, e os desafios da análise de dados clínicos, considerando a sua heterogeneidade e os aspectos legais e éticos da saúde, e de proteção à privacidade dos pacientes. Dentre os tópicos na disciplina, incluem:

Desafios da heterogeneidade dos dados clínicos;
Aplicações do aprendizado de máquina para:
- Estratificação de risco;
- Auxílio aos processos de triagem e raciocínio diagnóstico;
- Modelagem da progressão da doença (prognóstico);
- Avaliação do tratamento;
- Auxílio aos processos de reabilitação do paciente.

Ementa

A disciplina trata dos conceitos, métodos e aplicações do aprendizado de máquina na saúde, incluindo o uso de modelos supervisionados, não supervisionados, por reforço e de aprendizado profundo em aplicações voltadas a triagem, diagnóstico, tratamento, reabilitação e bem-estar dos pacientes. Inclui tópicos sobre a estratificação de risco, modelagem do progresso de doenças e aplicações para o auxílio ao diagnóstico baseado em imagens e ao prognóstico de doenças, considerando os aspectos legais e éticos da saúde, e a proteção à privacidade dos dados dos pacientes.

Tópicos abordados

Redes Bayesianas;
Causalidade;
Séries temporais e sinais fisiológicos;
Imagens médicas;
Processamento em linguagem natural (PNL);
Aprendizado profundo;
Interpretabilidade;
Interoperabilidade;
Automatização de diretrizes clínicas;
Aprendizado por transferência;
Fairness;
Ética.

Avaliação

Apresentação de artigos científicos. Peso: 2. Entrega: apresentação + slides + resumo de até 2 páginas.
Atividades Práticas. Peso: 2. Entrega: arquivo Jupyter Notebook ou R Markdown documentado.
Hackathon Interdisciplinar. Peso: 2. Entrega: pitch final de 5 minutos + notebook.
Projeto de Aplicação. Peso: 4. Entrega: relatório final (máx. 12 páginas) no formato de artigo científico;
- Código e/ou notebook comentado;
- Apresentação oral (15 minutos + 5 de perguntas).

Implementação

Python.
R.
Matlab®.
Lista de bases de dados públicas da saúde.

Cronograma

Data	Aula / Atividade	Conteúdo	Formato	Observações / Entregas
22/08/2025	Aula 1	O que torna os sistemas de saúde únicos?	Aula expositiva + discussão de caso	Estudo de caso: impacto de modelos de risco na triagem de pacientes
29/08/2025	Nivelamento – Parte 1	Introdução a Python e Jupyter Notebook; Estatística básica; Fundamentos de ML	Aula prática + Colab	Notebooks compartilhados
05/09/2025	Nivelamento – Parte 2	Conceitos básicos de dados clínicos; LGPD na saúde; Exemplos de datasets públicos	Aula prática	Uso do MIMIC-III, PhysioNet e OpenEHR para demonstração
12/09/2025	Aula 2 + Atividade 1	Análise exploratória de dados clínicos; Regressão logística aplicada	Aula prática	Atividade: prever risco de internação usando dataset simplificado
19/09/2025	Aula 3	Características da área clínica e fluxos de trabalho	Aula interativa	Formação das equipes (médicos + computação) e definição do tema do Projeto de Aplicação
26/09/2025	Aula 4 + Atividade 2	Aprendizado supervisionado e não supervisionado; Clusterização	Aula prática	Clusterização de perfis de pacientes crônicos
03/10/2025	Revisão + Estudo de Caso	Revisão de ML + caso clínico de estratificação de risco	Aula prática	Preparação para hackathon
10/10/2025	Hackathon Interdisciplinar – Dia 1	Montagem de equipes, definição do problema, análise exploratória	Dinâmica de grupo	Problemas sugeridos pelos docentes
17/10/2025	Hackathon Interdisciplinar – Dia 2	Desenvolvimento de modelos, avaliação inicial e discussão	Trabalho em grupo	Entrega parcial do protótipo
24/10/2025	Aula 5 + Atividade 3	Modelos de sobrevivência e prognóstico	Aula prática	Uso de dados de seguimento para prever tempo até evento
31/10/2025	Aula 6	Séries temporais e sinais fisiológicos	Aula prática	Previsão de eventos cardíacos com ECG
07/11/2025	Aula 7	Processamento de Linguagem Natural (PNL) aplicado à saúde	Aula prática	Extração de informações de laudos médicos
14/11/2025	Aula 8 + Atividade 4	Inferência causal na saúde	Aula prática	Uso de DAGs para analisar impacto de tratamentos
21/11/2025	Aula 9	Aprendizado por reforço aplicado à saúde	Aula prática	Política ótima de tratamento em UTI (simulação)
28/11/2025	Aula 10	Interpretabilidade, fairness e explicabilidade de modelos clínicos	Aula prática	SHAP e Grad-CAM em imagens médicas
05/12/2025	Apresentações – Parte 1	Apresentação dos Projetos de Aplicação – Equipes 1 a 4	Seminário	Avaliação parcial e feedback
12/12/2025	Apresentações – Parte 2	Apresentação dos Projetos de Aplicação – Equipes 5 a 8	Seminário	Encerramento e avaliação final

Referências

Tema	Referência
Dados clínicos	Agniel, Denis, Isaac Kohane, and Griffin Weber. "Biases in Electronic Health Record Data Due to Processes Within the Healthcare System: Retrospective Observational Study." BMJ, 2018. Eapen, Bell Raj, et al. "FHIRForm: An Open-Source Framework for the Management of Electronic Forms in Healthcare." ITCH. 2019. Ulriksen, Gro-Hilde, Rune Pedersen, and Gunnar Ellingsen. "Infrastructuring in healthcare through the openEHR architecture." Computer Supported Cooperative Work (CSCW) 26.1-2 (2017): 33-69.
Estratificação de riscos	Razavian, Narges, Saul Blecker, et al. "Population-Level Prediction of Type 2 Diabetes From Claims Data and Analysis of Risk Factors." Big Data 3, no. 4 (2015): 277–87. Pozen, Michael, Ralph D'Agostino, et al. "A Predictive Instrument to Improve Coronary-Care-Unit Admission Practices in Acute Ischemic Heart Disease." New England Journal of Medicine 310, no. 20 (1984): 1273–78. Futoma, Joseph, Sanjay Hariharan, et al. "An Improved Multi-Output Gaussian Process RNN With Real-Time Validation for Early Sepsis Detection." arXiv preprint arXiv:1708.05894 (2017). Caruana, Rich, Yin Lou, et al. "Intelligible Models for HealthCare." Proceedings of the 21th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD 15, 2015. Rodríguez, G. (2007). "Chapter 7: Survival Models." In Lecture Notes on Generalized Linear Models.
Séries temporais	Quinn, J.A., C.K.I. Williams, and N. Mcintosh. "Factorial Switching Linear Dynamical Systems Applied to Physiological Condition Monitoring." IEEE Transactions on Pattern Analysis and Machine Intelligence 31, no. 9 (2009): 1537–51. Hannun, Awni, Pranav Rajpurkar, et al. "Cardiologist-Level Arrhythmia Detection and Classification in Ambulatory Electrocardiograms Using a Deep Neural Network." Nature Medicine 25, no. 3 (2019): 65–69.
Processamento de Linguagem Natural (PLN)	Leaman, Robert, Ritu Khare, and Zhiyong Lu. "Challenges in Clinical Natural Language Processing for Automated Disorder Normalization." Journal of Biomedical Informatics 57 (2015): 28–37.
Diagnóstico Diferencial	Rotmensch, Maya, Yoni Halpern, et al. "Learning a Health Knowledge Graph from Electronic Medical Records." Scientific Reports 7, no. 1 (2017): 5994.
Inferência Causal	Hernán MA, Robins JM. Causal Inference: What If. Boca Raton: Chapman & Hall/CRC, forthcoming. Chapter 1. 2019.
Aprendizado por Reforço	Komorowski, Matthieu, Leo Celi, et al. "The Artificial Intelligence Clinician learns optimal treatment strategies for sepsis in intensive care." Nature Medicine 24, no. 11 (2018): 1716. Gottesman, Omer, et al. "Evaluating reinforcement learning algorithms in observational health settings." arXiv preprint arXiv:1805.12298 (2018). Yu, Chao, et al. "Reinforcement learning in healthcare: A survey." ACM Computing Surveys (CSUR) 55.1 (2021): 1-36.
Progressão de Doenças	Schulam, Peter, and Suchi Saria. "Integrative Analysis Using Coupled Latent Variable Models for Individualizing Prognoses." The Journal of Machine Learning Research 17, no. 232 (2016): 1–35. Young, Alexandra, Razvan Marinescu, et al. "Uncovering the Heterogeneity and Temporal Complexity of Neurodegenerative Diseases with Subtype and Stage Inference." Nature Communications 9, no. 1 (2018): 4273.
Automatização de workflows clínicos	Zhang, Yiye, Rema Padman, and Nirav Patel. "Paving the COWpath: Learning and Visualizing Clinical Pathways from Electronic Health Record Data." Journal of Biomedical Informatics 58 (2015): 186–97. Gawande, Atul. "A Life-Saving Checklist." The New Yorker. The New Yorker, December 3, 2007
Medicina de Precisão	Udler, Miriam S., Jaegil Kim, et al. "Type 2 Diabetes Genetic Loci Informed by Multi-Trait Associations Point to Disease Mechanisms and Subtypes: A Soft Clustering Analysis." PLoS Medicine 15, no. 9 (2018): e1002654.
Redes Bayesianas	Kyrimi, Evangelia, et al. "A comprehensive scoping review of bayesian networks in healthcare: Past, present and future." arXiv preprint arXiv:2002.08627 (2020). Velikova, Marina, et al. "Exploiting causal functional relationships in Bayesian network modelling for personalised healthcare." International Journal of Approximate Reasoning 55.1 (2014): 59-73. Seixas, Flávio Luiz, et al. "A Bayesian network decision model for supporting the diagnosis of dementia, Alzheimer׳ s disease and mild cognitive impairment." Computers in biology and medicine 51 (2014): 140-158.

Revistas e conferências relacionadas

Revistas e conferências relacionadas à computação aplicada à saúde

Bibliografia

AGRESTI, Alan, An Introduction to Categorical Data Analysis, Wiley Series in Probability and Statistics, 3rd edition, 2019.
BENSON, T.; GRIEVE, G. Principles of Health Interoperability. 4o ed. Springer, 2016.
BERNER, Eta S., Clinical Decision Support System: Theory and Practice, Springer-Verlag New York, Second Edition, 2007.
BRAUNSTEIN, Mark L., Health Informatics on FHIR: How HL7's New API is Transforming Healthcare, 2018
GEISS, Linda S. et al. Prevalence and incidence trends for diagnosed diabetes among adults aged 20 to 79 years, United States, 1980-2012. Jama, v. 312, n. 12, p. 1218-1226, 2014.
KORB, K. B.; NICHOLSON, A. E. Bayesian artificial intelligence. Clayton, Victoria, Australia: Chapman & Hall/CRC, 2004.
PANESAR, Arjun, Machine Learning and AI for Healthcare: Big Data for Improved Health Outcomes, Apress, 2019.
PEARL, Judea. Causal inference in statistics: An overview. Statistics surveys, v. 3, p. 96-146, 2009.
SHORTLIFFE, E. H., CIMINO, J. E., Biomedical Informatics: Computer Applications in Health Care and Biomedicine, Forth Edition, Springer, 2014.
WANG, Ping; LI, Yan; REDDY, Chandan K. Machine learning for survival analysis: A survey. ACM Computing Surveys (CSUR), v. 51, n. 6, p. 1-36, 2019.

Programação:

CRAWLEY, Michael J. The R book. John Wiley & Sons, 2012.
NAGARAJAN, Radhakrishnan; SCUTARI, Marco; LÈBRE, Sophie. Bayesian networks in R. Springer, v. 122, p. 125-127, 2013.

Aprendizado de máquina na saúde

Índice

Logística

Objetivo

Ementa

Tópicos abordados

Avaliação

Implementação

Cronograma

Referências

Revistas e conferências relacionadas

Bibliografia

Menu de navegação

Ferramentas pessoais

Domínios

Variantes

Visualizações

Mais

Pesquisa

Navegação

Ferramentas