Assista ao vídeo de apresentação do módulo 3




Manipulação de dados na vigilância em saúde

Em seu dia a dia, por vezes o profissional de vigilância é convocado a produzir “informação para a ação”, o que torna crucial uma resposta rápida e eficiente às demandas de saúde. O Guia de Vigilância Epidemiológica em sua 7ª edição lista enquanto principais funções da vigilância epidemiológica:

  • coleta de dados;
  • processamento de dados coletados;
  • análise e interpretação dos dados processados;
  • recomendação das medidas de prevenção e controle apropriadas;
  • promoção das ações de prevenção e controle indicadas;
  • avaliação da eficácia e efetividade das medidas adotadas;
  • divulgação das informações pertinentes.

Observe na Figura 1 as etapas que compõem a manipulação de dados de vigilância:


Figura 1: Ciclo de manipulação dos dados de vigilância em saúde.


Neste módulo você irá participar e intervir junto a todo o ciclo de produção de informação de vigilância, desde a coleta dos dados até a produção de relatórios que subsidiem as ações de saúde.

Ao final do Módulo 3 você será capaz de realizar uma rotina sistemática para as seguintes etapas de análise dos dados de vigilância em saúde:

  1. Limpar e transformar seus dados.
  2. Criar tabelas com filtros escolhidos.
  3. Unir/linkar dados de diversas fontes.
  4. Exportar os dados tratados para diferentes formatos.


Para seguir com este módulo do curso você deve já ter instalado o software R e a interface gráfica RStudio e conhecer os conceitos básicos para análise de dados na vigilância em saúde. Esses passos estão disponíveis nos Módulos 1 e 2 deste curso!

Nesse momento instale e carregue todos os pacotes aqui listados para você possa utilizá-los ao longo deste módulo:

  • foreign
  • readxl
  • readr
  • janitor
  • skimr
  • stringr
  • stringi
  • lubridate
  • summarytools
  • descr

Vamos lá, para isso inicie o seu RStudio, crie um novo script e replique o código abaixo:

if(!require(foreign)) install.packages("foreign");library(foreign)
if(!require(readxl)) install.packages("readxl");library(readxl)
if(!require(readr)) install.packages("readr");library(readr)
if(!require(janitor)) install.packages("janitor");library(janitor)
if(!require(skimr)) install.packages("skimr");library(skimr)
if(!require(stringr)) install.packages("stringr");library(stringr)
if(!require(stringi)) install.packages("stringi");library(stringi)
if(!require(lubridate)) install.packages("lubridate");library(lubridate)

Com a execução do código acima, você está carregando os pacotes e instalado-os em sua máquina. Ao longo deste módulo, utilizaremos funções vinculadas aos pacotes instalados e aprofundaremos seus conceitos e usos.

Não será necessário instalar estes pacotes novamente em futuras análises e rotinas da vigilância. Para utilizá-los basta executar a função require() ou library() que carregarão um pacote já instalado. Veja como ficariam os códigos:

# Utilizando a função library para carregar um pacote
# já instalado
library("readr")

# Utilizando a função require para carregar um pacote 
# já instalado
require("readr")

Durante este curso utilizaremos sempre o uso da função library() para instalar e carregar pacotes!


1. Obtendo os dados para sua análise

Neste módulo vamos simular um problema fictício que ocorrerá no Estado de Rosas. Vamos lá! Você enquanto membro da Vigilância Epidemiológica estadual de Rosas recebeu um alerta do Ministério da Saúde indicando aumento de casos de hepatites virais em pessoas de até 17 anos em estados brasileiros.

Será necessário construir uma análise da situação de saúde para o alerta apresentado. Para esta análise, você precisará manipular diversas bases de dados que subsidiem a construção de um relatório sobre a situação das hepatites virais em Rosas.

Vamos iniciar nossa avaliação escolhendo o banco de dados apropriado para encontrar os casos de hepatites virais notificados: o {NINDINET.dbf}, resultado do preenchimento da Ficha Individual de Notificação (FIN), exportada por meio do sistema Sinan Net - Sistema de Informação de Agravos de Notificação. Esta ficha é preenchida quando há suspeita ou confirmação da ocorrência de problema de saúde de notificação compulsória de interesse nacional, estadual ou municipal.

O primeiro passo para iniciar a sua análise de dados é a importação dos bancos de dados escolhidos para o ambiente do RStudio. Você aprendeu o passo a passo de como importar dados exportados dos sistemas de informação em saúde do tipo .dbf, arquivos do Microsoft Excel (.xls e .xlsx) e .csv no Módulo 2 deste curso.

Observe e replique os comandos do script abaixo em seu `RStudio e importe o banco de dados {NINDINET.dbf}, disponível no Ambiente Virtual do curso, para análise:

# Carregando o pacote foreign no RStudio
library(foreign)

# Importando o arquivo {`NINDINET.dbf`} no objeto {`base`}
# Utilizando o argumento "as.is = TRUE" para transformar os dados em caracteres
base <- read.dbf(file = 'Dados/NINDINET.dbf', as.is = TRUE)

Lembre-se de antes de iniciar o módulo, acessar o arquivo Modulo_3.Rproj disponível no menu lateral “Arquivos” do módulo para iniciar o projeto do curso. Esta etapa está descrita no Módulo 1.

Ao clicar no arquivo Modulo_3.Rproj, sua sessão no RStudio será aberta e você indicará o diretório de trabalho em que sua sessão esta para o R, facilitando o acesso às pastas e arquivos indicando o caminho correto de forma automatizada em qualquer computador.


Observe neste módulo que utilizaremos funções específicas de acordo com o tipo de arquivo e as suas particularidades. Vamos em frente!