Assista ao vídeo de apresentação do módulo 3
Manipulação de dados na vigilância em saúde
Em seu dia a dia, por vezes o profissional de vigilância é convocado a produzir “informação para a ação”, o que torna crucial uma resposta rápida e eficiente às demandas de saúde. O Guia de Vigilância Epidemiológica em sua 7ª edição lista enquanto principais funções da vigilância epidemiológica:
- coleta de dados;
- processamento de dados coletados;
- análise e interpretação dos dados processados;
- recomendação das medidas de prevenção e controle apropriadas;
- promoção das ações de prevenção e controle indicadas;
- avaliação da eficácia e efetividade das medidas adotadas;
- divulgação das informações pertinentes.
Observe na Figura 1 as etapas que compõem a manipulação de dados de vigilância:
Figura 1: Ciclo de manipulação dos dados de vigilância em saúde.
Neste módulo você irá participar e intervir junto a todo o ciclo de produção de informação de vigilância, desde a coleta dos dados até a produção de relatórios que subsidiem as ações de saúde.
Ao final do Módulo 3 você será capaz de realizar uma rotina sistemática para as seguintes etapas de análise dos dados de vigilância em saúde:
- Limpar e transformar seus dados.
- Criar tabelas com filtros escolhidos.
- Unir/linkar dados de diversas fontes.
- Exportar os dados tratados para diferentes formatos.
Para seguir com este módulo do curso você deve já ter instalado o
software R
e a interface gráfica
RStudio
e conhecer os conceitos básicos para análise de
dados na vigilância em saúde. Esses passos estão disponíveis nos Módulos
1 e 2 deste curso!
Nesse momento instale e carregue todos os pacotes aqui listados para você possa utilizá-los ao longo deste módulo:
foreign
readxl
readr
janitor
skimr
stringr
stringi
lubridate
summarytools
descr
Vamos lá, para isso inicie o seu RStudio
, crie um novo
script e replique o código abaixo:
if(!require(foreign)) install.packages("foreign");library(foreign)
if(!require(readxl)) install.packages("readxl");library(readxl)
if(!require(readr)) install.packages("readr");library(readr)
if(!require(janitor)) install.packages("janitor");library(janitor)
if(!require(skimr)) install.packages("skimr");library(skimr)
if(!require(stringr)) install.packages("stringr");library(stringr)
if(!require(stringi)) install.packages("stringi");library(stringi)
if(!require(lubridate)) install.packages("lubridate");library(lubridate)
Com a execução do código acima, você está carregando os pacotes e instalado-os em sua máquina. Ao longo deste módulo, utilizaremos funções vinculadas aos pacotes instalados e aprofundaremos seus conceitos e usos.

Não será necessário instalar estes pacotes novamente em futuras
análises e rotinas da vigilância. Para utilizá-los basta executar a
função require()
ou library()
que carregarão
um pacote já instalado. Veja como ficariam os códigos:
# Utilizando a função library para carregar um pacote
# já instalado
library("readr")
# Utilizando a função require para carregar um pacote
# já instalado
require("readr")
Durante este curso utilizaremos sempre o uso da função
library()
para instalar e carregar pacotes!
1. Obtendo os dados para sua análise
Neste módulo vamos simular um problema fictício que ocorrerá no Estado de Rosas. Vamos lá! Você enquanto membro da Vigilância Epidemiológica estadual de Rosas recebeu um alerta do Ministério da Saúde indicando aumento de casos de hepatites virais em pessoas de até 17 anos em estados brasileiros.
Será necessário construir uma análise da situação de saúde para o alerta apresentado. Para esta análise, você precisará manipular diversas bases de dados que subsidiem a construção de um relatório sobre a situação das hepatites virais em Rosas.
Vamos iniciar nossa avaliação escolhendo o banco de dados apropriado
para encontrar os casos de hepatites virais notificados: o
{NINDINET.dbf
}, resultado do preenchimento da Ficha
Individual de Notificação (FIN), exportada por meio do sistema
Sinan Net - Sistema de Informação de Agravos de
Notificação. Esta ficha é preenchida quando há suspeita ou confirmação
da ocorrência de problema de saúde de notificação compulsória de
interesse nacional, estadual ou municipal.
O primeiro passo para iniciar a sua análise de dados é a importação
dos bancos de dados escolhidos para o ambiente do RStudio
.
Você aprendeu o passo a passo de como importar dados exportados dos
sistemas de informação em saúde do tipo .dbf
, arquivos do
Microsoft Excel (.xls
e .xlsx
) e
.csv
no Módulo 2 deste curso.
Observe e replique os comandos do script abaixo em seu
`RStudio
e importe o banco de dados
{NINDINET.dbf
}, disponível no Ambiente Virtual do curso,
para análise:
# Carregando o pacote foreign no RStudio
library(foreign)
# Importando o arquivo {`NINDINET.dbf`} no objeto {`base`}
# Utilizando o argumento "as.is = TRUE" para transformar os dados em caracteres
base <- read.dbf(file = 'Dados/NINDINET.dbf', as.is = TRUE)

Lembre-se de antes de iniciar o módulo, acessar o arquivo
Modulo_3.Rproj
disponível no menu lateral “Arquivos” do
módulo para iniciar o projeto do curso. Esta etapa está descrita no
Módulo 1.
Ao clicar no arquivo Modulo_3.Rproj
, sua sessão no
RStudio
será aberta e você indicará o diretório de trabalho
em que sua sessão esta para o R
, facilitando o acesso às
pastas e arquivos indicando o caminho correto de forma automatizada em
qualquer computador.
Observe neste módulo que utilizaremos funções específicas de acordo com o tipo de arquivo e as suas particularidades. Vamos em frente!