2. Limpando e transformando os dados de vigilância
O sistema de vigilância no Brasil nos impõe desafios desde a coleta até o processamento dos dados nos diversos níveis da federação envolvidos. Para realizarmos a análise de situação de saúde para o Estado de Rosas iremos avaliar alguns aspectos da qualidade dos dados que serão analisados. Neste tópico o profissional de vigilância poderá avaliar consistência, completitude e validade dos dados que serão analisados.
É importante saber que para a realização dos cálculos, modelagem
estatística e visualização de dados, o R
oferece uma série
de pacotes com um conjunto de funções que facilitam e otimizam estas
tarefas, tornando-as muito mais fluidas e simplificadas. Atualmente,
alguns pacotes integram uma série de ferramentas nas quais há uma
filosofia de design, gramática e estruturas de dados em comum
para serem utilizados em conjunto. Esse universo é chamado de
tidyverse
, um metapacote projetado com a finalidade de
apoiar as análises na área de ciência de dados.
Neste curso iremos utilizar o tidyverse
para criação de
rotina de limpeza, organização e transformação dos seus dados de
vigilância em saúde. Para isto, o profissional de vigilância deve saber
que ao carregar o pacote tidyverse
, ele carregará
simultaneamente oito pacotes do R
. São eles:
Nesta parte do módulo, iremos avaliar se o pacote
tidyverse
se encontra instalado. Caso não esteja, faremos a
sua instalação. Rode o código abaixo e analise as mensagens que serão
retornadas em sua tela:
if(!require(tidyverse)) install.packages("tidyverse");library(tidyverse)
#> Carregando pacotes exigidos: tidyverse
#> ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
#> ✔ ggplot2 3.3.6 ✔ purrr 0.3.4
#> ✔ tibble 3.1.8 ✔ dplyr 1.0.9
#> ✔ tidyr 1.2.0 ✔ forcats 0.5.2
#> ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
#> ✖ lubridate::as.difftime() masks base::as.difftime()
#> ✖ lubridate::date() masks base::date()
#> ✖ dplyr::filter() masks stats::filter()
#> ✖ lubridate::intersect() masks base::intersect()
#> ✖ dplyr::lag() masks stats::lag()
#> ✖ lubridate::setdiff() masks base::setdiff()
#> ✖ lubridate::union() masks base::union()
Perceba que os pacotes são carregados em conjunto. Porém, há o
retorno na tela de conflitos que ocorrem com funções que têm o mesmo
nome em outro pacote já carregado no ambiente do R
.
Caso o pacote já esteja instalado, é possível carregar o
tidyverse
utilizando apenas o seguinte comando:
library(tidyverse)

Atenção
A mensagem que retornou informa que as funções de mesmo nome
carregadas previamente são substituídas por aquelas carregadas depois,
ou seja, caso necessite utilizar as funções filter()
do
pacote stats
deverá identificá-la como
stats::filter()
. Isso pode ser um incômodo quando há muitos
pacotes carregados.