2. Limpando e transformando os dados de vigilância

O sistema de vigilância no Brasil nos impõe desafios desde a coleta até o processamento dos dados nos diversos níveis da federação envolvidos. Para realizarmos a análise de situação de saúde para o Estado de Rosas iremos avaliar alguns aspectos da qualidade dos dados que serão analisados. Neste tópico o profissional de vigilância poderá avaliar consistência, completitude e validade dos dados que serão analisados.

É importante saber que para a realização dos cálculos, modelagem estatística e visualização de dados, o R oferece uma série de pacotes com um conjunto de funções que facilitam e otimizam estas tarefas, tornando-as muito mais fluidas e simplificadas. Atualmente, alguns pacotes integram uma série de ferramentas nas quais há uma filosofia de design, gramática e estruturas de dados em comum para serem utilizados em conjunto. Esse universo é chamado de tidyverse, um metapacote projetado com a finalidade de apoiar as análises na área de ciência de dados.

Neste curso iremos utilizar o tidyverse para criação de rotina de limpeza, organização e transformação dos seus dados de vigilância em saúde. Para isto, o profissional de vigilância deve saber que ao carregar o pacote tidyverse, ele carregará simultaneamente oito pacotes do R. São eles:



Nesta parte do módulo, iremos avaliar se o pacote tidyverse se encontra instalado. Caso não esteja, faremos a sua instalação. Rode o código abaixo e analise as mensagens que serão retornadas em sua tela:

if(!require(tidyverse)) install.packages("tidyverse");library(tidyverse)
#> Carregando pacotes exigidos: tidyverse
#> ── Attaching packages ─────────────────────────────────────── tidyverse 1.3.2 ──
#> ✔ ggplot2 3.3.6     ✔ purrr   0.3.4
#> ✔ tibble  3.1.8     ✔ dplyr   1.0.9
#> ✔ tidyr   1.2.0     ✔ forcats 0.5.2
#> ── Conflicts ────────────────────────────────────────── tidyverse_conflicts() ──
#> ✖ lubridate::as.difftime() masks base::as.difftime()
#> ✖ lubridate::date()        masks base::date()
#> ✖ dplyr::filter()          masks stats::filter()
#> ✖ lubridate::intersect()   masks base::intersect()
#> ✖ dplyr::lag()             masks stats::lag()
#> ✖ lubridate::setdiff()     masks base::setdiff()
#> ✖ lubridate::union()       masks base::union()

Perceba que os pacotes são carregados em conjunto. Porém, há o retorno na tela de conflitos que ocorrem com funções que têm o mesmo nome em outro pacote já carregado no ambiente do R.

Caso o pacote já esteja instalado, é possível carregar o tidyverse utilizando apenas o seguinte comando:

library(tidyverse)

Atenção

A mensagem que retornou informa que as funções de mesmo nome carregadas previamente são substituídas por aquelas carregadas depois, ou seja, caso necessite utilizar as funções filter() do pacote stats deverá identificá-la como stats::filter(). Isso pode ser um incômodo quando há muitos pacotes carregados.