Curso Introdução à análise de dados em vigilância em saúde - curso básico

4. Preparando as variáveis para análise de dados de vigilância

Com o R poderemos construir as tabelas personalizadas para nossas análises. Nesta seção você irá conhecer algumas maneiras de selecionar e transformas variáveis de interesse para vigilância em saúde.

4.1 Excluindo colunas na tabela

Quase sempre o profissional de vigilância necessita excluir colunas e reorganizar a sua ordem na tabela, e você já aprendeu neste curso que podemos selecionar colunas no R utilizando a função select(). Agora, utilizaremos esta função para excluir colunas.

Esta etapa é importante, pois permitirá excluir dados que não serão utilizados em nossa análise, tornando nossa tabela menor e mais “leve”, reduzindo o tempo gasto para seu processamento com R.

Para isso, a função select() deverá receber a inclusão do operador lógico subtração (“-”). A subtração deverá ser acrescentada antes do nome da coluna a ser excluída.

Para praticarmos excluiremos a variável de data de nascimento (DT_NASC) da tabela {base_menor} criada anteriormente. Acompanhe o passo a passo para excluirmos a variável DT_NASC do data.frame {base_menor} e replique-o em seu RStudio:

base_menor |>
  
  # Excluindo a variável "DT_NASC" da tabela {`base_menor`}
  select(-DT_NASC) |>
  
  # Utilizando a função `head()` para visualizar as primeiras linhas da tabela 
  # após a exclusão
  head()

#>   DT_NOTIFIC CS_SEXO CS_RACA ID_MN_RESI ID_AGRAVO
#> 1 2012-04-11       M       4     610213      A509
#> 2 2010-09-17       M       1     610213       W64
#> 3 2010-10-19       M      NA     610250       X58
#> 4 2008-04-14       F       4     610213       A90
#> 5 2011-06-20       M       4     610250       B19
#> 6 2008-02-12       F       9     610213       A90

Observe em seu output que o resultado da execução possui uma tabela com todas as colunas presentes em {base_menor}, exceto a variável DT_NASC. Fácil, não é mesmo?!

Atenção

Lembre-se de conferir todos os símbolos, palavras e pontos do seu código! O R retorna erros quando seu código está escrito de forma incorreta.

4.2 Inserindo novas colunas à tabela

Outra ação corriqueira quando analisamos dados de vigilância é adicionarmos colunas ao nosso banco de dados, seja com o resultado de algum cálculo, com informações de confirmação de um caso suspeito, ou ainda uma coluna com o status de uma investigação de surto. Para criar uma variável no R utilizamos a função mutate(). Seguiremos, portanto, o seguinte passo a passo:

definir o nome da coluna;
utilizar o sinal de igual (=) e;
escrever os comandos para incluir os valores que preencherão a nova coluna.

Lembre-se que estamos analisando a situação das notificações de casos no Estado de Rosas. Esta etapa apoiará nossa avaliação de sensibilidade do sistema de vigilância em saúde, pois criaremos uma nova variável que armazena valores com o tempo (em dias) que está levando para que uma notificação seja digitada no Sinan Net, ou seja, o tempo em dias de atraso da digitação das notificações do Estado de Rosas.

Para isso, criaremos a variável que daremos o nome de TEMPO_DIGITA, que será a diferença em dias entre a coluna com valores da data de digitação (DT_DIGITA) e a coluna data de notificação (DT_NOTIFIC). Como padrão, o R adicionará a nova variável criada ao final da tabela (última coluna).

Primeiro criamos um objeto que será chamado {base_menor_2}. Ele receberá as colunas selecionadas e seus respectivos registros da tabela {base} (criada anteriormente a partir do arquivo {NINDINET.dbf}). Observe o script abaixo e execute os comandos em seu RStudio:

# Criando a {`base_menor_2`}
base_menor_2 <- base |>
  
  # Selecionando as variáveis que queremos utilizar com a função `select()`
  select(NU_NOTIFIC, ID_AGRAVO, DT_NOTIFIC, DT_DIGITA) |>
  
  # Utilizando a função `mutate()` para criar a nova coluna
  mutate(TEMPO_DIGITA = DT_DIGITA - DT_NOTIFIC)

Agora, digite os códigos abaixo em seu script e pressione Run para visualizar como ficou sua nova variável criada:

# Utilizando a função `head()` para visualizar as primeiras linhas do novo objeto
base_menor_2 |> head()

#>   NU_NOTIFIC ID_AGRAVO DT_NOTIFIC  DT_DIGITA TEMPO_DIGITA
#> 1    7671320      A509 2012-04-11 2012-11-09     212 days
#> 2    0855803       W64 2010-09-17 2010-11-17      61 days
#> 3    8454645       X58 2010-10-19 2011-03-14     146 days
#> 4    3282723       A90 2008-04-14 2008-04-24      10 days
#> 5    9799526       B19 2011-06-20 2011-09-14      86 days
#> 6    7275624       A90 2008-02-12 2008-02-26      14 days

Veja que esta nova tabela possui a coluna TEMPO_DIGITA no final, e suas linhas são a diferença da data - em dias - de digitação e de notificação. Após o número de dias, você verá a informação days, indicando que esta variável se trata de uma variável de tempo (classe = difftime).

Para fazer cálculos matemáticos e novas análises, precisaremos padronizar o tipo de dado contido na variável TEMPO_DIGITA e, aqui, optaremos pelo tipo numérico (numeric, em inglês). Neste caso, é possível alterar o tipo de dado da variável atribuindo-lhe o mesmo nome. Observe os script abaixo e replique-o em seu computador:

base_menor_2 |>
  
  # Transformando a coluna "TEMPO_DIGITA" da tabela {`base_menor_2`} 
  # no tipo numérico com a função `as.numeric()` dentro da função `mutate()`
  mutate(TEMPO_DIGITA = as.numeric(TEMPO_DIGITA)) |>
  
  # Utilizando a função `head()` para visualizar as primeiras linhas
  head()

#>   NU_NOTIFIC ID_AGRAVO DT_NOTIFIC  DT_DIGITA TEMPO_DIGITA
#> 1    7671320      A509 2012-04-11 2012-11-09          212
#> 2    0855803       W64 2010-09-17 2010-11-17           61
#> 3    8454645       X58 2010-10-19 2011-03-14          146
#> 4    3282723       A90 2008-04-14 2008-04-24           10
#> 5    9799526       B19 2011-06-20 2011-09-14           86
#> 6    7275624       A90 2008-02-12 2008-02-26           14

Visualize seu output e perceba que a coluna TEMPO_DIGITA é composta agora apenas por números (numeric), e não mais uma medida de tempo (difftime), nos apoiando a compreender o tempo que está levando para que as notificações de agravos do município de Rosas sejam digitadas no Sinan Net, em dias.

4.3 Limpando caracteres e padronizando colunas

Em análise de dados, algumas vezes não é possível reconhecer de imediato o formato de colunas ou mesmo se torna complicado utilizar caracteres como acentos, espaço entre as palavras, símbolos e outros, até mesmo nas funções de código.

Para resolver estes problemas, quase sempre necessitamos padronizar o nome das colunas do nosso banco de dado, limpando seus nomes e formatando-os para que haja uma fácil manipulação dos dados.

Para executarmos estas ações com o R, utilizamos o pacote janitor e sua função clean_names(). Esta função tornará todas as variáveis minúsculas e retirará os caracteres como acentos e os espaços entre as palavras, quando houver.

Para esta etapa, utilizaremos o banco de dados do tipo .csv que contêm os códigos do CID-10 exportados diretamente do site do Datasus: o {CID-10-CATEGORIAS.csv}. Este arquivo é muito utilizado para agrupar categorias de doenças, possibilitando a recategorização de CIDs em todos os bancos de dados do Datasus. Você o encontrará disponível no menu lateral “Arquivos”, no Ambiente Virtual do curso. Acompanhe o passo a passo abaixo e replique-o em seu RStudio:

Primeiro, importe o arquivo {CID-10-CATEGORIAS.csv}, armazenando-o no objeto do tipo data.frame {cid10_categorias}. Replique o script abaixo para importá-lo para o seu R:

# Importando o banco de dados { `CID-10-CATEGORIAS.CSV } para o `R`
cid10_categorias <- read_csv2('Dados/CID-10-CATEGORIAS.CSV')

Acrescente ao script a função colnames() para inspecionar o nome das colunas com o seguinte código:

# Inserindo a função `colnames()` para checar as variáveis 
colnames(cid10_categorias)

#> [1] "CAT"        "CLASSIF"    "DESCRICAO"  "DESCRABREV" "REFER"     
#> [6] "EXCLUIDOS"

Observe o output em seu console. Você visualizará o vetor contendo os nomes de todas as colunas de sua tabela cid10_categorias.

Agora utilize a função clean_names() do pacote janitor ao rodar o seguinte código:

# Utilizando a função `clean_names()` para editar o nome das variáveis
cid10_categorias_nova <- clean_names(cid10_categorias)

# Visualizando as variáveis após a transformação
colnames(cid10_categorias_nova)

#> [1] "cat"        "classif"    "descricao"  "descrabrev" "refer"     
#> [6] "excluidos"

Perceba que os nomes das variáveis estão totalmente em minúsculo, sem acentos e sem espaço entre as palavras.

Observe de forma detalhada a comparação dos nomes das colunas antes e após a transformação que realizamos com a função clean_names().

Figura 2: Tabela comparativa da transformação das variáveis com a função clean_names().

Atenção

Você deverá repetir este processo muitas vezes durante sua análise de dados. Esta etapa é fundamental para todos os próximos passos que daremos neste curso.

Ela nos permitirá ter segurança e não errar o nome das variáveis ao ter que digitá-los novamente para realizar filtros, seleções ou edições.

4.4 Filtrando colunas

Muito bem, já vimos como excluir colunas, transformá-las e renomeá-las para facilitar a análise dos dados. Agora, você irá aprender a filtrar os registros de uma tabela para obter as informações precisas para sua análise.

Para isso, utilizaremos a função filter() que permitirá filtrar os valores (linhas) da variável selecionada a partir de um ou mais critérios necessários. Para realizar esses filtros precisamos acrescentar os operadores lógicos indicando as ações de filtragem. Veja na lista abaixo quais são os principais operadores e seus usos:

Vamos praticar! Utilizaremos o data.frame {base_menor_2}, criada anteriormente a partir da tabela {base}, para filtrar todos os registros que contenham o código da CID-10 referente à hepatite viral não especificada (B19) e que o tempo de digitação foi maior que sete dias. Execute o script abaixo em seu RStudio:

base_menor_2 |>
  
  # Filtrando os CIDs igual a B19, da coluna "ID_AGRAVO"
  # com tempo de digitação maior que sete dias
  filter(ID_AGRAVO == "B19", TEMPO_DIGITA > 7) |>
  
  # Utilizando a função `head()` para visualizar as primeiras linhas da tabela
  head()

#>    NU_NOTIFIC ID_AGRAVO DT_NOTIFIC  DT_DIGITA TEMPO_DIGITA
#> 5     9799526       B19 2011-06-20 2011-09-14      86 days
#> 34    4218628       B19 2009-07-10 2010-05-11     305 days
#> 51    9943142       B19 2010-08-03 2010-09-24      52 days
#> 76    1856028       B19 2009-06-22 2009-07-09      17 days
#> 85    0025650       B19 2011-01-31 2011-07-25     175 days
#> 91    0733923       B19 2007-01-25 2007-03-28      62 days

Veja que, por padrão, quando se utiliza a vírgula para separar os diversos filtros que vamos utilizar filter(ID_AGRAVO == "B19", TEMPO_DIGITA > 7), a função filter() realiza a ação considerando o primeiro critério E o segundo e assim sucessivamente.

Caso exista necessidade de que o filtro seja um critério do tipo OU, você necessitará utilizar o operador barra horizontal (|). Observe no exemplo abaixo que o filtro está selecionando registros de notificação de hepatite (CID B19) OU de leptospirose (CID A279) OU malária (CID B54):

base_menor_2 |>
  
  # Filtrando os registros iguais a B19 OU A279 OU B54 na coluna "ID_AGRAVO"
  filter(ID_AGRAVO == "B19" | ID_AGRAVO == "A279" | ID_AGRAVO == "B54") |>
  
  # Utilizando a função `head()` para visualizar as primeiras 20 linhas da tabela
  head(20)

#>     NU_NOTIFIC ID_AGRAVO DT_NOTIFIC  DT_DIGITA TEMPO_DIGITA
#> 5      9799526       B19 2011-06-20 2011-09-14      86 days
#> 34     4218628       B19 2009-07-10 2010-05-11     305 days
#> 51     9943142       B19 2010-08-03 2010-09-24      52 days
#> 76     1856028       B19 2009-06-22 2009-07-09      17 days
#> 85     0025650       B19 2011-01-31 2011-07-25     175 days
#> 91     0733923       B19 2007-01-25 2007-03-28      62 days
#> 106    8181226       B19 2009-07-06 2009-07-23      17 days
#> 112    5619327      A279 2009-12-30 2010-01-21      22 days
#> 128    4231128       B19 2009-08-04 2010-05-04     273 days
#> 157    6644624       B19 2007-01-17 2007-04-12      85 days
#> 160    4232928       B19 2009-09-29 2009-11-23      55 days
#> 169    4360123       B19 2012-12-27 2013-01-28      32 days
#> 172    1821124       B54 2008-08-11 2008-08-29      18 days
#> 175    1449327       B19 2010-05-13 2010-10-25     165 days
#> 190    1448227       B19 2009-08-05 2010-09-21     412 days
#> 198    1250223       B19 2007-02-15 2007-06-05     110 days
#> 212    8469526       B19 2008-01-18 2008-07-03     167 days
#> 220    9777227       B19 2009-04-22 2009-05-21      29 days
#> 231    9941142       B19 2010-08-03 2010-09-21      49 days
#> 242    2338425       B19 2008-01-14 2008-08-11     210 days

Também é possível utilizar o operador (%in%) nesta situação, quando a mesma variável (ID_AGRAVO) pode conter vários valores passíveis de seleção (filtros). Nesta situação, portanto, selecionamos os agravos dentro do conjunto dado pela função c().

Acompanhe o script abaixo e replique-o:

base_menor_2 |>
  
  # Filtrando os agravos utilizando o operador `%in%`
  filter(ID_AGRAVO %in% c("B19", "A279", "B54")) |>
  
  # Utilizando a função `head()` para visualizar as primeiras 20 linhas da tabela
  head(20)

#>     NU_NOTIFIC ID_AGRAVO DT_NOTIFIC  DT_DIGITA TEMPO_DIGITA
#> 5      9799526       B19 2011-06-20 2011-09-14      86 days
#> 34     4218628       B19 2009-07-10 2010-05-11     305 days
#> 51     9943142       B19 2010-08-03 2010-09-24      52 days
#> 76     1856028       B19 2009-06-22 2009-07-09      17 days
#> 85     0025650       B19 2011-01-31 2011-07-25     175 days
#> 91     0733923       B19 2007-01-25 2007-03-28      62 days
#> 106    8181226       B19 2009-07-06 2009-07-23      17 days
#> 112    5619327      A279 2009-12-30 2010-01-21      22 days
#> 128    4231128       B19 2009-08-04 2010-05-04     273 days
#> 157    6644624       B19 2007-01-17 2007-04-12      85 days
#> 160    4232928       B19 2009-09-29 2009-11-23      55 days
#> 169    4360123       B19 2012-12-27 2013-01-28      32 days
#> 172    1821124       B54 2008-08-11 2008-08-29      18 days
#> 175    1449327       B19 2010-05-13 2010-10-25     165 days
#> 190    1448227       B19 2009-08-05 2010-09-21     412 days
#> 198    1250223       B19 2007-02-15 2007-06-05     110 days
#> 212    8469526       B19 2008-01-18 2008-07-03     167 days
#> 220    9777227       B19 2009-04-22 2009-05-21      29 days
#> 231    9941142       B19 2010-08-03 2010-09-21      49 days
#> 242    2338425       B19 2008-01-14 2008-08-11     210 days

Pronto, você armazenou na tabela ou data.frame {base_menor_2} apenas os registros que contenham notificações de hepatites virais (CID B19), leptospirose (CID A279) e malária (CID B54).

A qualquer momento em que desejar obter uma tabela com dados que contenham todas as notificações do Estado de Rosas você deverá utilizar o objeto {base} criado no início deste módulo.

Lembre-se que o objeto {base} é do tipo data.frame e armazenou os dados importados do banco de dados {NINDINET.dbf}, disponibilizado no Ambiente Virtual do curso.

4.5 Unindo colunas

Ainda na etapa de limpeza e organização de dados, frequentemente o profissional de vigilância precisa agrupar registros para suas análises. A variável idade é uma das variáveis epidemiológicas mais utilizadas, por exemplo, para divisão de grupos por faixa etária em quase todas as análises demográficas.

Na linguagem R, a função group_by() é o verbo que utilizaremos para agrupamento dos registros de acordo com a coluna especificada, sendo a variável o principal argumento da função. Aqui, destacamos que é muito frequente seu uso com outras funções junto ao banco de dados.

Perceba que na expressão abaixo realizamos comandos de agrupamento (group_by) de todos os casos confirmados ou suspeitos notificados pela mesma doença ou agravo (ID_AGRAVO). Em seguida realizamos um comando para contar (usando a função count()) quantos casos foram registrados com a mesma doença ou agravo. Permaneceremos utilizando a tabela {base_menor_2} criada anteriormente. Rode o código a seguir em seu computador e verifique o resultado:

base_menor_2 |>
  
  # Agrupando as notificações pelos agravos
  group_by(ID_AGRAVO) |>
  
  # Contando a frequência de notificações por agravos
  count(ID_AGRAVO)

#> # A tibble: 63 × 2
#> # Groups:   ID_AGRAVO [63]
#>    ID_AGRAVO     n
#>    <chr>     <int>
#>  1 A010          2
#>  2 A051          2
#>  3 A059          2
#>  4 A09           4
#>  5 A169       2347
#>  6 A279         49
#>  7 A309        266
#>  8 A35           4
#>  9 A379         26
#> 10 A509        329
#> # … with 53 more rows

O código digitado foi executado e retornou um objeto do tipo tibble e mostra três colunas: a primeira é uma coluna índice que marca o número da linha, não sendo uma variável do banco em si; a segunda é a ID_AGRAVO com todos os CID10 notificados (variável do tipo character, <chr>); e a n tem o número total de vezes que este agravo foi notificado (variável do tipo numérica, <int>).

Perceba também, que ao final do código, há as mensagens:

#> # … with 53 more rows
#> # ℹ Use print(n = …) to see more rows

Esses avisos aparecem porque o R retorna por padrão apenas 10 linhas da tabela para visualização. Caso queira que ele retorne mais linhas você deverá inserir o valor de linhas valor que deseja visualizar na função print() dentro de seu argumento n =. Observe o script abaixo como fazemos e reproduza em seu RStudio:

base_menor_2 |>
  
  # Agrupando as notificações pelos agravos
  group_by(ID_AGRAVO) |>
  
  # Contando a frequência de notificações por agravos
  count(ID_AGRAVO) |>
  
  # Visualizando as 20 primeiras linhas da tabela 
  # {`base_menor_2`} 
  # usando a função `print()`
  print (n = 20)

#> # A tibble: 63 × 2
#> # Groups:   ID_AGRAVO [63]
#>    ID_AGRAVO     n
#>    <chr>     <int>
#>  1 A010          2
#>  2 A051          2
#>  3 A059          2
#>  4 A09           4
#>  5 A169       2347
#>  6 A279         49
#>  7 A309        266
#>  8 A35           4
#>  9 A379         26
#> 10 A509        329
#> 11 A510          1
#> 12 A513          3
#> 13 A53         121
#> 14 A530          1
#> 15 A539        234
#> 16 A60          32
#> 17 A63           7
#> 18 A630         76
#> 19 A64           5
#> 20 A779         12
#> # … with 43 more rows

Agora já conseguimos saber que a leptospirose (CID10 = A279) aparece notificada por 49 vezes nesta tabela. Esse pequeno comando é mais simples, seguro e rápido que contar no Excel ou gerar uma tabela dinâmica.

Assim, todas as vezes em que for necessário realizar a contagem das frequências de uma variável epidemiológica, o profissional de vigilância poderá utilizar o verbo group_by() para fazê-lo em segundos.

4.6 Resumindo os valores de uma coluna

Outro aspecto importante do trabalho da vigilância é a capacidade de extrair dados e resumi-los. Assim, nesta etapa você irá aprender a função summarise(), similar à função mutate() utilizada anteriormente. A principal diferença entre as duas funções é a possibilidade de criação de novas colunas realizando operações de síntese e resumo, conjuntamente. Assim, a função summarise() possibilita o resumo de muitos valores em uma única linha.

Para praticar o uso do summarise() calcularemos a média do tempo de atraso (em dias) em que as equipes de vigilância do Estado de Rosas têm digitado suas notificações seguindo os seguintes passos:

utilizaremos como banco de dados a tabela {base_menor_2} criada a partir da tabela {`base},
em seguida, utilizaremos a função group_by() para contabilizar o número de casos por agravos ou doenças notificados, utilizando a função de contagem n() da variável TEMPO_DIGITA, criada anteriormente, e
por fim, utilizaremos a função mean(), a qual já vimos que calcula a média de uma coluna.

Agora observe o script abaixo e replique-o em seu RStudio:

base_menor_2 |>
  
  # Agrupando as notificações pelos agravos
  group_by(ID_AGRAVO) |>
  
  # Utilizando a função `summarise()` para criar novas colunas de síntese
  summarise(
    
    # Criando uma coluna de total, utilizando a função `n()`
    total_agravos =  n(),
    
    # Criando uma coluna de média, utilizando a função `mean()`
    media_digita = mean(TEMPO_DIGITA)
    )

#> # A tibble: 63 × 3
#>    ID_AGRAVO total_agravos media_digita  
#>    <chr>             <int> <drtn>        
#>  1 A010                  2 122.00000 days
#>  2 A051                  2  10.50000 days
#>  3 A059                  2  27.00000 days
#>  4 A09                   4 193.50000 days
#>  5 A169               2347 151.67490 days
#>  6 A279                 49  78.55102 days
#>  7 A309                266 165.64286 days
#>  8 A35                   4  70.75000 days
#>  9 A379                 26  36.03846 days
#> 10 A509                329 130.58055 days
#> # … with 53 more rows

O comando executado retornou quatro colunas:

a primeira a coluna é a índice, que mostra o número da linha;
a segunda é a ID_AGRAVO com todos os CID10 notificados (variável do tipo texto, <chr>);
a coluna total_agravos corresponde ao número total de vezes que este agravo foi notificado (variável do tipo inteiro, <int>) e;
por fim a variável que criamos media_digita (variável do tipo data, <drtn>).

Assim, com esta nova tabela conseguimos concluir que leptospirose (CID10 = A279) aparece notificada por 49 vezes e o tempo médio de digitação no sistema foi 78,55102 dias.

4.7 Modificando a ordem das colunas

No dia a dia é comum precisarmos modificar a ordem de apresentação dos valores de uma coluna como por exemplo ordenar idades do mais velhos para os mais novos, ou mesmo ordenar uma coluna por ordem alfabética, como de A-Z ou de Z-A. Para esta reordenação de valores em uma variável no R utilizamos a função arrange().

Para executar esta função, precisamos apenas das colunas que queremos ordenar como argumento. Por padrão, essa função ordena do menor valor para o maior (ordem crescente). Caso exista a necessidade de ordenar uma coluna de forma decrescente, devemos também utilizar a função desc(), como no exemplo abaixo: arrange(desc(media_digita)).

Vejamos o mesmo exemplo anterior, mas agora adicionando o comando de ordenação decrescente para variável media_digita, apontando, assim, o agravo ou doença que leva o maior tempo para ser digitado no Estado de Rosas. Utilize os seguintes comandos:

base_menor_2 |>
  
  # Agrupando as notificações pelos agravos
  group_by(ID_AGRAVO) |>
  
  # Utilizando a função `summarise()` para criar novas colunas de síntese
  summarise(total_agravos =  n(),
            media_digita = mean(TEMPO_DIGITA)) |>
  
  # Ordenando a tabela pela ordem decrescente da média de tempo de digitação
  arrange(desc(media_digita))

#> # A tibble: 63 × 3
#>    ID_AGRAVO total_agravos media_digita 
#>    <chr>             <int> <drtn>       
#>  1 F99                   3 666.6667 days
#>  2 C80                   1 560.0000 days
#>  3 Z206                 23 374.9130 days
#>  4 H833                 11 331.6364 days
#>  5 N485                  5 304.6000 days
#>  6 Z209                500 293.6880 days
#>  7 B09                 109 283.8807 days
#>  8 B42                 150 269.0333 days
#>  9 A630                 76 263.8289 days
#> 10 R36                  77 261.9740 days
#> # … with 53 more rows

Como resultado você verá quatro colunas. A primeira com o índice com o número da linha, a segunda com a identificação do código do agravo, a terceira com o total de casos e a última com a média do tempo de digitação para cada agravo.

Veja que como as colunas estão ordenadas em ordem decrescente, com o retorno do comando é possível visualizar o maior valor primeiro (666,6667 dias), que se refere ao agravo relacionado ao trabalho, e os valores com a menor média de digitação aparecem ao final da coluna.