Módulo 2 - Conceitos Fundamentais

Processo estocástico

Quando falamos em séries temporais no contexto da vigilância em saúde, estamos lidando com dados que mudam ao longo do tempo, como o número de casos de uma doença ou a temperatura. Esses dados são influenciados por diversos fatores, muitos dos quais são imprevisíveis ou incertos. Para lidar com essa incerteza, usamos um conceito da estatística chamado processo estocástico.

Um processo estocástico pode ser entendido como um sistema que evolui ao longo do tempo de acordo com leis probabilísticas. Por exemplo, imagine que você está observando a variação de um fenômeno, como o número de casos de dengue, ao longo dos meses. Cada vez que você mede esse número, é como se estivesse tirando uma foto de uma realidade que pode mudar a cada instante. Essa variação pode ser influenciada por inúmeros fatores, como clima, ações de controle e até eventos inesperados e não podemos prever com grande exatidão o que vai acontecer a cada dia. Por isso, dizemos que essa variação no número de casos segue um “processo estocástico”, pois depende de elementos aleatórios, ou seja, que não conseguimos controlar totalmente.

Podemos pensar em um processo estocástico de duas formas:

  • Várias possíveis evoluções do mesmo fenômeno. Por exemplo, dependendo das condições, o número de casos de uma doença pode seguir diferentes trajetórias ao longo do tempo;
  • Cada ponto no tempo representa um valor que poderia ter sido diferente, de acordo com certas probabilidades. Assim, o valor que observamos hoje é apenas uma das muitas possibilidades que poderiam ter acontecido.

Quando analisamos uma série temporal, estamos observando uma dessas possíveis trajetórias, que chamamos de “realização” de um processo estocástico.

Para ajudar a entender esse conceito, em vez de olhar apenas uma série temporal de casos de dengue, podemos simular várias possíveis trajetórias que poderiam ocorrer, cada uma representando uma evolução diferente (Figura 6). Isso é importante, pois como citamos anteriormente, existem muitas incertezas que podem influenciar a evolução de uma doença. Essas simulações nos ajudam a entender as diferentes formas que uma epidemia pode seguir e nos permitem nos preparar para diferentes cenários.

Figura 6: Simulação de múltiplas trajetórias: Casos diários de uma doença.

Figura 6: Simulação de múltiplas trajetórias: Casos diários de uma doença.


Com essas simulações, podemos mostrar que, em um cenário real de vigilância, mesmo que o número de casos varie de forma imprevisível no dia a dia, conseguimos criar cenários possíveis. Essas múltiplas trajetórias ajudam as equipes de saúde pública a se prepararem para diferentes cenários futuros, como um aumento rápido de casos, uma estabilização ou uma queda mais lenta.

Na sequência, continuaremos conhecendo conceitos da estrutura das séries temporais. Vamos lá?


Notação e nomenclatura

As séries temporais podem ser matematicamente representadas por funções do tipo:

Zt=f(tempo,a)

na qual:

  • Zt é definido, por convenção, como o valor da variável observável Z no tempo t, e
  • a é a componente aleatória.


Estacionariedade

Como mencionado anteriormente, as técnicas estatísticas ajudam a interpretar a incerteza nas análises de séries temporais. Um ponto importante é que a maioria dessas técnicas supõe que a série temporal analisada possui características estáveis ao longo do tempo. Essas são as principais características de uma série estacionária. Uma série temporal é considerada estacionária quando seus valores flutuam aleatoriamente ao redor de uma média constante, e a variação em torno dessa média (variância) também permanece constante ao longo do tempo. Isso reflete um comportamento equilibrado e estável da série.

Na prática, muitas séries temporais que encontramos apresentam algum tipo de não estacionariedade, como, por exemplo, uma tendência crescente ou decrescente ao longo do tempo. A não estacionariedade pode inviabilizar a aplicação de técnicas estatísticas, exigindo que transformemos os dados para estabilizar a média e a variância.

Na Figura 7A, vemos o número de casos de tuberculose ao longo dos anos, de 2007 a 2011, no Município Rio de Janeiro. A série temporal flutua ao redor de uma média constante, com variações, mas sem um padrão claro de tendência crescente ou decrescente a longo prazo. Ao contrário da série de tuberculose, observamos os casos de sífilis congênita no Brasil, de 2007 a 2022 na Figura 7B. Esta série apresenta um padrão de crescimento ao longo do tempo, com um aumento contínuo nos números de casos ano a ano.

Figura 7: Exemplo de série estacionária (A) e série não estacionária (B).

Figura 7: Exemplo de série estacionária (A) e série não estacionária (B).


O modelo mais simples de uma série temporal estacionária pode ser descrito da seguinte forma:

Zt=μ+at

na qual:

  • μ é a média do processo temporal, que é constante ao longo do tempo,
  • at é o componente aleatório, chamado de ruído branco em análises de séries temporais, que representa as flutuações imprevisíveis em torno da média.

Podemos, portanto, denominar de ruído branco uma sequência de variáveis aleatórias independentes e identicamente distribuídas, com média zero e variância constante, sendo essencial para modelar a incerteza presente em qualquer série temporal estacionária.

A estacionariedade de uma série temporal pode ser classificada em dois tipos:

  • primeira ordem: A média é constante ao longo de todo o período analisado. Isso significa que os valores flutuam aleatoriamente em torno de uma média fixa, sem apresentar uma tendência de aumento ou diminuição.
  • segunda ordem: Além da média constante, a variância também permanece constante ao longo do tempo. Esse tipo de estacionariedade é mais rigoroso e garante que a série temporal não apenas oscile ao redor de uma média fixa, mas que a magnitude dessas oscilações (variância) e a relação entre valores em diferentes pontos no tempo (autocovariância) permaneçam estáveis.

Vimos que uma série temporal estacionária tem média e variância constantes ao longo do tempo, além de um componente aleatório representado pelo ruído branco. No entanto, em muitas análises estatísticas, assumimos que uma observação não influencia as observações subsequentes. Vamos entender esse pressuposto e ver mais alguns exemplos sobre no próximo capítulo.


Pressuposto de independência e dependência serial

Quando trabalhamos com modelos e técnicas estatísticas, como modelos lineares generalizados, é comum termos como pressuposto a independência dos dados. Isso significa que assumimos que uma determinada observação não influencia as observações seguintes. Ao analisar, por exemplo, a incidência de casos de câncer de colorretal em uma determinada população, não esperamos que o fato de um indivíduo ser diagnosticado com o câncer influencie um outro indivíduo não relacionado a ele. Ou até mesmo, não esperamos que o número de casos novos em um determinado mês dependa do número de casos nos meses anteriores. Ou seja, podemos dizer que esse determinado agravo não possui dependência serial.

Contudo, para outras doenças e agravos - especialmente agravos contagiosos - esperamos que essa dependência exista. Podemos citar o caso da covid-19: quando um indivíduo é diagnosticado com a doença, há uma alta probabilidade que outros indivíduos próximos dele possam se tornar novos casos também. Em termos de série temporal, podemos afirmar que o número de casos de covid-19 em uma determinada semana depende fortemente do número de casos da semana anterior e das semanas anteriores. Portanto, a série de covid-19 é uma série que possui dependência serial. Agora, vamos analisar graficamente esses dois exemplos: o caso de uma série com independência (câncer colorretal) e uma série com dependência serial (covid-19).

Figura 8: Dependência serial: comparação entre séries semanais de casos de câncer colorretal (A) e covid-19 (B) no Brasil. 2020-2023.

Figura 8: Dependência serial: comparação entre séries semanais de casos de câncer colorretal (A) e covid-19 (B) no Brasil. 2020-2023.


Vemos que na Figura 8A não parece haver uma dependência forte do número de novos casos de câncer em uma determinada semana em relação às anteriores. O inverso é observado para a covid-19 (Figura 8B): há uma dependência do número de casos entre as semanas, de forma com que vemos explosões eventuais no número de casos. Podemos dizer, portanto, que para a covid-19 há indícios de forte dependência serial. Vamos ver mais propriedades sobre esse fenômeno de dependência e como quantificá-la.


Tipos de dependência serial

Quando não há autocorrelação, ou seja, quando os valores da série temporal são independentes uns dos outros, dizemos que a série é independente. Por outro lado, quando há dependência, essa pode ser de dois tipos:

  • Memória curta: Quando os valores da série influenciam os valores mais imediatamente seguintes, e seu efeito desaparece rapidamente com o tempo. Podemos citar como exemplo as doenças muito contagiosas ou “explosivas”, como o sarampo, influenza ou covid-19. Para esses agravos, os números de casos em uma determinada semana, por exemplo, dependem fortemente do número de casos nas semanas anteriores, e não tanto do número de casos nos meses ou anos anteriores.

  • Memória longa: Nesse caso a dependência desaparece lentamente ao longo do tempo, ou seja, os valores do passado influenciam pontos muito adiante no tempo. Esse é o caso para doenças de grande latência, como a hanseníase.


Autocorrelação

Para entender como a dependência serial se comporta em uma série temporal, utilizamos a autocorrelação. A autocorrelação mede o grau de correlação entre os valores de uma série em diferentes momentos ao longo do tempo. Esses momentos são chamados de lags, também conhecidos como defasagens ou atrasos.

Por exemplo, um lag de uma semana significa que estamos comparando o número de casos desta semana com o número de casos da semana anterior (um atraso de uma semana). Um lag de duas semanas compara os casos desta semana com os casos de duas semanas atrás, e assim por diante.

Um exemplo prático é analisar a série de incidência de dengue no Município do Rio de Janeiro em 2023 e comparar a incidência de uma semana com a incidência da semana anterior ou de duas semanas anteriores, para verificar se há uma relação entre esses valores em diferentes períodos. Acompanhe a Figura 9.

Figura 9: Incidência de dengue por semana epidemiológica, Rio de Janeiro-RJ, 2023.

Figura 9: Incidência de dengue por semana epidemiológica, Rio de Janeiro-RJ, 2023.


Podemos perceber pela Figura 9 que há um deslocamento da série original representando o lag de uma semana na incidência de dengue no município do Rio de Janeiro em 2023. Para medir o valor da correlação da série original (linha preta) com a série defasada (linha cinza), podemos calcular o ρ. O ρ (rho) representa o coeficiente de autocorrelação em um determinado lag, indicando a força e a direção da relação entre os valores de uma série temporal em momentos diferentes no tempo.

No exemplo anterior, o valor da correlação é ρ1=0,9418. Chamamos esse valor de autocorrelação de primeira ordem. De forma similar, podemos expandir essa definição para autocorrelação de h-ésima ordem (ρh), onde calculamos a correlação da série com ela mesma defasada em h lags (Figura 10).

Figura 10: Comparação de séries temporais de incidência de dengue com diferentes lags e coeficientes de autocorrelação.

Figura 10: Comparação de séries temporais de incidência de dengue com diferentes lags e coeficientes de autocorrelação.


Função de autocorrelação (ACF)

Na Figura 10 temos que quando lag=1, a correlação entre a série original e sua desfasagem em uma semana possui um alto valor de correlação (ρ1 = 0,9418). Contudo, à medida que o lag aumenta, a correlação começa a enfraquecer. Assim, após um período de 4 semanas, a dependência serial dos casos de dengue é um pouco mais fraca, embora ainda presente (ρ4 = 0,6847).

Dessa forma, temos que ρ0 é sempre 1, pois a correlação da série com ela mesma, sem defasagem (lag 0), é uma correlação perfeita. E para os demais lags, ρh, temos que 1ρl1. Assim, temos que o valor de ρ pode variar entre -1 e 1:

  • ρ=1 significa que há uma correlação positiva perfeita. Se o valor de uma observação aumenta, a próxima (ou uma observação após um determinado lag) também aumenta na mesma proporção.
  • ρ=0 significa que não há correlação entre os valores. Isso indica que os valores em diferentes momentos são independentes.
  • ρ=1 significa que há uma correlação negativa perfeita. Se o valor de uma observação aumenta, a próxima observação diminui de forma proporcional.

Esse conjunto de correlações, ρh=ρ0,ρ1,ρ2,,ρt, que consiste das correlações da série com ela mesma defasada em 0, 1, 2 lags, é chamado de função de autocorrelação da série Zt.

Uma forma tradicional de observar a função de autocorrelação de uma série é por meio de um gráfico de correlograma. Nele podemos visualizar o valor da função de autocorrelação (ACF) da série (no eixo y) em cada lag (no eixo x). Observe na Figura 11.

Figura 11: Função de autocorrelação (ACF) para a série de incidência semanal de dengue no Rio de Janeiro-RJ, 2023.

Figura 11: Função de autocorrelação (ACF) para a série de incidência semanal de dengue no Rio de Janeiro-RJ, 2023.


Na Figura 11 observamos que o valor mais alto de autocorrelação ocorre no lag 0, onde a autocorrelação é 1, representando a correlação perfeita da série com ela mesma (sem defasagem). As barras seguintes mostram os valores de autocorrelação da série em diferentes lags: lag 1, lag 2, e assim sucessivamente, até o lag 48. A partir do lag 1, percebemos que o valor da autocorrelação começa a diminuir progressivamente e, por volta do lag 9, inverte seu sinal, indicando uma correlação negativa.

As linhas pontilhadas delimitam uma área de significância estatística. Valores de autocorrelação que ultrapassam essas linhas (para cima ou para baixo) indicam que a correlação para aquele lag é estatisticamente significativa, ou seja, é improvável que tenha ocorrido apenas por acaso. Em outras palavras, quando a autocorrelação ultrapassa essas linhas, isso sugere que há uma relação consistente e relevante entre os valores da série naquele lag específico. Valores dentro das linhas pontilhadas, por outro lado, indicam que a autocorrelação é pequena o suficiente para não ser considerada estatisticamente significativa.


Função de autocorrelação parcial (PACF)

A Função de Autocorrelação Parcial (PACF) também é uma forma de visualizar a autocorrelação da série entre seu lags. A diferença é que, ao comparar a série com ela mesma defasada em h lags, retira-se o efeito dos lags h1, h2, e assim por diante. Ou seja, a influência dos lags intermediários é removida, mostrando somente uma correlação “limpa”, apenas do lag de interesse.

Veja na Figura 12 a diferença ao observamos a PACF para a mesma série de incidência de dengue no município do Rio de Janeiro em 2023.

Figura 12: Função de autocorrelação parcial (PACF) para a série de incidência semanal de dengue no Rio de Janeiro-RJ, 2023.

Figura 12: Função de autocorrelação parcial (PACF) para a série de incidência semanal de dengue no Rio de Janeiro-RJ, 2023.


Para esse gráfico não é exposta a correlação no lag 0, somente a partir do lag 1. A autocorrelação no lag 1 é a mais forte, sugerindo uma alta dependência dos valores da série com os valores no período imediatamente anterior. As correlações já não decaem lentamente como acontecia no gráfico da ACF, justamente porque as influências intermediárias são removidas. Ao invés disso, vemos algumas “batidas” pontuais no sinal da correlação. Além do primeiro lag, vêem-se correlações ligeiramente relevantes no lag 4 e no lag 7, porém no sentido negativo.


Agora que já temos uma visão sobre série temporal e seus pressupostos, vamos entender os elementos que compõem uma série temporal. Vamos lá!


Componentes de uma série temporal

Já vimos diversos exemplos de uso de séries temporais no contexto da vigilância em saúde, seja na vigilância epidemiológica, no monitoramento de doenças, seja na vigilância ambiental, com monitoramento de variáveis climáticas. Independente da área da vigilância, para fazer uma análise eficaz é importante entender que uma série temporal é composta por diferentes componentes que nos ajudam a identificar padrões de comportamento, tendências de aumento ou queda, e variações sazonais.

Esses componentes são fundamentais para prever o comportamento futuro de uma doença, planejar ações de controle e monitorar surtos com mais precisão. A série temporal pode ser dividida em componentes sistemáticos e componentes não sistemáticos. A seguir, vamos explorar os principais componentes de uma série temporal que são relevantes para a vigilância em saúde.

Vamos, primeiro, iniciar com os componentes sistemáticos. Os componentes sistemáticos apontam movimentos regulares, ou seja, que apresentam um determinado padrão. Esses podem ser tendência, sazonalidade e ciclo. Vamos entender brevemente seus conceitos e visualizar exemplos de cada um.


Tendência

A tendência é o componente que indica a direção global dos dados ao longo do tempo. Seu uso em análises na vigilância pode indicar se o fenômeno que está sendo monitorado (uma doença, por exemplo) está aumentando, diminuindo, ou se mantém estável em períodos mais longos. Dessa forma, saber se os dados estão seguindo uma trajetória crescente, decrescente ou estável pode ser útil para entender se o fenômeno está se agravando, o que pode exigir ações públicas.

A seguir, veremos três exemplos de séries fictícias apenas para que você possa entender o padrão geral de uma tendência de crescimento, queda e ausência de tendência. Mas não se preocupe pois veremos mais à frente exemplos práticos no R, inclusive como decompor uma série e visualizar seus componentes separadamente. Agora, na Figura 13 temos um exemplo de uma série temporal com uma tendência de crescimento.

Figura 13: Exemplo de série temporal com tendência de crescimento.

Figura 13: Exemplo de série temporal com tendência de crescimento.


Vamos agora observar outro exemplo, de uma série que também possui tendência, mas cujo padrão é decrescente, com queda ao longo do tempo. Acompanhe na Figura 14:

Figura 14: Exemplo de série temporal com tendência de queda.

Figura 14: Exemplo de série temporal com tendência de queda.


Retomando o conceito de séries estacionárias que vimos anteriormente, uma característica importante dessas séries é a ausência de tendência. Em uma série estacionária, a média dos valores permanece estável ao longo do tempo, sem apresentar um movimento claro de aumento ou diminuição a longo prazo. Veja um exemplo na Figura 15.

Figura 15: Exemplo de série temporal estacionária, sem tendência.

Figura 15: Exemplo de série temporal estacionária, sem tendência.


Nesse caso a série é, portanto, formada apenas por algum ou alguns dos demais componentes que veremos a seguir.


Sazonalidade

Um outro componente de uma série temporal que se refere à repetição de padrões que ocorrem em intervalos regulares e com uma determinada frequência é a sazonalidade. Esses padrões podem estar relacionados ao calendário, como estações do ano, meses ou semanas, mas nem sempre têm a ver diretamente com o comportamento de doenças. Por exemplo, a temperatura geralmente apresenta um ciclo diário, com aumento ao longo do dia e queda após o entardecer.

No contexto de séries temporais, a sazonalidade representa esses ciclos regulares ao redor de uma tendência. Esse comportamento pode ou não estar ligado a eventos naturais ou ao calendário. No caso das doenças, como na Síndrome Respiratória Aguda Grave (SRAG), a sazonalidade pode ser observada em padrões repetidos de aumento de casos em meses mais frios, como os meses de inverno, seguidos por uma queda. Esse padrão é o que chamamos de sazonalidade em séries temporais.

Lembram-se da série que vimos anteriormente do número de casos mensais de SRAG no Paraná, de 2013 a 2017? Retomemos esse exemplo na Figura 16 para observarmos que essa série se comporta de maneira sazonal, com aumento de casos nos meses de inverno e diminuição nos meses subsequentes. Esse padrão se repete ano após ano.

Figura 16: Exemplo de sazonalidade: Casos de Síndrome Respiratória Aguda Grave (SRAG) por mês, Paraná, 2013-2017.

Figura 16: Exemplo de sazonalidade: Casos de Síndrome Respiratória Aguda Grave (SRAG) por mês, Paraná, 2013-2017.


Vejamos agora outro exemplo de sazonalidade. Como citamos antes, a temperatura é uma variável que possui padrões diários e que alternam entre as estações do ano. Veja na Figura 17 a temperatura média diária do Município do Rio de Janeiro entre os anos 2017 e 2022. Perceba que há picos nos meses de janeiro e fevereiro e quedas nos meses de julho e agosto.

Figura 17: Exemplo de sazonalidade: Temperatura média diária, Rio de Janeiro-RJ, 2017-2022.

Figura 17: Exemplo de sazonalidade: Temperatura média diária, Rio de Janeiro-RJ, 2017-2022.


Ciclo

Os ciclos também representam oscilações regulares em uma série temporal, mas se diferenciam da sazonalidade pela frequência e natureza da repetição. Enquanto a sazonalidade está frequentemente ligada a eventos com periodicidade mais previsível, como mudanças sazonais (verão, inverno), os ciclos tendem a ocorrer com menos frequência e não estão necessariamente vinculados ao calendário.

Na vigilância em saúde, os ciclos podem ser mais difíceis de serem observados, mas podem representar padrões mais amplos relacionados a eventos como surtos epidêmicos que acontecem em intervalos irregulares. Por exemplo, imagine que uma epidemia de uma determinada doença ocorra em um município a cada quatro anos (Figura 18). Isso seria um ciclo, com um padrão de aumento de casos a cada quatro anos. Mas também temos a sazonalidade anual da doença, que pode apresentar mais casos no inverno.

Assim, podemos observar dois padrões coexistindo: a sazonalidade anual e um ciclo de longo prazo que se repete, por exemplo, a cada quatro anos, resultando em um aumento significativo de casos nesses anos específicos.

Figura 18: Exemplo de ciclo de um comportamento de uma doença entre 2012 e 2021.

Figura 18: Exemplo de ciclo de um comportamento de uma doença entre 2012 e 2021.


Aleatoriedade ou ruído branco

Agora vamos abordar o componente não sistemático de uma série temporal. Enquanto os componentes sistemáticos, como tendência, sazonalidade e ciclo, representam padrões regulares que podem ser descritos e modelados, as séries temporais também contêm um componente aleatório, também conhecido como ruído branco.

Por exemplo, podemos observar que o número de casos de uma determinada doença tem uma tendência de aumento ao longo dos anos, e que há mais casos durante o inverno devido à sazonalidade. No entanto, mesmo sabendo disso, nunca podemos prever com exatidão quantos casos irão ocorrer em um mês ou semana específica. Isso ocorre porque existe sempre uma flutuação aleatória — fatores que não conseguimos explicar ou prever completamente. Esse componente aleatório é o ruído branco, uma variabilidade que não segue um padrão claro e que resulta de uma combinação de influências imprevisíveis ou impossíveis de serem mensuradas.

Dessa forma, descreve-se esse componente como aleatório ou ruído branco, ou seja, o que resta da série temporal quando removemos os componentes sistemáticos (a sua tendência e sua sazonalidade). Ele reflete as flutuações aleatórias que não podem ser atribuídas a um padrão conhecido.

Além disso, há séries temporais que podem ser compostas quase exclusivamente por ruído branco, quando não apresentam estruturas claras de tendência, ciclo ou sazonalidade. Essas séries são completamente imprevisíveis e não têm padrões sistemáticos que possamos identificar.

Veja outros exemplos típicos de eventos resultante dos efeitos de múltiplas causas que dificilmente conseguem ser previstos com exatidão:

  • Secas;
  • Enchentes;
  • Terremotos;
  • Crise política (guerras);
  • Conflitos socioeconômicos.


Decomposição de séries temporais

Agora que conhecemos os componentes de uma série temporal, podemos visualizar a série como uma combinação desses elementos. Em outras palavras, uma série temporal pode ser decomposta em diferentes partes: a tendência, a sazonalidade, os ciclos, e as variações aleatórias representadas pelo ruído branco (ou componente aleatório).

Cada série temporal pode ter ou não esses componentes, e em intensidades diferentes. Algumas séries apresentam uma tendência muito evidente, enquanto outras têm uma sazonalidade marcante, como um padrão repetido de aumento e queda em certos períodos do ano. No entanto, muitas séries temporais são compostas, em maior parte, pelo componente aleatório, ou seja, pelo ruído branco, que representa as variações imprevisíveis.

Entender a decomposição da série temporal nos ajuda a entender quais desses componentes estão mais presentes e como eles influenciam o comportamento da série ao longo do tempo. Vamos, novamente, analisar a série de casos mensais de SRAG no Paraná entre 2013 e 2017 (Figura 19). Mas agora veremos os componentes da série também.

Figura 19: Exemplo de decomposição de série temporal: Casos de Síndrome Respiratória Aguda Grave (SRAG) por mês, Paraná, 2013-2017.

Figura 19: Exemplo de decomposição de série temporal: Casos de Síndrome Respiratória Aguda Grave (SRAG) por mês, Paraná, 2013-2017.


A Figura 19 apresenta a série original e sua decomposição nos componentes de sazonalidade, tendência e ruído branco, conforme discutido anteriormente. Essa visualização é fundamental para entender como cada componente contribui para a dinâmica da série temporal.

À direita dos gráficos, vemos uma barra de escala, que serve como indicador da importância relativa de cada componente. Quando a barra de escala de um componente é semelhante à da série original, isso indica que esse componente é muito importante para a explicação da série. Por outro lado, se a barra de escala de um componente for muito maior, significa que os valores daquele componente são relativamente pequenos, ou seja, ele contribui menos para a variação total da série.

Nesse exemplo, podemos observar que tanto a sazonalidade quanto o ruído branco têm contribuições relevantes e similares para explicar a série de SRAG no Paraná. Em contraste, a tendência é um componente mais fraco, o que é visível pela menor influência na série. De fato, ao analisarmos a série original, o que se destaca é a presença clara da sazonalidade, sem um comportamento de tendência acentuado.


Composição de séries temporais: modelo aditivo e modelo multiplicativo

Até agora, vimos que uma série temporal é composta por diferentes componentes, como tendência, sazonalidade, ciclos e ruído branco. Esses componentes formam a base de qualquer série temporal e nos ajudam a entender o comportamento da variável ao longo do tempo. No entanto, a maneira como esses componentes se combinam para formar a série pode variar.

Existem duas formas principais de combinar esses componentes: de forma aditiva ou multiplicativa. A diferença entre esses dois tipos de modelos está na relação entre os componentes. Em um modelo aditivo, os componentes são somados para formar a série, enquanto em um modelo multiplicativo, os componentes interagem multiplicativamente, ou seja, o impacto de um componente depende diretamente dos outros.

A escolha entre um modelo aditivo ou multiplicativo depende do comportamento da série. A seguir vamos entender em mais detalhes essas duas abordagens.


Modelo Aditivo

No modelo aditivo, os termos são reunidos por meio de uma soma de seus termos. Dada uma série temporal Zt, temos:

Zt=Tt+St+αt

Onde:

  • Tt é o componente de tendência;
  • St a sazonalidade e;
  • αt o termo aleatório, ou ruído branco.

Dessa forma, a série é constituída por uma adição dos componentes. Geralmente é o caso quando a variação sazonal parece ser constante, não aumentando ou diminuindo sua amplitude ao longo do tempo. Veremos de forma mais clara em um exemplo abaixo (Figura 20).

Figura 20: Exemplo de série temporal aditiva.

Figura 20: Exemplo de série temporal aditiva.


Modelo Multiplicativo

Já no modelo multiplicativo, a série é derivada não de uma adição, mas de uma multiplicação de seus termos. Ou seja, para a série Zt agora temos:

Zt=TtStαt

Nessa composição, sugere-se que a sazonalidade da série varia juntamente com a tendência, tendo sua amplitude ampliada ou reduzida ao longo do tempo.

Figura 21: Exemplo de série temporal multiplicativa.

Figura 21: Exemplo de série temporal multiplicativa.


Ufa! Quantos conceitos, não é mesmo? No próximo módulo vamos, finalmente, utilizar o R para manipular alguns dados e praticar a análise de séries temporais. Usaremos dados reais, incluindo nos exemplos a forma de obtê-los.