Download PDF
ads:
ESTIMAC¸
˜
AO ROBUSTA EM PROCESSOS DE MEM
´
ORIA LONGA NA
PRESENC¸ A DE OUTLIERS ADITIVOS
FABIO ALEXANDER FAJARDO MOLINARES
Orientador: Prof. Francisco Cribari-Neto
Co-orientador: Prof. Vald´erio A. Reisen
´
Area de Concentra¸ao: Estat´ıstica Aplicada
Disserta¸ao submetida como requerimento parcial para obten¸ao do
grau de Mestre em Estat´ıstica pela Universidade Federal de Pernambuco
Recife, fevereiro de 2007
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Molinares, Fábio Alexander Fajardo
Estimação robusta em processos de memória longa na
presença de outliers aditivos / Fábio Alexander Fajardo
Molinares – Recife : O autor, 2007.
xi, 42 folhas: il., fig., tab.
Dissertação (mestrado) Universidade Federal de
Pernambuco. CCEN. Estatística, 2007.
Inclui bibliografia.
1.Estatística Matemática. 2. Memória longa 3. Outliers.
4. Robustez. Título.
519.5 CDD (22.ed.) MEI2007-008
ads:
c
Copyright by
FABIO ALEXANDER FAJARDO MOLINARES
2007
Todos os direitos reservados
Typeset by L
A
T
E
X
ADios.
A m is padres Carmen y Jorge, a mis hermanos Olga, Edgar, Marlon y Jorge.
iii
AGRADECIMENTOS
Ao professor Vald´erio Anselmo Reisen, pela amizade, confian¸ca, paciˆencia e magn´ıfica ori-
enta¸ao, assim como pelas intermin´aveis discuss˜oes que tornaram poss´ıvel o desenvolvimento
deste trabalho, contribuindo para o meu amadurecimento acadˆemico e profissional.
Ao professor Francisco Cribari-Neto, pelo est´ımulo, dedica¸ao e leitura cuidadosa deste tra-
balho.
AN´ataly, meu grande amor, por todos os momentos de alegria, pelo constante apoio e pelo
incentivo para que todas as metas tra¸cadas fossem alcan¸cadas.
AC´esar Fajardo, Zuleima, C´esar Felipe, John Sebastian, Clementina e Nieves Camacho,
pelo carinho e pelo constante apoio.
Aos meus amigos da Colˆombia, em especial a Camilo e Pacho, que sempre estiveram pre-
sentes nos momentos de alegria e tristeza, agrade¸co as intermin´aveis horas de papo e de
desconcentra¸ao que tornaram minha permanˆencia no Recife mais amena.
Aos professores e amigos Rafael E. Ahumada Barrios e Francisco J. Cepeda Coronado, peles
´otimos conselhos e pela orienta¸ao segura na minha vida acad´emica e profissional.
Aos professores do Departamento de Estat´ıstica da Universidad Nacional de Colombia,
muito especialmente ao professor Luis A. opez, pela amizade e pela contribuao `aforma¸ao
profissional, e ao professor Fabio H. Nieto, por ser sempre um exemplo para mim e pela sua
orienta¸ao que conduziu `a minha paix˜ao por s´eries temporais.
Aos professores do Departamento de Estat´ıstica da UFPE, especialmente ao professor Klaus
Vasconcellos pelo excelente curso de Inferˆencia Estat´ıstica, ao professor Francisco Cribari-
Neto pelo valioso material lecionado nas disciplinas de Estat´ıstica Computacional e Es-
tat´ıstica Aplicada, ao professor Andrei Toom pelo valioso ensino na ´area de Probabilidade
eM´etodos Matem´aticos.
iv
Aos meus amigos da colˆonia colombiana no Brasil, em especial a Barba, John, Patricia e
Ricardo.
Aos meus amigos do Brasil, em especial a Lia e L´ucia em Vit´oria, Gilvan e arcia em
Bras´ılia, Alexandre e Andrea em Recife, pela amizade, apoio emocional e momentos de
divers˜ao.
A todos do Departamento de Estat´ıstica da Universidade Federal do Esp´ırito Santo que
em ao pouco tempo se tornaram meus amigos, especialmente a Bartolomeu Zamprogno,
Alyne Neves, Jacqueline, Miriam, Geovane, Giovanni e Alessandro, pelo apoio e momentos
de divers˜ao.
Aos meus colegas do Mestrado em Estat´ıstica da Universidade Federal de Pernambuco,
pelas horas compartilhadas.
AVal´eria Bittercourt, pela presteza e amabilidade com que sempre me atendeu.
`
A CAPES (Coordena¸ao de Aperfei¸coamento de Pessoal de N´ıvel Superior), pelo apoio
financeiro.
v
RESUMO
O objetivo deste trabalho ´e propor uma metodologia para estimar os parˆametros que in-
dexam o processo ARFIMA(p, d, q) (Hosking 1981) na presen¸ca de outliers aditivos. Para
estimar de proposto um estimador robusto que ´e uma variante do popular estimador suge-
rido por Geweke & Porter-Hudak (1983) (GPH). A metodologia proposta faz uso da fuao
de autocovariˆancia amostral robusta, considerada por Ma & Genton (2000), para obten¸ao
do estimador da fun¸ao espectral do processo. Resultados num´ericos evidenciam a robustez
do estimador proposto na presen¸ca de outliers do tipo aditivo.
vi
ABSTRACT
In this thesis, we introduce an alternative semiparametric estimator of the fractional dif-
ferencing parameter in ARFIMA models. The proposed estimator is a variant of the well-
known GPH estimator and is robust against additive outliers. We use the robust sample
autocorrelations considered by Ma & Genton (2000) to obtain a robustified estimator for
the spectral density of the process. Numerical results show that the estimator we propose
for the differencing parameter is robust when the data contain additive outliers.
vii
´
Indice
Lista de Figuras x
Lista de Tabelas xi
1 Introdu¸ao 1
2 Conceitos asicos em eries Temporais 5
2.1 Processos estacion´arios 5
2.2 Modelos de s´eries temporais 8
2.2.1 Processos auto-regressivos e de m´edias m´oveis 8
2.2.2 Processos ARIMA(p, d, q)9
2.2.3 Processos ARIMA(p, d, q)fracion´arios 10
2.3 Outliers em s´eries temporais 12
2.3.1 Efeitos de outliers em processos estacion´arios 13
3 Estimador GPH Robusto 19
3.1 Estima¸ao robusta 19
3.1.1 Estimador robusto da fun¸ao de autocovariˆancias 20
3.1.2 Estimador robusto da fun¸ao periodograma 21
3.1.3 Estimador robusto do parˆametro de meoria longa 22
3.2 Procedimento para estima¸ao dos parˆametros do modelo ARFIMA 22
4 Resultados de Simula¸ao 24
4.1 Modelo ARFIMA(0,d,0) 25
4.2 Modelo ARFIMA(p, d, q)26
5 Aplica¸oes 32
viii
6Conclus˜oes 37
Referˆencias Bibliogr´aficas 38
ix
Lista de Figuras
2.1 Fun¸ao de densidade espectral do processo ARFIMA(0,d,0), com d =0.45,
contaminado por um outlier do tipo aditivo. 18
3.1 Fun¸oes de autocorrela¸ao cl´assica e robusta para uma s´erie temporal gerada
por um processo ARFIMA(0,d,0) com d =0.3 e tamanho de amostra n = 300. 21
4.1 Sele¸ao do bandwidth do estimador robusto pelo crit´erio do menor EQM para
um ARFIMA(0,d,0) com d =0.3 e tamanhos de amostra 100 (linha olida),
300 (linha tracejada) e 800 (linha pontilhada). 25
4.2 Estimativas do parˆametro d para tamanhos de amostra n = 300, 3000 obti-
das pelos estimadores para dados contaminados (GPHc e GPHRc, respecti-
vamente) e sem contamina¸ao (GPH e GPHR). 27
5.1 Dados do n´ıvel do rio Nilo e fun¸oes amostrais de autocorrelao. 33
5.2 Dados IPCA e fun¸oes amostrais de autocorrela¸ao. 34
5.3 Gr´aficos quantil-quantil dos res´ıduos dos modelos ARMA(1, 0) com bandas
de confian¸ca de 95%. 35
x
Lista de Tabelas
4.1 Estimativas do parˆametro d obtidas para um modelo ARFIMA(0,d,0) com
α = β =0.7eω =0, 10. 26
4.2 Estimativas do parˆametro d =0.45 obtidas no modelo ARFIMA(0,d,0) com
ω =3, 5, 10 e α = β =0.7. 27
4.3 Estimativas do parˆametro d obtidas por
ˆ
d
GP H
,
ˆ
d
GP Hc
,
ˆ
d
GP HR
e
ˆ
d
GP HRc
para
omodeloARFIMA(1, 0.3, 0) com φ =0.2, 0.5, 0.7, ω =0, 10, α =0.5eβ =0.7. 30
4.4 Estimativas do parˆametro φ paraomodeloARFIMA(1,d,0) com ω =0, 10,
α =0.5eβ =0.7paraass´eries diferenciadas com as estimativas obtidas
pelos estimadores d
GP H
e d
GP HR
.31
5.1 Valores das estimativas do parˆametro d para os dados do rio Nilo. 32
5.2 Valores do crit´erio AICC obtidas na determinao das ordens p e q apartir
das s´eries
U
GP H,t
e
U
GP H R,t
.35
5.3 Medidas de precis˜ao das previs˜oes para 1, 6 e 12 passos `afrente. 36
xi
CAP
´
ITULO 1
Introdu¸ao
eries econˆomicas e nanceiras comumente contˆem observoes influenciadas por
eventos externos que podem provocar mudan¸casemsuasdinˆamicas, algumas vezes de forma
transit´oria e outras vezes de forma permanente. Essas observoes ao conhecidas na lite-
ratura como dados at´ıpicos ou outliers e, dependendo de sua natureza, seus efeitos sobre os
processos inferenciais podem ser substanciais.
Estudos baseados na suposi¸ao de que as s´eries observadas s˜ao geradas por um pro-
cesso auto-regressivo integrado e de edias oveis (ARIMA) (Box, Jenkins & Reinsel
(1994)) mostram a influˆencia de outliers sobre as estimativas dos parˆametros do modelo
e sobre as previs˜oes obtidas a partir dos modelos ajustados. Por exemplo, Ledolter (1989)
mostrou que intervalos de previs˜ao ao muito sens´ıveis a outliers aditivos, mas previs˜oes
pontuais ao ao significativamente afetadas por tais dados at´ıpicos, a ao ser quando os
outliers encontram-se pr´oximos da origem da previs˜ao; Chang, Tiao & Chen (1988) e Chen
& Liu (1993b) mostraram que a presen¸ca de outliers nos dados provoca vi´es nas estimativas
dos parˆametros do modelo ARMA; Deutsch, Richards & Swain (1990) e Chan (1992, 1995)
derivaram resultados sobre o vi´es ocasionado na fun¸ao de autocorrela¸ao amostral pela
presen¸ca de observoes at´ıpicas.
1
No in´ıcio da ecada de 80, Granger & Joyeux (1980) e Hosking (1981) propuseram
uma extens˜aodosprocessosARIMAemqueoparˆametro de integra¸ao assume valores
fracion´arios: o processo ARFIMA. Hosking (1981) provou que s´eries com representa¸ao
ARFIMA(p, d, q), para valores d (0, 0.5), apresentam estacionariedade e mem´oria longa,
sendo esta caracterizada por correla¸oes estatisticamente significativas entre observoes dis-
tantes; equivalentemente, a fun¸ao de densidade espectral possui singularidade na freq¨encia
zero.
Existem diferentes propostas para estima¸ao dos parˆametros do modelo ARFIMA,
tanto de car´ater param´etrico quanto de semi-param´etrico. Nos m´etodos param´etricos
procede-se `aestima¸ao simultˆanea dos parˆametros do modelo, em geral por axima verossi-
milhan¸ca; ver, e.g., Beran (1995), Dahlhaus (1989), Fox & Taqqu (1986), Hauser (1999) e
Sowell (1992). No procedimento semi-param´etrico, a estima¸ao dos parˆametros do modelo ´e
feita em dois passos: primeiro estima-se d atrav´es, por exemplo, de um modelo de regress˜ao
linear do logaritmo da fun¸ao periodograma e, posteriormente, estimam-se os parˆametros
auto-regressivos e de m´edias oveis. O estimador mais conhecido dentro dessa classe foi
proposto por Geweke & Porter-Hudak (1983); variantes desse estimador foram desenvolvi-
das por Lobato & Robinson (1996), Reisen (1994), Robinson (1995a, 1995b), Velasco (2000),
entre outros. Estudos comparativos de simula¸ao sobre diferentes t´ecnicas de estima¸ao em
diversos cen´arios podem ser encontrados, por exemplo, em Bisaglia & Gu´egan (1998), Hal-
drup & Nielsen (2007), Reisen, Abraham & Lopes (2001), Reisen, Abraham & Toscano
(2000, 2002), Reisen, Rodrigues & Palma (2006) e Smith, Taylor & Yadav (1997).
Aplica¸oes emp´ıricas que empregam o modelo ARFIMA em economia e finan¸cas po-
dem ser encontradas em Baillie (1996), Barkoulas & Baum (1998), Bhardwaj & Swanson
(2006), Cunado, Gil-Alana & eres de Gracia (2004), Franses & Ooms (1997), Gil-Alana
(2004), Reisen, Cribari-Neto & Jensen (2003); em climatologia pode-se citar Baillie & Chung
(2002), entre outros. A recente publica¸ao de Doukhan, Oppenheim & Taqqu (2003) apre-
senta uma revis˜ao bibliogr´afica da teoria e aplica¸oes de processos com longa dependˆencia.
O estudo de modelos de mem´oria longa na presen¸ca de outliers tem sido, recente-
mente, um assunto de muito interesse para pesquisadores da ´area. En especial, evidˆencias
2
emp´ıricas mostram que as estimativas do parˆametro de mem´oria longa ao significativa-
mente alteradas pela presen¸ca de outliers do tipo aditivo na s´erie temporal.
Haldrup & Nielsen (2007) mostraram, atrav´es de simula¸oes de eries temporais
com tamanhos de amostras relativamente pequenos, algumas conseq¨encias da presen¸ca
de erros de medi¸ao, outliers e mudacas estruturais sobre as estimativas obtidas para
oparˆametro de mem´oria longa. Os resultados revelaram que os diferentes tipos de ob-
servoes at´ıpicas podem afetar seriamente as estimativas do grau de longa depedˆencia.
Por exemplo, a presen¸ca de outliers do tipo aditivo conduz a vi´es significativo nas estimati-
vas do parˆametro de integra¸ao fracion´aria. O vi´es pode ser explicado por uma transla¸ao
da fun¸ao de densidade espectral do processo observado. Os autores conclu´ıram que os
estimadores semi-param´etricos obtidos por regress˜ao apresentam vi´es relativamente menor
quando o bandwidth, que corresponde ao n´umero de freq¨encias utilizadas para o alculo
das estimativas, ´e reduzido. Para minimizar o efeito do outlier sobre a estimativa de d,
os autores sugerem o uso da metodologia proposta por Sun & Phillips (2003), que se fun-
damentanainclus˜ao de um termo n˜ao-linear na regress˜ao do logaritmo do periodograma.
No mesmo contexto, Agostinelli & Bisaglia (2003) sugerem um etodo alternativo baseado
em verossimilhan¸ca ponderada como uma modifica¸ao do estimador proposto por Beran
(1994).
Mudan¸cas na dinˆamica de s´eries temporais afetam as estruturas de correla¸ao e,
conseq¨uentemente, causam vi´es nas estimativas dos parˆametros. Neste sentido, o presente
trabalho prop˜oe uma metodologia para estimar os parˆametros do modelo ARFIMA na
presen¸ca de outliers do tipo aditivo. O m´etodopropostoparaaestima¸ao de d utiliza a
estimativa robusta da fun¸ao de autocovariˆancia sugerida por Ma & Genton (2000) para
obter a fun¸ao periodograma. Nosso estimador ´e uma variante do estimador apresentado
por Geweke & Porter-Hudak (1983) (GPH). Estudos num´ericos evidenciam a robustez do
estimadorpropostonapresen¸ca de outliers do tipo aditivo.
A presente disserta¸ao est´a dividida em seis cap´ıtulos como descrito a seguir. No
Cap´ıtulo2s˜ao apresentados conceitos b´asicos usados no estudo de s´eries temporais e pro-
cessos estacion´arios; adicionalmente, ao apresentados alguns resultados relativos a efeitos
3
de outliers na estima¸ao de modelos estacion´arios. No Cap´ıtulo 3 apresentamos nosso esti-
mador robusto para d. Resultados de simula¸ao e aplica¸oes encontram-se nos Cap´ıtulos 4
e 5. Finalmente, o Cap´ıtulo 6 cont´em as principais concluoes deste trabalho.
4
CAP
´
ITULO 2
Conceitos asicos em eries Temporais
Neste cap´ıtulo s˜ao introduzidos conceitos b´asicos utilizados na an´alise de eries tem-
porais e processos estacion´arios. Em particular, ´e importante destacar o conceito de estacio-
nariedade, no qual se encontram baseadas todas as ecnicas de estima¸ao e modelagem de
eries temporais no dom´ınio do tempo, atrav´es da fun¸ao de autocovariˆancia, e no dom´ınio
da freq¨encia, atrav´es da fun¸ao de densidade espectral. Para detalhes, ver Brockwell &
Davis (2006), Priestley (1983) e Wei (2005).
2.1 Processos estacion´arios
Aseguirs˜ao apresentadas as condi¸oes de estacionariedade para um processo es-
toastico linear geral. Adicionalmente, s˜ao definidas as fun¸oes que caracterizam a dinˆamica
do processo nos dom´ınios do tempo e da freq¨encia.
Defini¸ao 2.1.1. (Processo estoastico) Um processo estoastico ´eumafam´ılia de vari´aveis
aleat´orias {X
t
(ω)}
tT
, definidas no mesmo espa¸co de probabilidade , ,P), onde ω Ω
e T ´e um conjunto arbitario. Aqui, Ω ´eoespa¸co amostral, ´eumaσ-algebra de Ω e P ´e
uma medida de probabilidade em .
5
OconjuntoT ´e comumente tomado como o conjunto dos n´umeros inteiros Z = {0, ±1, ±2,...}.
Seguindo a defini¸ao anterior, uma erie temporal ´e uma realiza¸ao de um certo processo
estoastico. Os dois primeiros momentos de {X
t
(ω)}
tZ
(ou {X
t
})s˜ao definidos como
E[X
t
]=μ
t
e E(X
t
μ
t
)
2
= σ
2
t
,
enquanto que a covariˆancia entre X
t
e X
t+h
´e
Cov(X
t
,X
t+h
)=E[(X
t
μ
t
)(X
t+h
μ
t+h
)] para h Z,
e a correlao ´e dada por
Cov(X
t
,X
t+h
)
σ
2
t
σ
2
t+h
para h Z.
Defini¸ao 2.1.2. (estacionariedade) Um processo estoastico {X
t
} ´e dito ser (fracamente)
estacion´ario se e somente se:
1.E[X
t
]=μ,paratodot Z,
2.E(X
t
μ)
2
= σ
2
,0
2
< ,paratodot Z,
3.R(h)=Cov(X
t
,X
t+h
) depende apenas de h,paratodot Z.
As autocorreloes ρ(h)s˜ao obtidas normalizando as autocovarancias atrav´es da sua divis˜ao
pelo produto dos respectivos desvios padr˜ao, i.e., ρ(h)=
R(h)
R(0)
. O exemplo mais simples de
um processo estacion´ario ´e o processo de ru´ıdo branco (RB), definido como uma seq¨encia
de vari´aveis aleat´orias n˜ao-correlacionadas com edia constante e variˆancia constante (es-
tritamente positiva e nita) ao longo do tempo.
Defini¸ao 2.1.3. (Processo linear geral) {X
t
} ´e um processo linear se pode ser representado
como
X
t
=
j=−∞
ψ
j
tj
,t Z,
onde {
t
}∼RB(0
2
)e{ψ
j
} ´eumaseq¨encia de constantes com
j=−∞
|ψ
j
| < .
6
Defini¸ao 2.1.4. (Fun¸ao geratriz de autocovariˆancias) Seja {X
t
} um processo estacion´ario
com fun¸ao de autocovariˆancias R(h) que satisfaz
h=−∞
|R(h)| < . A fun¸ao geratriz
de autocovariˆancias de {X
t
} ´e definida como
g(z)=
h=−∞
R(h)z
h
,
onde z ´e um escalar complexo.
Em particular, a fun¸ao de densidade espectral (ou espectro) de {X
t
} ´e a fun¸ao
dada por
f(λ)=
1
2π
g(e
)=
1
2π
h=−∞
e
ihλ
R(h)
=
1
2π
R(0) + 2
h=1
R(h)cos(λh)
[π, π],
onde e
=cos(λ) i sin(λ)ei =
1. Neste caso, note que a somabilidade de |R(·)|
implica que f(λ) converge absolutamente.
Estima¸ao da m´edia, autocovariˆancias e espectro de um processo estacion´ario
Sejam x
1
,x
2
,...,x
n
observoes de um processo {X
t
} estacion´ario. Os estimadores
usuais para E[X
t
]=μ e E(X
t
μ)
2
= σ
2
X
ao ¯x =
1
n
n
t=1
x
t
e
R(0) =
1
n
n
t=1
(x
t
¯x)
2
,
respectivamente. Um estimador razo´avel da fun¸ao de autocovarancias ´e
R(h)=
1
n
nh
t=1
(x
t
¯x)(x
t+h
¯x),h=0, ±1, ±2,...,±(n 1),
e um estimador natural para ρ(he ρ(h)=
b
R(h)
b
R(0)
.
No dom´ınio da freq¨encia, um estimador assintoticamente n˜ao-viesado para a fun¸ao
de densidade espectral f(λeoperiodograma, dado por
I(λ)=
1
2π
R(0) + 2
n1
h=1
R(h)cos(λh)
. (2.1)
Um estimador consistente para o espectro de um processo estacion´ario ´eoperiodograma
suavizado, dado por
I
s
(λ)=
1
2π
n1
h=(n1)
κ(h)
R(h)cos(λh) [π, π], (2.2)
7
onde κ(·e uma fun¸ao cont´ınua e par. Na literatura, essa fun¸ao ´e conhecida como “janela”
util para reduzir a contribui¸ao de covariˆancias provenientes de defasagens (h)elevadas.
A “janela” mais simples ´e a chamada janela periodograma truncado:
κ(u)=
1, |u|≤M,
0, |u| >M,
onde M (<n1) ´eoparˆametro de truncamento. Existem outras propostas para a fun¸ao
κ(·) considerando diferentes pondera¸oes; para detalhes ver Priestley (1983, p. 437).
2.2 Modelos de eries temporais
O estudo das s´eries temporais pode ser motivado pelo interesse em investigar o me-
canismo gerador de um conjunto de dados observados ao longo do tempo para descrever
sua dinˆamica com o objetivo de gerar previs˜oes acerca do seu comportamento futuro. Para
tanto, s˜ao constru´ıdos modelos probabil´ısticos que pertencem a um dom´ınio temporal pre-
viamente estabelecido. Tais modelos devem respeitar o princ´ıpio da parcimˆonia, ou seja,
devem envolver o menor n´umero poss´ıvel de paametros.
Aseguir,s˜ao descritos de forma geral alguns desses modelos e algumas de suas
propriedades s˜ao apresentadas.
2.2.1 Processos auto-regressivos e de edias oveis
Seja {X
t
} um processo que satisfaz a equa¸ao em diferen¸cas dada por
Φ(B)X
t
(B)
t
, (2.3)
onde {
t
} ´eru´ıdo branco, i.e., {
t
}∼RB(0
2
), B ´e o operador de defasagem definido como
B
m
X
t
= X
tm
, m =1,...,p(z)=1φ
1
z φ
2
z
2
···φ
p
z
p
(z)=1+θ
1
z + θ
2
z
2
+
···+ θ
q
z
q
. O processo {X
t
} definido em (2.3) ´e chamado de processo auto-regressivo e de
edias oveis, ARMA(p, q).
Defini¸ao 2.2.1. (Invertibilidade) Um processo {X
t
} com representa¸ao ARMA(p, qe
invert´ıvel se existem constantes {π
j
} tais que
j=0
|π
j
| < e
t
=
j=0
π
j
X
tj
,para
todo t Z.
8
Seguindo as Defini¸oes 2.1.2 e 2.2.1 o processo (2.3) ´eestacion´ario e invert´ıvel se as
ra´ızes de Φ(z)=0eΘ(z)=0s˜ao n˜ao comuns e encontram-se fora do c´ırculo unit´ario.
Defini¸ao 2.2.2. (Causalidade) Um processo {X
t
} com representa¸ao ARMA(p, qe causal,
ou fun¸ao causal de {
t
}, se existem constantes {ψ
j
} tais que
j=0
|ψ
j
| < e X
t
=
j=0
ψ
j
tj
,paratodot Z.
Note que as propriedades de invertibilidade e causalidade n˜ao ao apenas do processo
{X
t
},mastamb´em da rela¸ao entre os processos {X
t
} e {
t
} da defini¸ao da equa¸ao ARMA
apresentada em (2.3). Invertibilidade e causalidade garantem que aumasolu¸ao ´unica
estacion´aria, com probabilidade um, para a equao ARMA.
Fun¸ao de autocovariˆancias e densidade espectral de um processo ARMA(p, q)
Oc´alculo da fun¸ao de autocovarancias para um processo {X
t
} com representa¸ao
ARMA(p, q)causal´e realizado atrav´es das equoes
R(k) φR(k 1) ···φ
p
R(k p)=σ
2
j=0
θ
k+j
ψ
j
, 0 = k<m,
R(k) φR(k 1) ···φ
p
R(k p)=0,k m,
onde m =max(p, q +1), ψ
j
p
k=1
φ
k
ψ
jk
= θ
j
, j =0, 1, 2,.... ψ
j
=0paraj<0, θ
0
=1
e θ
j
=0paraj/∈{0, 1,...,q}; ver, e.g., Brockwell & Davis (2002, p. 88).
O espectro de {X
t
} ´e dado por
f
ARMA
(λ)=
σ
2
2π
|Θ(e
)|
2
|Φ(e
)|
2
[π, π]. (2.4)
2.2.2 Processos ARIMA(p, d, q)
Seja d um inteiro ao-negativo. {X
t
} ´e um processo auto-regressivo integrado e de
edias m´oveis ARIMA(p, d, q)seY
t
=(1B)
d
X
t
´e um processo ARMA(p, q)causal.Esta
defini¸ao sugere que {X
t
} satisfaz a equa¸ao em diferecas da forma
Φ(B)(1 B)
d
X
t
(B)
t
, {
t
}∼RB(0
2
).
9
2.2.3 Processos ARIMA(p, d, q)fracion´arios
No in´ıcio da ecada de 80, Granger & Joyeux (1980) e Hosking (1981) propuseram
uma extens˜ao dos modelos ARIMA em que o parˆametro de integra¸ao assume valores fra-
cion´arios. Esses modelos ao conhecidos na literatura como ARFIMA e s˜ao utilizados na
modelagem de s´eries que possuem mem´oria longa ou longa dependˆencia. A propriedade de
mem´oria longa ocorre em eries que apresentam correla¸oes estatisticamente significativas
mesmoparaobserva¸oes distantes, i.e.,
h=−∞
|ρ(h)| = ; equivalentemente, o espectro
apresenta singularidade para freq¨encias pr´oximas de 0, i.e., f (λ) →∞quando λ 0. De
maneira mais formal, o processo ARFIMA(p, d, qe definido como a seguir:
Seja d R. {X
t
} segue um processo ARFIMA(p, d, q)sesatisfazaequa¸ao em
diferecas da forma
Φ(B)(1 B)
d
X
t
(B)
t
, (2.5)
com Φ(z)=1φ
1
z −···−φ
p
z
p
(z)=1θ
1
z −···−θ
p
z
q
, {
t
} sendo um processo ru´ıdo
branco com m´edia 0 e variˆancia σ
2
. O filtro de diferencia¸ao fracion´aria (1 B)
d
´e definido
pela expans˜ao binomial
(1 B)
d
=
j=0
π
j
B
j
,
onde π
j
=
Γ(jd)
Γ(j+1)Γ(d)
, j =0, 1, 2,...,eΓ(·e a fun¸ao gama definida em R Z
:
Γ(x)=
0
t
x1
e
t
dt, x > 0,
,x=0,
x
1
Γ(1 + x),x<0.
Quando d (0.5, 0.5) e as ra´ızes dos polinˆomios Φ(z)=0eΘ(z)=0s˜ao n˜ao-comuns e
est˜ao fora do c´ırculo unit´ario, o processo definido em (2.5) ´eestacion´ario e invert´ıvel e com
fun¸ao de densidade espectral dada por
f
ARF IMA
(λ)=f
ARMA
(λ)
2sin
λ
2

2d
[π, π], (2.6)
onde f
ARMA
(λ)est´a definida em (2.4).
10
Hosking (1981) mostrou que para valores d 0.5 {X
t
} ´en˜ao estacion´ario e in-
vert´ıvel, e ainda que s´eries com representa¸ao ARFIMA(p, d, q)comd (0, 0.5) apresentam
estacionariedade e mem´oria longa. Assim, no que se segue os consideraremos o processo
ARFIMA(p, d, q)comd (0, 0.5).
etodos de estima¸ao do parˆametro d em modelos ARFIMA(p, d, q)
Existem arios estimadores do parˆametro de diferencia¸ao fracion´aria d propostos na
literatura, que podem ser classificados em param´etricos e semi-param´etricos. Os primeiros
envolvem a estima¸ao simultˆanea dos parˆametros do modelo, em geral utilizando o m´etodo
de axima verossimilhan¸ca; ver, e.g., Dahlhaus (1989), Fox & Taqqu (1986), Sowell (1992).
Nos procedimentos semi-param´etricos, a estimao dos parˆametros do modelo ´e realizada
em dois passos: primeiro estima-se o parˆametro de mem´oria longa d, por exemplo, atrav´es de
um modelo de regress˜ao do logaritmo da fun¸ao periodograma e, posteriormente, estimam-
se os parˆametros auto-regressivos e de edias oveis. O estimador mais popular dentro
dessa classe ´e o estimador proposto por Geweke & Porter-Hudak (1983) (GPH); variantes
foram desenvolvidas por Reisen (1994), Robinson (1995a, 1995b), entre outros.
Estimador GPH
Seja f (λ
j
) a fun¸ao definida em (2.6), para λ
j
=
2πj
n
, j =0, 1,...,
n
2
, onde n ´eo
tamanho amostral. O logaritmo de f (λ
j
) pode ser escrito como:
ln f(λ
j
)=lnf
u
(0) d ln
2sin
λ
j
2

2
+ln
f
u
(λ
j
)
f
u
(0)
, (2.7)
onde f
u
(λe a densidade espectral de U
t
=(1 B)
d
X
t
.Aqui,. denota a fun¸ao parte
inteira.
Geweke & Porter-Hudak (1983) sugerem um estimador semi-param´etrico de d,adi-
cionando ln I(λ) em ambos os lados da equa¸ao (2.7) e considerando as freq¨encias pr´oximas
de zero, obtendo a aproxima¸ao:
ln I(λ
j
) ln f
u
(0) d ln
2sin
λ
j
2

2
+ln
I(λ
j
)
f(λ
j
)
, (2.8)
11
que sugere a equa¸ao de regresao dada por
ln I(λ
j
) β
0
+ β
1
ln
2sin
λ
j
2

2
+ e
j
,j=1, 2,...,g(n),
onde β
0
=lnf
u
(0), β
1
= d e g(neobandwidth, que corresponde ao n´umero de freq¨encias
utilizadas na regress˜ao. Os erros {e
j
} ao assintoticamente independentes com distribui¸ao
Gumbel de m´edia 0 e variˆancia
π
2
6
(ver Geweke & Porter-Hudak (1983)). O estimador GPH
´e dado por
d
GP H
=
g(n)
i=1
(x
i
¯x)lnI(λ
i
)
g(n)
i=1
(x
i
¯x)
2
, (2.9)
onde x
i
=ln
2sin
λ
j
2

2
. Geweke & Porter-Hudak (1983) sugerem considerar g(n)=n
α
,
0 <α<1. Algumas propriedades assinoticas do estimador dado em (2.9) foram derivadas
por Hurvich, Deo & Brodsky (1998) e Velasco (2000).
2.3 Outliers em s´eries temporais
Na an´alise de eries temporais ´e comum encontrar observoes influenciadas por
eventos externos que podem facilmente afetar os procedimentos convencionais de an´alise,
nomeadamente podem enviesar significativamente as estimativas dos parˆametros do modelo.
O efeito dessas observoes, conhecidas como dados at´ıpicos ou outlierse no entanto, muitas
vezes omitido pela falta do conhecimento de etodos que podem ser usados para detect´a-los
eparaacomod´a-los ao processo subjacente `as´erie.
Fox (1972) introduziu o conceito de outliers no contexto de s´eries temporais, tendo
considerado dois tipos de observoes at´ıpicas a saber: aditivo (AO “Additive Outlier”)
e inovador (IO – “Innovational Outlier”). Como uma extens˜ao do trabalho de Fox (1972),
Chang et al. (1988), Chen & Liu (1993a, 1993b) e Tsay (1986) consideraram as alteroes
na estrutura da s´erie, nomeadamente, altera¸ao de n´ıvel permanente (LS “Level Shift”)
ealtera¸oes tempor´arias (TC “Temporary Change”). Os mesmos autores, adotando a
formula¸ao de Fox (1972), consideraram tais altera¸oes como casos particulares do modelo
geral de interven¸ao de Box & Tiao (1975), a partir de um processo linear estacion´ario de
12
segunda ordem {y
t
}, escrevendo o processo contaminado por outliers {z
t
} como
z
t
= y
t
+
m
i=1
ξ
i
(B)ω
i
I
(T
i
)
t
, (2.10)
onde m ´eon´umero total de outliers, o parˆametro desconhecido ω
i
representa a magnitude
do i-´esimo outlier no tempo T
i
, I
(T
i
)
t
´eumavari´avel aleat´oria satisfazendo
I
(T
i
)
t
=
±1, se t = T
i
,
0, se t = T
i
,
e ξ
i
(B) determina a dinˆamica do outlier no tempo T
i
,deacordocomoseguinteesquema:
AO : ξ
i
(B)=1,
IO : ξ
i
(B)=
Θ(B)
Φ(B)
,
LS : ξ
i
(B)=
1
1 B
,
TC : ξ
i
(B)=
1
1 δB
, 0 <1,
onde Φ(z)=1φ
1
z φ
2
z
2
···φ
p
z
p
(z)=1+θ
1
z + θ
2
z
2
+ ···+ θ
q
z
q
.Asvari´aveis
y
t
e I
(T
i
)
t
ao independentes para cada valor de t.
Neste trabalho ser˜ao considerados unicamente outliers do tipo aditivo por serem os
mais comuns e por afetarem significativamente an´alises de s´eries temporais.
2.3.1 Efeitos de outliers em processos estacion´arios
Aseguir,s˜ao apresentados alguns resultados referentes aos efeitos de outliers aditivos
sobre as fun¸oes de densidade espectral e de correla¸ao do processo {z
t
}.
Proposi¸ao 1. Seja {z
t
} representado pelo modelo (2.10) com ξ
i
(B)=1.SeI
(T
i
)
t
´euma
vari´avel Bernoulli tal que Pr
I
(T
i
)
t
= 1
= Pr
I
(T
i
)
t
=1
=
p
i
2
e Pr
I
(T
i
)
t
=0
=1p
i
e supondo que T
j
=2T
i
para cada i, j =1, 2,...,m.Ent˜ao,
i. Afun¸ao de autocovariˆancia (FACOV) do processo {z
t
} ´e dada por
R
z
(h)=
R
y
(0) +
m
i=1
ω
2
i
p
i
, se h =0,
R
y
(h), se h =0.
(2.11)
13
ii. Afun¸ao de densidade espectral do processo {z
t
} ´e dada por
f
z
(λ)=f
y
(λ)+
1
2π
m
i=1
ω
2
i
p
i
. (2.12)
Prova. i. Seja E[y
t
]=μ.DadoqueR
z
(h)=E[z
t
z
t+h
] E[z
t
]E[z
t+h
], ent˜ao
R
z
(h)=E
y
t
+
m
i=1
ω
i
I
(T
i
)
t

y
t+h
+
m
i=1
ω
i
I
(T
i
)
t+h
μ
2
= R
y
(h)+
m
i=1
ω
i
E
I
(T
i
)
t+h
y
t
+
m
i=1
ω
i
E
I
(T
i
)
t
y
t+h
+
m
i=1
ω
2
i
E
I
(T
i
)
t
I
(T
i
)
t+h
=
R
y
(0) +
m
i=1
ω
2
i
E
I
(T
i
)
t
2
, se h =0,
R
y
(h), se h =0.
ii. Como f
z
(λ)=
1
2π
h=−∞
R
z
(h)e
ihλ
,ent˜ao
f
z
(λ)=
1
2π
1
h=−∞
R
z
(h)e
ihλ
+ R
z
(0) +
h=1
R
z
(h)e
ihλ
=
1
2π
R
z
(0) + 2
h=1
R
z
(h)e
ihλ
.
Assim, por (i),
f
z
(λ)=
1
2π
R
y
(0) +
m
i=1
ω
2
i
p
i
+2
h=1
R
y
(h)e
ihλ
=
1
2π
R
y
(0) + 2
h=1
R
y
(h)e
ihλ
+
1
2π
m
i=1
ω
2
i
p
i
.
Os resultados na Proposi¸ao 1 revelam que a um aumento na variˆancia de {z
t
},oque
implica diminui¸ao nos valores das autocorrela¸oes e perda de informa¸ao sobre a estrutura
de autocorrela¸ao do processo. A densidade espectral de {z
t
} ´e caracterizada por uma
transla¸ao provocada em fun¸ao dos ω
1
2
,...,ω
m
. A propriedade de perda de mem´oria
apresentada pela FACOV ´e abordada por Chan (1992), atrav´es do limite da fun¸ao de
autocorrelao amostral (ver Proposao 3).
14
O resultado a seguir evidencia o efeito de um outlier sobre a fun¸ao de autocovarancia
amostral e sobre o periodograma.
Proposi¸ao 2. Seja z
1
,z
2
,...,z
n
um conjunto de observoes geradas pelo modelo (2.10)
com ξ
i
(B)=1. Tomando m =1, temos que:
i. A FACO V amostral ´e dada por
R
z
(h)=
R
y
(h) ±
ω
n
(y
T h
+ y
T +h
y)
ω
2
n
2
+
ω
2
n
δ(h)+o
p
1
n
, (2.13)
onde
R
y
(h)=
1
n
nh
t=1
(y
t
¯y)(y
t+h
¯y) e δ(h)=
1, quando h =0,
0, caso contr´ario.
ii. O periodograma ´e dado por
I
z
(λ)=I
y
(λ)+
1
2π
Δ(ω), (2.14)
onde
Δ(ω)=
ω
2
n
ω
2
n
2
sin(n
1
2
)λ
sin(
λ
2
)
±
2ω
n
(y
T
¯y) ±
2ω
n
n1
h=1
(y
T h
+ y
T +h
¯y)cos()+o
p
1
n
.
Prova. i. Am´edia amostral do processo {z
t
} ´e dada por
¯z =
1
n
n
t=1
z
t
=
1
n
n
t=1
y
t
+ ωI
(T )
t
=
1
n
n
t=1
y
t
+
ω
n
n
t=1
I
(T )
t
y ±
ω
n
. (2.15)
Logo,
R
z
(h)=
1
n
nh
t=1
(y
t
¯y)+
ωI
(T )
t
ω
n

(y
t+h
¯y)+
ωI
(T )
t+h
ω
n

=
1
n
nh
t=1
(y
t
¯y)(y
t+h
¯y)+
1
n
nh
t=1
(y
t
¯y)
ωI
(T )
t+h
ω
n
+
1
n
nh
t=1
ωI
(T )
t
ω
n
(y
t+h
¯y)+
1
n
nh
t=1
ωI
(T )
t
ω
n

ωI
(T )
t+h
ω
n
=
R
y
(h) ±
ω
n
y
T h
ω
n
2
nh
t=1
y
t
ω
n
¯y ±
ω
n
1
h
n
¯y ±
ω
n
y
T +h
ω
n
¯y
ω
n
2
nh
t=1
y
t+h
±
ω
n
¯y
1
h
n
ω
2
n
2
nh
t=1
I
(T )
t
I
(T )
t+h
±
ω
2
n
1
h
n
=
R
y
(h) ±
ω
n
(y
T h
¯y) ±
ω
n
(y
T +h
¯y)
ω
2
n
2
+
ω
2
n
δ(h)+o
p
1
n
.
15
ii. Pela defini¸ao do periodograma tem-se que
I
z
(λ)=
1
2π
R
z
(0) + 2
n1
h=1
R
z
(h)cos()
[π, π]. (2.16)
Logo, pelo item (i),
I
z
(λ)=
1
2π
R
y
(0) ±
2ω
n
(y
T
¯y)
ω
2
n
2
+
ω
2
n
+2
n1
h=1
R
y
(h) ±
ω
n
(y
T h
+ y
T +h
y)
ω
2
n
2
cos()
=
1
2π
R
y
(0) + 2
n1
h=1
R
y
(h)cos()
+
1
2π
Δ(ω),
onde
Δ(ω)=
ω
2
n
ω
2
n
2
±
2ω
n
(y
T
¯y)
2ω
2
n
2
n1
h=1
cos() ±
2ω
n
n1
h=1
(y
T h
+ y
T +h
y)cos()
=
ω
2
n
ω
2
n
2
±
2ω
n
(y
T
¯y)
2ω
2
n
2
sin(n
1
2
)λ
2sin(
λ
2
)
+
ω
2
n
2
±
2ω
n
n1
h=1
(y
T h
+ y
T +h
y)cos()+o
p
1
n
.
As fun¸oes (2.13) e (2.14), apresentadas na Proposi¸ao 2, evidenciam a influˆencia do outlier
sobre as fun¸oes amostrais (FACOV e periodograma) de uma s´erie temporal com um dado
at´ıpico. Quando h = 0, o termo adicional
ω
2
n
em (2.13) implica diminui¸ao nos valores
obtidos pela fun¸ao de autocorrela¸ao amostral (FAC), definida como ρ
z
(h)=
b
R
z
(h)
b
R
z
(0)
.
Os resultados assint´oticos na Proposi¸ao 3, apresentados tamb´em por Chan (1992,
1995), mostram que a FAC ´e consideravelmente alterada pela presen¸ca de outliers. Os resul-
tados evidenciam perda na informa¸ao referente `a estrutura de autocorrela¸ao do processo,
o que ocasiona aumento nos erros de estimao dos parˆametros do modelo.
16
Proposi¸ao 3. (Chan(1992, 1995)) Seja z
1
,z
2
,...,z
n
um conjunto de observa¸oes geradas
pelo modelo (2.10) com ξ
i
(B)=1.
i. Para m =1,
lim
n→∞
lim
ω→∞
ρ
z
(h)=0.
ii. Para m =2e T
2
= T
1
+ l,talqueh<T
1
<T
1
+ l<n h, temos que
lim
n→∞
plim
ω
1
→∞
ω
2
→±∞
ρ
z
(h)
=
0, se h = l
±0.5, se h = l.
As Proposi¸oes1a3mostramqueapresen¸ca de outliers em processos lineares estacion´arios
pode afetar seriamente a inferˆencia realizada, alterando sua dinˆamica e podendo conduzir
aconclus˜oes errˆoneas sobre sua natureza. Os resultados aqui apresentados corroboram
aqueles obtidos por Chang et al. (1988) e por Chen & Liu (1993b) para processos ARMA.
OCorolario1aseguirapresentaoespectrodoprocesso{z
t
} quando {y
t
} segue uma
representa¸ao ARFIMA(p, d, q).
Corolario 1. Seja {y
t
}
tZ
um processo estacion´ario e invert´ıvel ARFIMA(p, d, q).Seja
{z
t
}
tZ
representado pelo modelo z
t
= y
t
+
m
i=1
ω
i
I
(T )
t
,ondem ´eon´umero total de outliers,
oparˆametro desconhecido ω
i
representa a magnitude do i-´esimo outlier no tempo T
i
e I
(T
i
)
t
´eumavari´avel Bernoulli tal que Pr
I
(T
i
)
t
= 1
= Pr
I
(T
i
)
t
=1
=
p
i
2
e Pr
I
(T
i
)
t
=0
=
1 p
i
. O espectro de {z
t
} ´e dado por
f
z
(λ)=
σ
2
2π
|Θ(e
)|
2
|Φ(e
)|
2
2sin
λ
2

2d
+
1
2π
m
i=1
ω
2
i
p
i
.
O Corolario 1 ´econseq¨encia imediata da Proposi¸ao 1.
Como ilustra¸ao do Corlolario 1, a Figura 2.1 mostra a transla¸ao no espectro de
{z
t
} quando d =0.45 e m = 1, considerando magnitudes ω =10, 15, sendo y
t
=(1B)
d
t
,
onde {
t
} ´eru´ıdo branco com edia 0 e variˆancia σ
2
=1.
Atransla¸ao da fun¸ao de densidade espectral, causada pelos dados at´ıpicos, provoca
vi´es nas estimativas obtidas do parˆametro d, evidenciando a sensibilidade dos estimadores
17
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Frequency
Spectrum
(a) ω =10
0.0 0.5 1.0 1.5 2.0 2.5 3.0
0.0 0.5 1.0 1.5 2.0 2.5 3.0
Frequency
Spectrum
(b) ω =15
Figura 2.1: Fuao de densidade espectral do processo ARFIMA(0,d,0), com d =0.45,
contaminado por um outlier do tipo aditivo. A linha pontilhada representa o espectro do
processo sem outlier e a linha cont´ınua representa o espectro do processo contaminado.
quandoas´erie temporal cont´em outliers. Em particular, os estudos num´ericos apresenta-
dos neste trabalho mostram que o estimador sugerido por Geweke & Porter-Hudak (1983)
subestima o parˆametro de mem´oria longa na presen¸ca de dados at´ıpicos.
18
CAP
´
ITULO 3
Estimador GPH Robusto
Na Subse¸ao 2.3.1 foram discutidas as propriedades das fun¸oes de autocovariˆancias
e densidade espectral na presen¸ca de outliers. Observou-se o vi´es causado por este tipo de
dados na fun¸ao de autocorrela¸ao amostral e, conseq¨uentemente, na fun¸ao periodograma.
Os vieses dos estimadores do parˆametro d,ems´eries temporais de mem´oria longa na presen¸ca
de dados at´ıpicos, motivam o desenvolvimento de inferˆencia robusta `apresen¸ca de dados
at´ıpicos.
A seguir ser˜ao propostos um estimador robusto do parˆametro fracion´ario d para o
processo observado {z
t
} e uma metodologia para estima¸ao robusta dos parˆametros auto-
regressivos e de m´edias oveis do modelo.
3.1 Estima¸ao robusta
O estimador proposto do parˆametro d (d
GP HR
e uma variante do estimador sugerido
por Geweke & Porter-Hudak (1983). Para obter o estimador proposto, utilizamos a fuao
de autocorrela¸ao robusta, apresentada por Ma & Genton (2000), com vistas a obter um
estimador robustificado do espectro do processo.
19
3.1.1 Estimador robusto da fun¸ao de autocovariˆancias
Ma & Genton (2000) propuseram um estimador robusto para a FACOV com base
na aproxima¸ao de escala para a covariˆancia entre duas vari´aveis aleat´orias e no estimador
Q
n
(·), proposto por Rousseeuw & Croux (1993). O estimador de escala para covariˆancia ´e
dado por
COV(X, Y) =
1
4ab
[var(aX + bY ) var(aX bY )], (3.1)
onde X e Y ao vari´aveis aleatorias, a =
1
var(X)
e b =
1
var(Y)
(Huber 2004). O estimador
Q
n
(·e baseado na kesima estat´ıstica de ordem das
n
2
distˆancias {|z
i
z
j
|,i<j}, sendo
dado por
Q
n
(z)=c ×{|z
i
z
j
|; i<j}
(k)
, (3.2)
onde z =(z
1
,z
2
,...,z
n
)
´e o vetor de dados, c ´e uma constante usada para garantir con-
sistˆencia (c =2.2191 para distribuao normal) e k =
(
n
2
)
+2
4
+ 1. Este procedimento de
alculo implica elevado custo computacional, o qual pode ser diminu´ıdo atrav´es do uso do
algoritmo descrito por Croux & Rousseeuw (1992).
Apartir de (3.1) e (3.2), o estimador robusto para a FACOV ´e calculado da forma
R(h)=
1
4
Q
2
nh
(u + v) Q
2
nh
(u v)
, (3.3)
onde u e v ao vetores que contˆem as primeiras e as ´ultimas n h observoes, respectiva-
mente. O estimador robusto para a fun¸ao de autocorrela¸ao ´e dado por
ρ(h)=
Q
2
nh
(u + v) Q
2
nh
(u v)
Q
2
nh
(u + v)+Q
2
nh
(u v)
. (3.4)
Ele mant´em a propriedade |ρ(h)|≤1en˜ao depende do valor de c.
Ma & Genton (2000) derivam algumas propriedades de robustez do estimador (3.3)
e mostram que a variˆancia do mesmo ao tem forma fechada.
Como ilustra¸ao,aFigura3.1mostraocomportamentodasFACte´orica e amostrais,
cl´assica e robusta, obtidas para uma s´erie temporal gerada do modelo ARFIMA(0,d,0), com
d =0.3 e tamanho de amostra n = 300. A s´erie contaminada ´econstru´ıda substituindo 5%
das observoes por outliers do tipo aditivo com magnitude ω = 10. Note que, na ausˆencia
20
de dados at´ıpicos (Figura 3.1(a)), as fuoes amostrais fornecem estimativas relativamente
pr´oximas para os primeiros
n
2
valores de h, como verificado por Ma & Genton (2000). No
caso contaminado (Figura 3.1(b)), a FAC cl´assica evidencia o vi´es indicado nas Proposi¸oes
1 e 2. Em ambos casos, as estimativas obtidas atrav´es da autocorrela¸ao amostral robusta,
para valores grandes de h, apresentam comportamento irregular, que ´e explicado pelo alculo
dos quantis na fun¸ao Q
n
(·).
0 50 100 150 200 250 300
0.0 0.1 0.2 0.3 0.4
Autocovariances
(a) Dados sem contamina¸ao
0 50 100 150 200 250 300
0.0 0.1 0.2 0.3 0.4
Autocovariances
(b) Dados contaminados
Figura 3.1: Fuoes de autocorrela¸ao te´orica (linha continua) e amostrais, cl´assica (linha
pontilhada) e robusta (linha tracejada), para uma s´erie temporal gerada por um processo
ARFIMA(0,d,0) com d =0.3 e tamanho de amostra n = 300.
3.1.2 Estimador robusto da fun¸ao periodograma
As propriedades de robustez do estimador da FAC, apresentado na Subse¸ao 3.1.1,
motivam a utiliza¸ao do mesmo no alculo da fun¸ao periodograma, como descrito a seguir.
Seja
I(λ) o estimador robusto da fun¸ao de densidade espectral dado por
I(λ)=
1
2π
M
h=M
κ
h
M
R(h)cos(), (3.5)
onde κ (se fun¸ao cont´ınua para s (1, 1), com κ(0) = 1, κ(s)=κ(s), e
R(he
a fun¸ao de autocovarancias definida em (3.3). O parˆametro M ´e fun¸ao de n,talque
M →∞e
M
n
0 quando n →∞. Note que, para valores grandes de h (h maior ou
igual que
3
4
n), ρ(h) possui comportamento irregular. Portanto, como descrito na Sao
2.1, torna-se necesaria a utiliza¸ao de uma janela para reduzir a contribui¸ao dos ´ultimos
21
termos da fun¸ao de autocovariˆancias robusta. A fun¸ao κ(·e definida como
κ(s)=
1, |s|≤1,
0, |s| > 1,
e M = n
β
,0<1. κ(s) corresponde `a janela usual do periodograma, como definido
em (2.2). O estimador definido em (3.5) ser´a chamado de pseudo-periodograma robusto
truncado por n˜ao apresentar, para tamanhos de amostra finitos, as mesmas propriedades
do periodograma usual definido em (2.1).
3.1.3 Estimador robusto do parˆametro de mem´oria longa
Como no caso do estimador GPH, o estimador robusto de d ´e obtido utilizando a
aproxima¸ao em (2.8), que sugere a equa¸ao de regress˜ao
ln
I(λ
j
) β
0
+ β
1
ln
2sin
λ
j
2

2
+ e
j
,j=1, 2,...,g(n),
onde β
0
=lnf
u
(0), β
1
= d eostermosdeerro{e
j
} ao assintoticamente n˜ao correlaciona-
dos. O estimador GPH robusto pode ser escrito como
d
GP HR
=
g(n)
i=1
(x
i
¯x)ln
I(λ
i
)
g(n)
i=1
(x
i
¯x)
2
, (3.6)
onde x
i
=ln
2sin
λ
j
2

2
e g(ne como definido anteriormente.
Aestima¸ao robusta do parˆametro de mem´oria longa, na erie contaminada, ao
elimina o efeito dos outliers nos dados. Por esta raz˜ao sugere-se o uso de uma metodologia
alternativa para o alculo das estimativas dos parˆametros auto-regressivos e de edias
oveis do modelo ajustado atrav´es da fun¸ao de autocorrela¸ao robusta em (3.4).
3.2 Procedimento para estima¸ao dos parˆametros do modelo
ARFIMA
Aidentica¸ao e a estima¸ao dos parˆametros auto-regressivos e de m´edias m´oveis
podem ser realizadas atrav´es dos seguintes passos:
22
1. Estimar d no modelo ARFIMA(p, d, q) utilizando o estimador GPH robusto, por exem-
plo,
ˆ
d = d
GP HR
.
2. Calcular
U
t
=(1 B)
ˆ
d
y
t
.
3. Atraes da rela¸ao funcional Φ(B)
U
t
(B)
t
, utilizar o procedimento Box-Jenkins
(Box et al. 1994), para identifica¸ao e estima¸ao dos parˆametros φ
1
2
,...,φ
p
e
θ
1
2
,...,θ
q
no modelo ARMA(p, q).
Nota: Aestima¸ao obtida no Passo 1 ao elimina o efeito do outlier na s´erie. Por-
tanto, neste passo sugere-se usar ρ(λ) no sistema de equa¸oes de Yule-Walker para
obten¸ao das estimativas dos parˆametros do modelo ARMA(p, q).
4. Fazer verifica¸ao da adequa¸ao do modelo (por exemplo, an´alise de res´ıduos).
23
CAP
´
ITULO 4
Resultados de Simula¸ao
Este cap´ıtulo dedica-se `a apresenta¸ao de resultados de simula¸ao com o objetivo de
analisar o comportamento do estimador robusto proposto em amostras finitas. Nos estudos
de simula¸ao foram comparadas as estimativas obtidas atrav´es dos estimadores d
GP H
e
d
GP HR
, definidos em (2.9) e (3.6), respectivamente. Os dados gerados ao provenientes
de um processo ARFIMA(p, d, q)parad =0.3e0.45, com tamanhos de amostra n =
100, 300, 800 e 3000. Nas s´eries contaminadas, os dados at´ıpicos foram gerados utilizando
probabilidades de ocorencia p =0.05 e 0.1 e magnitudes ω =3, 5 e 10.
O valor de β, necess´ario para o alculo de κ(s) utilizado na obten¸ao do estimador
robusto, foi selecionado empiricamente atraes da minimiza¸ao dos erros quadr´aticos edios
(EQM) das estimativas do parˆametro de integra¸ao fracion´aria. Como mostra a Figura 4.1,
β =0.e um valor adequado. O valor do bandwidth para d
GP H
e d
GP HR
foi calculado
utilizando α =0.5, 0.7. Os resultados de simula¸ao foram obtidos atrav´es da linguagem de
programa¸ao Ox verao 4.02, realizando 1000 repeti¸oes para cada experimento de Monte
Carlo e calculando a m´edia, o desvio padr˜ao e o EQM das estimativas.
24
0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.005 0.010 0.015 0.020 0.025 0.030 0.035
β
EQM
(a) Dados sem contamina¸ao
0.3 0.4 0.5 0.6 0.7 0.8 0.9
0.01 0.02 0.03 0.04
β
EQM
(b) Dados contaminados
Figura 4.1: Sele¸ao do bandwidth do estimador robusto pelo crit´erio do menor EQM para
um ARFIMA(0,d,0) com d =0.3 e tamanhos de amostra 100 (linha olida), 300 (linha
tracejada) e 800 (linha pontilhada).
4.1 Modelo ARFIMA(0,d,0)
Na Tabela 4.1 s˜ao apresentadas as estimativas obtidas utilizando d
GP H
e d
GP HR
para
d =0.3, 0.45 e α = β =0.7. As colunas correspondentes a d
GP Hc
e d
GP HRc
correspondem
`as estimativas do parˆametro d obtidas apartir das s´eries contaminadas.
Os resultados num´ericos evidenciam a sensibilidade do estimador GPH `apresen¸ca
de outliers; esse estimador subestima o verdadeiro valor do parˆametro d, causando aumento
significativo no vi´es das estimativas obtidas quando a s´erie temporal cont´em outliers.Como
mostrado na Se¸ao 2.3.1, os resultados te´oricos est˜ao em consonˆancia com a evidˆencia
nuerica aqui apresentada e sugerem que ao ´e adequada a utiliza¸ao do estimador d
GP H
quandoas´erie temporal possui dados at´ıpicos.
As propriedades estat´ısticas do estimador robusto sugerem que ele ´e um estimador
alternativo atraente para o parˆametro de integra¸ao fracion´aria em s´eries temporais com
outliers. Quando o tamanho de amostra aumenta as propriedades de d
GP HR
melhoram
significativamente, como ilustrado na Figura 4.2.
Os resultados contidos na Tabela 4.2 sugerem que o vi´es do estimador d
GP Hc
´e fun¸ao
da magnitude ω.Ovi´es do estimador d
GP HRc
manem-se, por outro lado, praticamente
inalterado, mesmo para magnitudes relativamente grandes.
25
d n d
GP H
d
GP H
c
d
GP HR
d
GP HR
c
100 edia 0.2988 0.1134 0.2584 0.2449
desvio padr˜ao 0.1735 0.1619 0.1558 0.1556
vi´es 0.0012 0.1866 0.0416 0.0551
EQM 0.0301 0.0610 0.0260 0.0272
300 edia 0.3062 0.1007 0.2907 0.2837
0.30
desvio padr˜ao 0.1005 0.0978 0.0926 0.0960
vi´es 0.0062 0.1993 0.0093 0.0163
EQM 0.0101 0.0493 0.0087 0.0095
800 edia 0.3003 0.1184 0.2949 0.2869
desvio padr˜ao 0.0679 0.0715 0.0573 0.0610
vi´es 0.0003 0.1816 0.0051 0.0131
EQM 0.0046 0.0381 0.0033 0.0039
100 edia 0.4561 0.1923 0.3975 0.3778
desvio padr˜ao 0.1722 0.1727 0.1506 0.1433
vi´es 0.0061 0.2577 0.0525 0.0722
EQM 0.0297 0.0962 0.0254 0.0258
300 edia 0.4594 0.2015 0.4329 0.4233
0.45
desvio padr˜ao 0.0986 0.0976 0.1041 0.1013
vi´es 0.0094 0.2485 0.0171 0.0267
EQM 0.0098 0.0713 0.0111 0.0110
800 edia 0.4620 0.2306 0.4457 0.4349
desvio padr˜ao 0.0688 0.0809 0.0562 0.0576
vi´es 0.0121 0.2194 0.0043 0.0151
EQM 0.0049 0.0547 0.0032 0.0035
Tabela 4.1: Estimativas do parˆametro d obtidas para um modelo ARFIMA(0,d,0) com
α = β =0.7eω =0, 10.
4.2 Modelo ARFIMA(p, d, q)
Aestima¸ao dos parˆametros para o modelo ARFIMA(p, d, q) foi realizada seguindo
ametodologiasugeridanaSe¸ao 3.2. Na Tabela 4.3 s˜ao apresentadas as estimativas do
parˆametro d considerando um modelo ARFIMA(1,d,0) para d =0.3eφ =0.2, 0.5, 0.7. Os
resultados obtidos mostram uma tendˆencia do estimador d
GP H
a superestimar o valor do
parˆametro d para valores de φ pr´oximos de 1. Isto pode ser explicado atrav´es do c´alculo da
densidade espectral do processo ARMA(1, 0), dada por
f
y
(λ)=
σ
2
2π(1 2φ cos λ + φ
2
)
,
26
GPH GPHR GPHc GPHRc
−0.1 0.0 0.1 0.2 0.3 0.4 0.5
(a) Tamanho de amostra n = 300
GPH GPHR GPHc GPHRc
0.1 0.2 0.3 0.4
(b) tamanho de amostra n = 3000
Figura 4.2: Estimativas do parˆametro d para tamanhos de amostra n = 300, 3000 obti-
das pelos estimadores para dados contaminados (GPHc e GPHRc, respectivamente) e sem
contamina¸ao (GPH e GPHR).
ω n d
GP H
c
d
GP HR
c
3 100 edia 0.3747 0.3799
desvio padr˜ao 0.1953 0.1513
vi´es 0.0753 0.0701
EQM 0.0438 0.0278
800 edia 0.4080 0.4309
desvio padr˜ao 0.0679 0.0576
vi´es 0.0419 0.0191
EQM 0.0064 0.0037
5 100 edia 0.3108 0.3741
desvio padr˜ao 0.1934 0.1452
vi´es 0.1392 0.0759
EQM 0.0567 0.0268
800 edia 0.3526 0.4270
desvio padr˜ao 0.0846 0.0568
vi´es 0.0974 0.0229
EQM 0.0166 0.0038
10 100 edia 0.1923 0.3778
desvio padr˜ao 0.1727 0.1433
vi´es 0.2577 0.0722
EQM 0.0962 0.0258
800 edia 0.2306 0.4349
desvio padr˜ao 0.0809 0.0576
vi´es 0.2194 0.0151
EQM 0.0547 0.0035
Tabela 4.2: Estimativas do parˆametro d =0.45 obtidas no modelo ARFIMA(0,d,0) com
ω =3, 5, 10 e α = β =0.7.
27
resultado imediato da equao (2.4). Utilizando (2.6), tem-se que o espectro do processo
ARFIMA(1,d,0) ´e aproximadamente
f(λ)
λ
2d
(1 φ)
2
, quando λ 0.
Oparˆametro auto-regressivo positivo contribui para o aumento de mem´oria do processo,
isto ´e, as correla¸oes tornam-se mais significativas do que as do processo ARFIMA(0,d,0);
analogamente, quando φ 1, f(λ) →∞.
O espectro do processo ARFIMA(1,d,0) contaminado pode ser diretamente obtido
a partir do Corol´ario 1, sendo dado por
f
z
(λ)
λ
2d
(1 φ)
2
+
1
2π
m
i=1
ω
2
i
p
i
, quando λ 0.
Note, com base em f(λ)ef
z
(λ)paraλ nas proximidades de zero, que os valores de f
z
(λ)
ser˜ao maiores que os valores obtidos para f(λ), i.e., f
z
(λ) f(λ). (O s´ımbolo ”denota
“muito maior que”.)
Resultados num´ericos sobre a estima¸ao do parˆametro d na presen¸ca de componentes
auto-regressivos e de m´edias oveis podem ser encontrados em Reisen (1994) e Reisen et al.
(2001).
A influˆencia conjunta dos efeitos da inclus˜ao do termo auto-regressivo e da transla¸ao
na densidade espectral, causada pela presen¸ca dos dados at´ıpicos, pode conduzir a estimati-
vas esp´urias do parˆametro de integra¸ao fracion´aria. Note, por exemplo, na Tabela 4.3 que
quando φ =0.7, n = 800 e ω = 10, a estimativa m´edia fornecida pelo estimador GPH com
dados contaminados ´e0.3098, significativamente pr´oxima do valor verdadeiro do parˆametro
d. Quando ω = 20, todavia, o valor m´edio das estimativas fornecidas pelo mesmo estimador
cai para 0.2366.
As evidˆencias num´ericas mostram ainda que, para tamanhos de amostras relativa-
mente grandes, o estimador d
GP HR
manem a robustez na estima¸ao do parˆametro d para
omodeloARFIMA(1,d,0). Seguindo a metodolog´ıa apresentada na Se¸ao 3.2, a Tabela 4.4
apresenta as estimativas obtidas para o parˆametro auto-regressivo utilizando os diferentes
estimadores para a fun¸ao de autocorrela¸ao (cl´assico e robusto) nas equa¸oes de Yule-
Walker. Aqui,
φ e
φ denotam as estimativas do parˆametro φ utilizando ρ(h)eρ(h), respec-
28
tivamente. Analogamente, as estimativas para as s´eries contaminadas ao denotadas por
φ
c
e
φ
c
, respectivamente.
Os resultados obtidos favorecem a utiliza¸ao do estimador robusto da FAC no pro-
cesso de estima¸ao dos parˆametros auto-regressivos em s´eries temporais na presen¸ca de
dados at´ıpicos.
29
φ n d
GP H
d
GP H
c
d
GP HR
d
GP HR
c
0.2 100 edia 0.3596 0.1527 0.2735 0.2413
desvio padr˜ao 0.2829 0.2943 0.2633 0.2479
vi´es 0.0596 0.1473 0.0265 0.0587
EQM 0.0836 0.1083 0.0700 0.0649
300 edia 0.3090 0.1739 0.2532 0.2536
desvio padr˜ao 0.2150 0.2288 0.1901 0.1874
vi´es 0.0090 0.1261 0.0468 0.0464
EQM 0.0463 0.0683 0.0383 0.0373
800 edia 0.3065 0.1926 0.2687 0.2610
desvio padr˜ao 0.1451 0.1471 0.1292 0.1323
vi´es 0.0065 0.1074 0.0313 0.0390
EQM 0.0211 0.0332 0.0177 0.0190
0.5 100 edia 0.4539 0.2642 0.3533 0.3440
desvio padr˜ao 0.2927 0.2862 0.2341 0.2528
vi´es 0.1539 0.0358 0.0533 0.0439
EQM 0.1094 0.0832 0.0577 0.0659
300 edia 0.3409 0.2574 0.2872 0.2839
desvio padr˜ao 0.2159 0.2070 0.1793 0.1756
vi´es 0.0409 0.0426 0.0128 0.0161
EQM 0.0483 0.0447 0.0323 0.0311
800 edia 0.3179 0.2536 0.2808 0.2701
desvio padr˜ao 0.1459 0.1562 0.1306 0.1254
vi´es 0.0179 0.0464 0.0192 0.0299
EQM 0.0216 0.0265 0.0174 0.0166
0.7 100 edia 0.5848 0.4522 0.4593 0.4436
desvio padr˜ao 0.3356 0.3599 0.2464 0.2475
vi´es 0.2848 0.1522 0.1593 0.1436
EQM 0.1938 0.1527 0.0861 0.0819
300 edia 0.4299 0.3694 0.3841 0.3731
desvio padr˜ao 0.2046 0.2021 0.1957 0.1853
vi´es 0.1299 0.0694 0.0841 0.0731
EQM 0.0587 0.0457 0.0454 0.0397
800 edia 0.3410 0.3098 0.3150 0.3062
desvio padr˜ao 0.1443 0.1423 0.1407 0.1357
vi´es 0.0409 0.0098 0.0149 0.0062
EQM 0.0225 0.0203 0.0200 0.0185
Tabela 4.3: Estimativas do parˆametro d obtidas por
ˆ
d
GP H
,
ˆ
d
GP Hc
,
ˆ
d
GP HR
e
ˆ
d
GP HRc
para
omodeloARFIMA(1, 0.3, 0) com φ =0.2, 0.5, 0.7, ω =0, 10, α =0.5eβ =0.7.
30
φ
d n
φ
φ
c
φ
φ
c
0.2 0.2413 100 edia 0.1653 0.0437 0.1663 0.1520
desvio padr˜ao 0.1188 0.1116 0.1368 0.1308
vi´es 0.0347 0.1563 0.0338 0.0480
EQM 0.0153 0.0369 0.0199 0.0194
0.2536 300 edia 0.1948 0.0324 0.1918 0.1820
desvio padr˜ao 0.0643 0.0509 0.0709 0.0772
vi´es 0.0052 0.1676 0.0086 0.0179
EQM 0.0042 0.0307 0.0051 0.0063
0.2610 800 edia 0.1959 0.0414 0.1951 0.1873
desvio padr˜ao 0.0351 0.0371 0.0394 0.0397
vi´es 0.0041 0.1586 0.0049 0.0127
EQM 0.0012 0.0265 0.0016 0.0017
0.7 0.4510 100 edia 0.6406 0.2559 0.6445 0.6158
desvio padr˜ao 0.0959 0.2085 0.0997 0.1057
vi´es 0.0594 0.4441 0.0555 0.0842
EQM 0.0127 0.2407 0.0130 0.0183
0.3534 300 edia 0.6838 0.1981 0.6829 0.6579
desvio padr˜ao 0.0443 0.0889 0.0502 0.0556
vi´es 0.0162 0.5019 0.0171 0.0421
EQM 0.0022 0.2598 0.0028 0.0049
0.3049 800 edia 0.6955 0.2092 0.6943 0.6719
desvio padr˜ao 0.0245 0.0613 0.0265 0.0271
vi´es 0.0045 0.4908 0.0057 0.0281
EQM 0.0006 0.2446 0.0007 0.0015
Tabela 4.4: Estimativas do parˆametro φ paraomodeloARFIMA(1,d,0) com ω =0, 10,
α =0.5eβ =0.7paraass´eries diferenciadas com as estimativas obtidas pelos estimadores
d
GP H
e d
GP HR
.
31
CAP
´
ITULO 5
Aplica¸oes
Neste cap´ıtulo apresentamos duas aplica¸oes da metodologia descrita na Sao 3.2.
A primeira aplica¸ao utiliza a s´erie temporal do n´ıvel m´ınimo anual da beira do rio Nilo no
periodo que se estende de 622 a 1284 D.C. Na literatura, tem sido sugerido que os modelos
ARFIMA(0,d,0) ao adequados para analisar esse conjunto de dados (ver Figura 5.1).
Para efeitos de comparao com a estimativa obtida atraes do estimador apresentado no
Cap´ıtulo 3, a Tabela 5.1 mostra as estimativas do parˆametro de diferˆen¸ca fracion´aria atrav´es
dos estimadores propostos por Agostinelli & Bisaglia (2003), Beran (1994) e Robinson
(1994).
d
Robinson (1994) 0.4338
Beran (1994)
0.4000
Agostinelli & Bisaglia (2003)
0.4160
GPH Robusto (d
GP HR
) 0.4161
Tabela 5.1: Valores das estimativas do parˆametro d para os dados do rio Nilo.
Observa-se que o valor obtido por d
GP HR
est´a consideravelmente pr´oximo do valor
32
fornecido pelo estimador de Agostinelli & Bisaglia (2003), indicando, assim, que ao ´e
necess´ario utilizar toda a informa¸ao do espectro, como no caso dos estimadores param´etricos,
para obter boas estimativas do parˆametro d.
622 722 822 922 1022 1122 1222
1000 1200 1400
0 10203040506070
−0.1 0.1 0.3 0.5
FAC
0 10203040506070
−0.1 0.1 0.3 0.5
FACP
Figura 5.1: Dados do n´ıvel do rio Nilo e fuoes amostrais de autocorrela¸ao.
A segunda aplica¸ao utiliza a taxa mensal de varia¸ao do
´
Indice Nacional de Pre¸cos
ao Consumidor Amplo (IPCA) do Brasil. O IPCA ´e a medida de infla¸ao utilizada pelo
Banco Central do Brasil (BCB) para orientar sua pol´ıtica monet´aria, ou seja, ´e a medida
de infla¸ao que o BCB observa quando estabelece a taxa Selic.O´ındice ´e calculado a partir
de uma cesta de consumo m´edia de fam´ılias que recebem entre 1 e 40 sal´arios m´ınimos, a
responsabilidade pela sua constrao sendo do Instituto Brasileiro de Geografia e Estat´ıstica
(IBGE). O per´ıodo aqui considerado se estende de janeiro de 1995 a outubro de 2006. Como
pode ser observado na Figura 5.2, o valor para o mˆes de novembro do ano 2002 parece ser
um dado at´ıpico de tipo aditivo. A fun¸ao de autocorrela¸ao amostral sugere que o processo
gerador dos dados ´eARIMAfracion´ario.
Seguindo a metodologia apresentada na Se¸ao 3.2, as estimativas do parˆametro de
difereca fracion´aria obtidas atraes dos estimadores d
GP H
e d
GP HR
ao 0.181 e 0.315, res-
pectivamente. Utilizando os ltros de diferen¸ca fracion´aria e as estimativas obtidas para
oparˆametro d,ass´eries diferenciadas ao dadas por:
U
GP H,t
=(1 B)
d
GP H
IPCA
t
e
33
U
GP H R,t
=(1 B)
d
GP H R
IPCA
t
. Posteriormente `a filtragem, foram identificadas as ordens
das componentes auto-regressivas (p)edem´edias oveis (q) usando o crit´erio de informa¸ao
de Akaike corrigido (AICC); ver, e.g., Brockwell & Davis (2006). Os valores do crit´erio AICC
ao apresentados na Tabela 5.2. Observa-se que o menor AICC obtido para as duas eries
diferenciadas foi associado ao modelo ARMA(1, 0).
jan/95 ago/96 abr/98 dez/99 ago/01 abr/03 dez/04 ago/06
−0.5 0.5 1.5 2.5
0 10203040506070
−0.2 0.0 0.2 0.4 0.6
FAC
0 10203040506070
−0.2 0.0 0.2 0.4 0.6
FACP
Figura 5.2: Dados IPCA e fun¸oes amostrais de autocorrela¸ao.
Utilizando as equoes de Yule-Walker, os modelos ajustados s˜ao:
U
GP H,t
=0.4718
U
GP H,t1
,
U
GP H R,t
=0.2999
U
GP H R,t1
,
onde os erros-padr˜ao dos parˆametros estimados ao 0.0789 e 0.0728, respectivamente.
Foram realizados testes de adequao do ajuste para verificar o comportamento de
ru´ıdo branco dos res´ıduos nos modelos ajustados. Os testes Ljung-Box (GPH: p-valor=
0.1634, GPHR: p-valor= 0.1369) e McLeod - Li (GPH: p-valor= 0.9985 e GPHR: p-
valor= 0.9980) confirmam a ausˆencia de autocorrela¸ao serial nos dados. O teste de Jarque-
Bera rejeita, em ambos os modelos, a hip´otese de normalidade dos res´ıduos aos n´ıveis usuais
de significˆancia, o que pode ser confirmado atraes dos gr´aficos quantil-quantil apresentados
na Figura 5.3.
34
GP H GPHR
Modelo AICC Modelo AICC
ARMA(1, 0) 129.99 ARMA(1, 0) 128.46
ARMA(1, 1)
130.72 ARMA(2, 0) 128.67
ARMA(2, 0)
130.87 ARMA(1, 1) 129.14
ARMA(3, 0)
131.07 ARMA(3, 0) 129.64
ARMA(2, 1)
132.88 ARMA(2, 1) 131.33
ARMA(3, 1)
134.29 ARMA(3, 1) 132.93
ARMA(1, 3)
137.01 ARMA(1, 2) 133.09
ARMA(1, 2)
137.41 ARMA(1, 3) 135.01
ARMA(2, 2)
138.89 ARMA(2, 3) 137.68
ARMA(2, 3)
139.93 ARMA(2, 2) 140.77
ARMA(3, 2)
146.76 ARMA(3, 2) 144.16
ARMA(3, 3)
152.17 ARMA(3, 3) 152.03
Tabela 5.2: Valores do crit´erio AICC obtidas na determinao das ordens p e q a partir das
eries
U
GP H,t
e
U
GP H R,t
.
−2 −1 0 1 2
−0.5 0.0 0.5 1.0 1.5 2
.0
quantis normais
residuos GPH
(a) Res´ıduos modelo ARMA(1, 0) para
b
U
GP H,t
−2 −1 0 1 2
−1.0 −0.5 0.0 0.5 1.0 1.5
quantis normais
residuos GPH robusto
(b) Res´ıduos modelo ARMA(1, 0) para
b
U
GP HR,t
Figura 5.3: Gr´aficos quantil-quantil dos res´ıduos dos modelos ARMA(1, 0) com bandas de
confiaca de 95%.
Observa-se que os res´ıduos obtidos para o modelo ARMA(1, 0) atrav´es do estimador
d
GP HR
apresentam comportamento menos irregular do que os res´ıduos obtidos atrav´es
do estimador d
GP H
, fazendo com que uma maior quantidade de res´ıduos esteja entre as
bandas de confian¸ca indicativas de normalidade. Cabe ressaltar que a an´alisederes´ıduos
foi realizada para cada um dos modelos apresentados na Tabela 5.2, mas nenhum deles
35
conseguiu satisfazer a suposi¸ao de normalidade.
os comparamos os desempenhos preditivos dos modelos ARFIMA(1,d,0) com d =
d
GP H
=0.181 e d = d
GP HR
=0.315. As medidas estat´ısticas consideradas para a avalia¸ao
das previs˜oes ao: erro quadr´atico edio (EQM) e erro total (ET). O erro total ´e a diferen¸ca
entre a soma das observoes e a soma das previs˜oes. Cada medida ´e calculada para previs˜oes
1, 6 e 12 passos `a frente e os resultados encontram-se apresentados na Tabela 5.3.
Passos Crit´erio GPH GPHR
1 EQM 0.0067 0.0007
ET 0.0816 0.0258
6 EQM 0.1340 0.0797
ET 1.8741 1.1877
12 EQM 0.0863 0.0529
ET 2.8353 1.8421
Tabela 5.3: Medidas de precis˜ao das previs˜oes para 1, 6 e 12 passos `afrente.
Observa-se, com o crit´erio do EQM, que as previs˜oes obtidas com o estimador GP HR
apresentam maior precis˜ao tanto para horizontes de previs˜ao curtos quanto para horizontes
longos. A mesma concluao ´e obtida quando o crit´erio da avalia¸ao ´e o erro total.
Dos resultados anteriores, pode-se concluir que o estimador d
GP HR
constitui uma boa
op¸ao para estimar o parˆametro d na preseca de outliers de tipo aditivo; adicionalmente,
a metodologia sugerida na Sao 3.2 ´util no que tange `aestima¸ao dos parˆametros do
modelo ARFIMA em presen¸ca de dados at´ıpicos.
36
CAP
´
ITULO 6
Conclus˜oes
A presente disserta¸ao apresenta uma metodologia robusta para a estima¸ao dos
parˆametros do modelo ARFIMA(p, d, q)ems´eries temporais na presen¸ca de outliers do
tipo aditivo. A metodologia ´e baseada num procedimento semi-param´etrico realizado em
dois passos. No primeiro passo, estima-se o parˆametro de integra¸ao fracion´aria atrav´es da
regress˜ao do logaritmo do pseudo-periodograma truncado representado pela equao (3.5).
Posteriormente, estimam-se os parˆametros auto-regressivos e de m´edias oveis a partir do
estimador robusto da fun¸ao de autocovarancia, sugerido por Ma & Genton (2000).
Os resultados te´oricos e as evidˆencias emp´ıricas mostram a sensibilidade do estimador
GPH `apresen¸ca de dados at´ıpicos, indicando que este ao ´e um estimador apropriado para
aestima¸ao do parˆametro d na preseca desse tipo de dados. Nosso estimador robusto apre-
senta propriedades estat´ısticas desej´aveis no que concerne `aestima¸ao do parˆametro d em
eries temporais com propriedade de mem´oria longa contaminadas por outliers do tipo adi-
tivo. As evidˆencias num´ericas sugerem que o m´etodo robusto proposto ´e um procedimento
alternativo atraente para a estima¸ao dos parˆametros de um modelo ARFIMA(p, d, q)com
propriedade de mem´oria longa.
37
Referˆencias Bibliogr´aficas
Agostinelli, C. & Bisaglia, L. (2003), Robust estimation of ARFIMA processes, Technical
report, Universit`aC`a Foscari di Venezia.
Baillie, R. (1996), ‘Long memory process and fractional integration in econometrics’, Jour-
nal of Econometrics 73, 5–59.
Baillie, R. T. & Chung, S. (2002), ‘Modeling and forecasting from trend-stationary long
memory models with applications to climatology’, International Journal of Forecasting
18, 215–226.
Barkoulas, J. T. & Baum, C. F. (1998), ‘Fractional dynamics in Japanese financial time
series’, Pacific-Basin Finance Journal 6, 115–124.
Beran, J. (1994), ‘On a class of M-estimators for Gaussian long-memory models’, Biometrika
81, 755–766.
Beran, J. (1995), ‘Maximum likelihood estimation of the differencing parameter for invert-
ible short and long memory autoregressive integrated moving average models’, Journal
of the Royal Statistical Society 57(B), 659–672.
Bhardwaj, G. & Swanson, N. (2006), ‘An empirical investigation of the usefulness of
38
ARFIMA models for predicting macroeconomic and financial time series’, Journal of
Econometrics 131, 539–578.
Bisaglia, L. & Gu´egan, D. (1998), ‘A comparison of techniques of estimation in long-memory
process’, Computational Statistics & Data Analysis 27, 61–81.
Box, G., Jenkins, G. & Reinsel, G. (1994), Time Series Analysis: Forecasting and Control,
third edn, Prentice Hall.
Box, G. & Tiao, G. C. (1975), ‘Intervention analysis with applications to economic and
enviromental problems’, Journal of the American Statistical Association 70, 70–79.
Brockwell, P. & Davis, R. (2002), Introduction to Time Series and Forecasting, second edn,
Springer Verlag.
Brockwell, P. & Davis, R. (2006), Time Series: Theory and Methods, second edn, Springer
Verlag.
Chan, W. (1992), ‘A note on time series model specification in the presence outliers’, Journal
of Applied Statistics 19, 117–124.
Chan, W. (1995), ‘Outliers and financial time series modelling: a cautionary note’, Mathe-
matics and Computers in Simulation 39, 425–430.
Chang, I., Tiao, G. C. & Chen, C. (1988), ‘Estimation of time series parameters in presence
of outliers’, Technometrics 30, 1936–204.
Chen, C. & Liu, L. (1993a), ‘Forecasting time series with outliers’, Journal of Forecasting
12, 13–35.
Chen, C. & Liu, L. (1993b), ‘Joint estimation of model parameters and outlier effects in
time series’, Journal of the American Statistical Association 88, 284–297.
Croux, C. & Rousseeuw, P. J. (1992), ‘Time-efficient algorithms for two highly robust
estimators of scale’, Computational Statistics 1, 1–18.
39
Cunado, J., Gil-Alana, L. A. & eres de Gracia, F. (2004), ‘Real convergence in Taiwan: a
fractionally integrated approach’, International Review of Financial Analysis 13, 265–
276.
Dahlhaus, R. (1989), ‘Efficient parameter estimation for self-similar processes’, The Annals
of Statistics 17, 1749–1766.
Deutsch, S. J., Richards, J. E. & Swain, J. (1990), ‘Effects of a single outlier on ARMA
identification’, Communications in Statistics: Theory and Methods 19, 2207–2227.
Doukhan, P., Oppenheim, G. & Taqqu, M. (2003), Theory and Applications of Long-Range
Dependence,Birkh¨auser.
Fox, A. J. (1972), ‘Outliers in time series’, Journal of the Royal Statistical Society
34(B), 350–363.
Fox, R. & Taqqu, M. S. (1986), ‘Large-sample properties of parameters estimates for
strongly dependent stationary gaussian time series’, The Annals of Statistics 14, 517–
532.
Franses, P. H. & Ooms, M. (1997), ‘A periodic long-memory model for quarterly UK infla-
tion’, International Journal of Forecasting 13, 117–126.
Geweke, J. & Porter-Hudak, S. (1983), ‘The estimation and application of long memory
time series model’, Journal of Time Series Analysis 4, 221–238.
Gil-Alana, L. A. (2004), ‘Long memory in the U.S. interest rate’, International Review of
Financial Analysis 13, 265–276.
Granger, C. W. J. & Joyeux, R. (1980), ‘An introduction to long-memory time series models
and fractional differencing’, Journal of Time Series Analysis 1, 15–30.
Haldrup, N. & Nielsen, M. O. (2007), ‘Estimation of fractional integration in the presence
of data noise’, Computational Statistics & Data Analysis 51, 3100–3114.
Hauser, M. (1999), ‘Maximum likelihood estimators for ARMA and ARFIMA models: a
Monte Carlo study’, Journal of Statistical Planning and Inference 80, 229–255.
40
Hosking, J. R. (1981), ‘Fractional differencing’, Biometrika 68, 165–176.
Huber, P. J. (2004), Robust Statistics, third edn, John Wiley & Sons.
Hurvich, C. M., Deo, R. & Brodsky, J. (1998), ‘The mean square error of Geweke and
Porter-Hudak’s estimator of the memory parameter of a long-memory time series’,
Journal of Time Series Analysis 19, 19–46.
Ledolter, J. (1989), ‘The effect of additive outliers on the forecast from ARMA models’,
International Journal of Forecasting 5, 231–240.
Lobato, I. & Robinson, P. M. (1996), ‘Averaged periodogram estimation of long memory’,
Journal of Econometrics 73, 303–324.
Ma, Y. & Genton, M. (2000), ‘Highly robust estimation of the autocovariance function’,
Journal of Time Series Analysis 21, 663–684.
Priestley, M. B. (1983), Spectral Analysis and Time Series, Academic Press.
Reisen, V. (1994), Estimation of the fractional difference parameter in the ARIMA(p, d, q)
model using the smoothed periodogram’, Journal of Time Series Analysis 15, 335–350.
Reisen, V. A., Rodrigues, A. & Palma, W. (2006), ‘Estimation os seasonal fractionally
integrated processes’, Computational Statistics & Data Analysis 50, 568–582.
Reisen, V., Abraham, B. & Lopes, S. (2001), ‘Estimation of parameters in ARFIMA pro-
cesses: A simulation study’, Communications in Statistics: Simulation and Computa-
tion 30, 787–803.
Reisen, V., Abraham, B. & Toscano, E. (2000), ‘Parametric and Semiparametric Estima-
tions of Stationary Univariate ARFIMA Models’, Brazilian Journal of Probability and
Statistics 14, 185–206.
Reisen, V., Abraham, B. & Toscano, E. (2002), ‘Effect of parameter estimation on estima-
ting the forecast error variace in an ARFIMA processes: a simulation study and an
example’, Statistical Methods 4, 21–37.
41
Reisen, V., Cribari-Neto, F. & Jensen, M. (2003), ‘Long memory inflationary dynamics:
The case of brazil’, Studies in Nonlinear Dynamics & Econometrics 7, 1–16.
Robinson, P. M. (1994), ‘Semiparametric analysis of long-memory time series’, The Annals
of Statistics 22, 515–539.
Robinson, P. M. (1995a), ‘Gaussian semiparametric estimation of long range dependence’,
Annals of Statistics 23, 1630–1661.
Robinson, P. M. (1995b), ‘Log-periodogram regression of time series with long range depen-
dence’, Annals of Statistics 23, 1048–1072.
Rousseeuw, P. J. & Croux, C. (1993), ‘Alternatives to the median absolute deviation’,
Journal of the American Statistical Association 88, 1273–1283.
Smith, J., Taylor, N. & Yadav, S. (1997), ‘Comparing the bias and misspecification in
ARFIMA models’, Journal of Time Series Analysis 18, 507–527.
Sowell, F. B. (1992), ‘Maximum likelihood estimation of stationary univariate fractionally
integrated time series models’, Journal of Econometrics 53, 165–188.
Sun, Y. & Phillips, P. (2003), ‘Nonlinear log-periodogram regression for perturbed fractional
processes’, Journal of Econometrics 115, 355–389.
Tsay, R. S. (1986), ‘Time series model specification in the presence of outliers’, Journal of
the American Statistical Association 81, 132–141.
Velasco, C. (2000), ‘Non-Gaussian log-periodogram regression’, Econometric Theory 16, 44–
79.
Wei, W. (2005), Time Series Analysis: Univariate and Multivariate Methods, Addison
Wesley.
42
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo