Sobre a precisão das estimativas de máxima verossimilhança nas distribuições
bivariadas de valores extremos
1. Introdução
As distribuições bivariadas de valores extremos surgem como distribuições
limites de máximos (ou mínimos) normalizados. O objetivo na modelagem do
comportamento assintótico probabilístico dos extremos é obter boas aproximações
para a distribuição bivariada de extremos permitindo o estudo da ocorrência de
eventos extremos simultâneos. Os modelos bivariados são muito úteis em
aplicações práticas da teoria de valores extremos em diversas áreas, como, por
exemplo, na análise da interação entre a velocidade do vento e altura de ondas,
na análise do relacionamento entre a grandeza da temperatura e níveis de
colheita e, em particular na área financeira, no estudo do comportamento
conjunto de ativos compondo uma carteira, ou no estudo da dependência entre
mercados de ações. A aplicação da teoria de valores extremos em finanças pode
ser vista em Starica (1999), Embrechts (2000), entre vários outros.
Estudada desde os anos 20, a teoria de valores extremos possui resultados
importantes no caso univariado, como os obtidos por Fisher & Tippet (1928).
Contudo, somente a partir dos anos 50 e 60 é que ocorreram avanços no caso
bivariado através dos trabalhos de Gumbel (1954, 1958), Tiago de Oliveira
(1958, 1962) e Sibuya (1960). Em Tawn (1988) vemos o desenvolvimento de modelos
bivariados de valores extremos, como os modelos logístico e misto assimétricos.
Recentemente, a modelagem de extremos multivariados tem recebido mais atenção,
veja, por exemplo, Embrechts, de Haan & Huang (2000).
De acordo com a literatura em valores extremos bivariados, a modelagem da
estrutura de dependência entre os extremos pode ser feita via modelos
paramétricos ou não-paramétricos. Os modelos paramétricos são de dois tipos:
diferenciáveis e não-diferenciáveis. Os modelos paramétricos diferenciáveis são
classificados em duas famílias: logística e mista, que por sua vez contêm
modelos simétricos e assimétricos. A estimação dos parâmetros é em geral feita
pelo método da máxima verossimilhança. Resultados sobre o comportamento
assintótico dos estimadores de máxima verossimilhança, em particular nas
fronteiras do espaço paramétrico relacionada com a independência, podem ser
vistas em Smith (1985) e Tawn (1988), entre outros.
Como estamos trabalhando com a teoria assintótica, algumas questões surgem
naturalmente. Será que o tamanho das amostras é suficientemente grande para
garantir uma boa qualidade dos ajustes? Ou, ao considerarmos medidas de
dependência, qual a variabilidade de suas estimativas? Como essa variabilidade
mudaria as conclusões feitas?
Para responder as questões acima e obter a variabilidade empírica das
estimativas pode-se usar esquemas de bootstrap e simulações Monte Carlo. O
método bootstrap, proposto por Efron (1979), baseia-se em reamostragens a
partir da amostra original. Essa técnica é especialmente útil para lidar com
problemas estatísticos envolvendo amostras de tamanho pequeno e aqueles
envolvendo estimadores cuja distribuição (exata ou assintótica) ainda não foi
obtida.
O nosso objetivo é acessar a qualidade e precisão das estimativas de máxima
verossimilhança dos parâmetros e de outras quantidades derivadas dos modelos
bivariados de valores extremos, dessa forma ajudando a estabelecer o quão
confiáveis são as estimativas e as conclusões retiradas das análises feitas com
esses modelos. É também de interesse investigar se existe ou não deteriorização
dessas estimativas, no sentido de um aumento na variabilidade, se diminuirmos
progressivamente o tamanho da amostra (de acordo com um certo critério,
explicado na Seção 6). Em outras palavras, investigamos como se manifesta nas
estimativas, o trade-off que existe ao se melhorar a qualidade da aproximação
da distribuição exata de extremos bivariados pela sua distribuição assintótica,
mas perdendo na qualidade das estimativas de máxima verossimilhança.
Na Seção 2 apresentamos os modelos paramétricos bivariados e suas propriedades.
Na Seção 3 discutimos o procedimento de estimação simultânea dos parâmetros
marginais e de dependência. Na Seção 4 revisamos o método bootstrap e
apresentamos os algoritmos utilizados nas aplicações. Na Seção 5 avaliamos a
qualidade das estimativas de máxima verossimilhança considerando os extremos
mensais. Calculamos intervalos de confiança bootstrap paramétricos e não-
paramétricos e os utilizamos na avaliação das estimativas de máxima
verossimilhança. Na Seção 6, repetimos todos os procedimentos da Seção 5, agora
com amostras menores. Também avaliamos através de simulações Monte Carlo com
esquemas de bootstrap a performance dos intervalos de confiança obtidos nas
seções 5 e 6. Finalmente, na última seção, apresentamos nossas conclusões.
2. Modelos Bivariados
No caso univariado temos o resultado fundamental de Fisher & Tippett (1928)
que fornece a distribuição limite dos máximos coletados em blocos. No caso
bivariado temos um resultado similar. Para definirmos os máximos bivariados,
sejam (Xi,Yi), i=1, 2, ..., variáveis aleatórias (v.a.) independentes e
identicamente distribuídas (i.i.d.) em Â2 com função de distribuição (f.d.)
bivariada F(·,·). Seja (M1n, M2n) o par de máximos coletados em blocos de
tamanho fixo n em cada componente, isto é, M1n = max {Xi,i=1,...,n} e M2n = max
{Yi,i=1,...,n}. Assim como o resultado no caso univariado, se existirem
seqüências de constantes normalizadoras ain > 0, bin Î Â, i =1,2 , tais que a
f.d. conjunta
convirja em distribuição para uma f.d. não degenerada W(x,y) quando n ® ¥,
então W(·,·) é uma distribuição bivariada de valores extremos. Neste caso cada
marginal segue uma distribuição de valores extremos generalizada com as mesmas
constantes normalizadoras.
Diferentemente do caso univariado, no caso multivariado não existe uma família
de distribuições paramétricas de dimensão finita para modelar a dependência
entre os máximos. Supondo a existência de uma função de dependência, e baseados
em restrições nesta função, vários modelos paramétricos (diferenciáveis e não
diferenciáveis) foram propostos na literatura. Modelos para o caso mais simples
de máximos bivariados são conhecidos desde Tiago de Oliveira (1958) e Sibuya
(1960). Pickands (1981) estabeleceu a relação de estabilidade para v.a.
exponenciais e propôs modelos para a função de dependência. Mais recentemente,
modelos para extremos multivariados e aplicações foram investigados, por
exemplo, em Coles & Tawn (1991), de Haan & Resnick (1993), e Ledford
& Tawn (1997), entre outros.
Os modelos investigados aqui assumem que as distribuições marginais sejam
exponenciais unitárias. Antes de introduzir os modelos daremos as notações
necessárias: Para qualquer f.d. F em Â, seja
(x) = 1 ' F(x) a sua função de sobrevivência. Por simplicidade,
denotaremos os máximos coletados em cada componente e em blocos de tamanho fixo
n por M1 e M2 e usaremos a mesma notação para os mínimos. Todos os
procedimentos de modelagem e estimação desenvolvidos para os máximos podem ser
aplicados aos valores absolutos dos mínimos. Então, para i=1,2, Mi segue uma
distribuição de valores extremos generalizada, denotada por [/img/revistas/
pope/v23n2/a04img02.gif], ou Hi, com f.d. conjunta W(·,·), e densidade conjunta
w(·,·).
Seja Ui = Ti(Mi) = , i = 1,2 , o máximo
transformado em v.a. exponencial unitária, com f.d. Gi, i = 1,2 , f.d. conjunta
G(·,·), e densidade conjunta g(·,·). Então [/img/revistas/pope/v23n2/
a04img04.gif](ui) = exp {'ui}, ui >0, e de acordo com a relação de max-
estabilidade para n > 1, (<formula/>(u1,u2))n = [/
img/revistas/pope/v23n2/a04img05.gif](nu1,nu2), onde G(u1,u2) = Pr
{U1>u1,U2>u2}. A densidade conjunta dos máximos originais (M1, M2) é w(m1,m2) =
g(u1,u2)|J|, onde ui = Ti(mi), i = 1,2,J é o Jacobiano da transformação, mi Î
Â, si > 0, 0 < xi < 1, e <formula/>. Notemos que
as restrições em xi são necessárias porque as transformações Ti valem apenas
para xi > 0, e os procedimentos de estimação são válidos apenas para xi < 1
(Smith, 1985).
Pickands (1981) mostrou que a função de sobrevivência conjunta [/img/revistas/
pope/v23n2/a04img05.gif](·,·) pode ser escrita na forma
onde a função convexa A(·) deve satisfazer certas condições (veja Pickands
(1981) e Tawn (1988)). A(·) é a função de dependência das v.a. positivamente
associadas U1 e U2. Para v.a. absolutamente contínuas, a função A(·) possui,
entre outras, as propriedades A(0) = A(1) = 1 e max (v, 1'v) <A(v) < 1, para 0
< v < 1. Os dois máximos U1 e U2são permutáveis se e somente se A(·) é
simétrica em torno de 1/2.
A correlação linear (positiva) entre U1 e U2é dada por [/img/revistas/pope/
v23n2/a04img07.gif]. Uma medida de dependência alternativa é 2[1 ' A(1/2)], a
qual denotaremos por t. A medida t assume valores entre zero (independência) e
um (dependência completa). Ela é uma medida da dependência existente nos altos
quantis (quantis associados com probabilidades perto de um) da distribuição
bivariada dos extremos. Um ponto importante é que r se refere aos máximos
(mínimos) transformados U1 e U2e esta medida pode ser ligeiramente diferente
para os máximos (mínimos) originais M1 e M2, uma vez que o coeficiente de
correlação linear não é invariante sob transformações não-lineares.
Dentre os modelos existentes na literatura para modelar a função A(·),
destacam-se os modelos simétricos misto e logístico propostos por Gumbel
(1960), e suas extensões assimétricas propostas por Tawn (1988). Eles são:
1. Modelo Misto Simétrico: A1(v)=qv2'qv+1, 0<q<1. Independência
corresponde a q = 0. O coeficiente de correlação é [/img/revistas/
pope/v23n2/a04img08.gif] e t = [/img/revistas/pope/v23n2/
a04img09.gif]. E, ainda, possui função de sobrevivência conjunta [/
img/revistas/pope/v23n2/a04img05.gif](u1,u2) dada por:
2. Modelo Logístico Simétrico: A2(v) = [(1'v)r + vr]1/r, r > 1. O
valor r = 1 corresponde à independência e r = +¥ à dependência
completa. Aqui <formula/> e t = 2'21/r.
A função de sobrevivência conjunta é dada por
3. Modelo Misto Assimétrico: A3(v) = fv3 ' qv2 ' (q + f)v + 1; onde q
> 0, q + f < 1, q + 2f < 1, q + 3f > 0. Se f = 0 teremos o modelo
simétrico. Independência corresponde à q =f= 0. Aqui, [/img/revistas/
pope/v23n2/a04img10.gif]. A função de sobrevivência conjunta é dada
por
4. Modelo Logístico Assimétrico: A4(v) = [qr(1'v)r + frvr]1/r + (q '
f)v+1'q, para 0 < q, f < 1, r > 1. Este é um modelo flexível que
contém outros modelos. Se q =f= 1 temos novamente o modelo simétrico.
Independência corresponde à q = 0 ou f = 0 ou r = 1. Dependência
completa corresponde à q =f= 1 e r = +¥.Aqui t = q + f ' (qr + fr)1/
r. A função de sobrevivência conjunta é dada por
O modelo misto assimétrico é bastante simples, mas tem a grande vantagem de
possuir um parâmetro f associado com a assimetria ou a permutabilidade dos dois
máximos. Por outro lado, o modelo logístico assimétrico pode resultar em um
ajuste melhor, mas apresenta problemas de identificabilidade, os quais podem
ser contornados se fixarmos f = 1 ou q = 1.
3. Estimação
O método mais utilizado para a estimação dos parâmetros dos modelos bivariados
é o da máxima verossimilhança. Estes estimadores são os valores [/img/revistas/
pope/v23n2/a04img11.gif]> 0, <formula/> e [/img/
revistas/pope/v23n2/a04img13.gif] Î Â, i = 1,2, e [/img/revistas/pope/v23n2/
a04img14.gif](aqui b representa o vetor de parâmetros da função de dependência)
que maximizam a função de log-verossimilhança
onde mé o tamanho da amostra bivariada.
A existência e consistência dos estimadores de máxima verossimilhança dos
parâmetros marginais sob independência foram obtidas por Smith (1985). O
comportamento dos estimadores de máxima verossimilhança dos modelos bivariados
sob a suposição de que o parâmetro de forma em cada marginal é menor que 1/2, o
que corresponde ao caso onde o estimador de máxima verossimilhança dos
parâmetros marginais se comportam regularmente, foi inicialmente investigado
por Tawn (1988). Este autor mostrou que existindo dependência entre as
variáveis, o problema de estimação simultânea é regular. Provou a existência e
obteve a distribuição assintótica da solução global de máxima verossimilhança.
Além disto, mostrou que a matriz de covariância assintótica é diagonal e
sugeriu o uso da matriz de informação observada para obter a variância do
estimadores e para construir intervalos de confiança. Argumentou que o teste da
razão das verossimilhanças e o teste baseado na estatística escore (testes para
escolha de modelo e independência), obtidos quando o processo de estimação é em
duas etapas (marginais primeiro e função de dependência depois), podem também
ser usados no caso de estimação simultânea, uma vez que neste caso o
comportamento assintótico dos testes permanecem inalterados. Além disto, Tawn
(1988) obteve resultados semelhantes para o caso onde os dois parâmetros de
forma marginais são menores que 1.
Os resultados de Tawn (1988) mostram que é importante testar se existe
independência assintótica entre os extremos, já que o procedimento de máxima
verossimilhança tem comportamento não regular na fronteira do espaço
paramétrico associado à independência. Devemos ressaltar que em muitas
aplicações os máximos obtidos a partir de variáveis dependentes podem ser
independentes para n suficientemente grande. Para testar a independência
consideramos o teste escore dado por Tawn (1988).
Dado um modelo bivariado (3), (4), (5), ou (6), a estatística escore é [/img/
revistas/pope/v23n2/a04img16.gif], onde Lm(b) = Lm(b;(u1,1,u2,1),...,
(u1,m,u2,m)). A estatística escore normalizada converge em distribuição
(Feller, 1971) para uma v.a. normal padrão. Ou seja, temos que
onde b0 é o valor do parâmetro que corresponde a independência, Z é uma v.a.
normal padrão, e c denota a constante normalizadora para a estatística escore,
sendo c = <formula/> para o modelo logístico
simétrico e c = <formula/> para o modelo misto
simétrico.
O teste localmente mais poderoso de nível a rejeita a hipótese nula de
independência quando
onde F'1(·) é a inversa da normal padrão.
Por exemplo, considerando o modelo logístico simétrico, onde b0= r0= 1, temos
que
<formula/>(u1,u2) = log (u1,u2) + (u1+ u2 ' 2) log
(u1+ u2) ' u1 log (u1) ' u2 log (u2) + (u1+ u2)'1.
Para o modelo misto simétrico, onde b0 = q0 = 0, temos que
<formula/>(u1,u2) = u1u2(u1+ u2)'1 + 2u1u2(u1+
u2)'3 ' (<formula/>)(u1+ u2)'2.
Uma questão importante é a seguinte: o quanto aplicável é esse resultado
assintótico quando trabalhamos com amostras pequenas? Uma maneira de se medir a
qualidade da substituição da distribuição exata da estatística teste pela sua
aproximação assintótica é via comparação de alguns percentis. Esses percentis
para amostras pequenas podem ser obtidos através de simulações. Tawn (1988)
forneceu os valores críticos do teste para o modelo logístico simétrico e
alguns valores de m, realizando 100.000 replicações da estatística escore
normalizada (cm log m)<formula/>(b0). Fornecemos
aqui esses valores críticos no caso do modelo misto simétrico. Também
completamos a Tabela_1 de Tawn (1988) obtendo os valores críticos do modelo
logístico simétrico para outros valores de m. Os resultados são mostrados nas
tabelas_1 e 2 a seguir.
Segundo Tawn (1988), ao se fazer o teste de independência com amostras
pequenas, é recomendável usar os valores simulados no lugar da aproximação
assintótica.
Uma vez confirmada a dependência entre as séries, podemos então realizar o
teste para a escolha do melhor modelo. Para testar entre as famílias
(simétricas) Mista e Logística, primeiramente ajustamos por máxima
verossimilhança um modelo com função de dependência A = g A1(v) + (1'g) A2(2)
(v), 0 < g < 1. A partir da estimativa de máxima verossimilhança [/img/
revistas/pope/v23n2/a04img23.gif] de g, o teste proposto aceita A1 se [/img/
revistas/pope/v23n2/a04img23.gif] > 1/2 ou aceita A2 se [/img/revistas/pope/
v23n2/a04img23.gif] < 1/2. Iremos nos referir a este teste como teste ML. Para
testar dentro da família (simétrica ou assimétrica), usaremos o teste usual do
logaritmo da razão das verossimilhanças, o qual denotaremos por LR.
Quando o modelo ajustado é assimétrico pode-se calcular uma medida da não
permutabilidade entre os dois máximos M1 e M2, a qual denotaremos por R12. Para
tanto, seja <formula/> = [/img/revistas/pope/
v23n2/a04img24.gif](a) a probabilidade Pr{Mj < mj,a| Mi = mi,a}, i,j = 1,2,
onde a é uma probabilidade pequena e mi,a é o (1 'a)-quantil da distribuição
marginal do máximo Mi, quer dizer, <formula/>
(mi,a) = a, i = 1,2. Definimos R12 = <formula/>/[/
img/revistas/pope/v23n2/a04img27.gif]. Quando R12 é menor que 1 podemos
interpretar como a componente M1 tendo maior peso (ou contribuição) na
dependência observada. Notemos que R12= 1 sob modelos simétricos.
Novamente enfatizamos que nosso interesse é utilizar esquemas de reamostragem
bootstrap para obter indicações da qualidade das estimativas obtidas [/img/
revistas/pope/v23n2/a04img28.gif], <formula/>, [/
img/revistas/pope/v23n2/a04img13.gif], i = 1,2, [/img/revistas/pope/v23n2/
a04img14.gif], <formula/>, [/img/revistas/pope/
v23n2/a04img30.gif] e <formula/>.
4. Método bootstrap
O bootstrap é um método computacionalmente intensivo que pode ser utilizado
para avaliar a acuracidade de estimativas estatísticas. A idéia principal
(Efron, 1979) é tratar o conjunto de dados (amostra) como se fosse a população
(verdadeira) e retirar amostras com reposição desse conjunto de dados, como se
estivéssemos amostrando da população (para maiores detalhes veja Efron &
Tibshirani, 1993). Repete-se esse procedimento um número B grande de vezes, e
para cada reamostra calcula-se as quantidades de interesse. Os B valores
calculados são utilizados para estimar a distribuição desconhecida dessas
quantidades.
Conforme Cribari-Neto (2000), consideremos uma amostra aleatória x= (x1,...,xm)
da distribuição F0(d), onde d é o parâmetro (ou vetor de parâmetros)
desconhecido, o qual é visto como um funcional de F0, ou seja, d= t (F0). Seja
<formula/> = s(x) = s(x1,...,xm) um estimador de
d. Os estimadores considerados podem ter ou não ter forma fechada e satisfazem
s(x1,...,xm) = s(<formula/>), onde [/img/revistas/
pope/v23n2/a04img33.gif] é a função de distribuição empírica de (x1,...,xm).
O esquema de reamostragem pode ser feito paramétrica ou não-parametricamente,
dando origem a duas categorias de métodos bootstrap, os paramétricos e os não-
paramétricos. No esquema paramétrico as Bnovas amostras são obtidas de F0([/
img/revistas/pope/v23n2/a04img32.gif]), isto é, geramos amostras a partir da
distribuição ajustada aos dados. Na versão não-paramétrica reamostramos com
reposição da amostra original, o que equivale a amostrar de [/img/revistas/
pope/v23n2/a04img33.gif]. O algoritmo bootstrap básico é dado no Apêndice.
Em resumo, ao aplicarmos o procedimento bootstrap, paramétrico ou não-
paramétrico, obtemos B amostras (<formula/>,...[/
img/revistas/pope/v23n2/a04img35.gif]) de (x1,...,xm), denotadas por x* b,
b=1,...,B, e calculamos <formula/>(b) para cada x*
b, b=1,...,B. A partir desses valores podemos estimar a variabilidade de [/img/
revistas/pope/v23n2/a04img37.gif] em relação ao verdadeiro valor de d, através
da variabilidade dos <formula/>(b) em relação [/
img/revistas/pope/v23n2/a04img37.gif] (Efron, 1982). A expressão desta
estimativa bootstrap do erro padrão de <formula/>
é também dada no algoritmo bootstrapbásico no Apêndice.
Além disto, a distribuição empírica Ê dos B valores [/img/revistas/pope/v23n2/
a04img36.gif](b) pode ser usada para construir estimativas por intervalo. O
intervalo de confiança do tipo percentil com cobertura 1 ' 2a,0 <a< 1/2, para d
é dado por
[Ê'1(a), Ê'1(1 ' a)] = [<formula/>],
onde Ê'1(a) = <formula/> é o 100.a-percentil da
distribuição bootstrap Ê, isto é, o B.a-ésimo valor entre os [/img/revistas/
pope/v23n2/a04img36.gif](b) valores ordenados.
De acordo com uma das sugestões de um dos revisores, iremos também calcular
intervalos de confiança do tipo BCa ("bias corrected and
accelerated"). O intervalo de confiança BCa com cobertura (1 ' 2a) é
baseado nos percentis de probabilidade a1 e a2 da distribuição empírica Ê e
pode ser visto como uma modificação do intervalo tipo percentil (veja detalhes
em Cribari-Neto e outros (2002) e Efron & Tibshirani (1993)).
O intervalo de confiança BCa com cobertura (1 ' 2 a) é dado por
[[Ê'1(a1), Ê'1(a2)] = [<formula/>],
onde
onde
onde
onde F(·) é a função de distribuição normal padrão, za é o 100.a-percentil de
uma normal padrão, onde <formula/>(·) = [/img/
revistas/pope/v23n2/a04img43.gif]<formula/>(i), e
onde <formula/>(i) é a estimativa de d a partir de
s(.) e baseada na amostra original sem a i-ésima observação. Notemos que quando
as quantidades <formula/>("correção do
vício") e â ("aceleração") não são zero elas estarão
"corrigindo" os percentis usados no cálculo do intervalo tipo
percentil.
Tomando como base o algoritmo apresentado no Apêndice, descrevemos a seguir o
algoritmo utilizado para calcular a variabilidade das estimativas de máxima
verossimilhança e intervalos de confiança bootstraptipo percentil e tipo BCa,
paramétricos e não-paramétricos.
Algoritmo 1:
1- Para b = 1,...,B,
1.1- Reamostramos da amostra original (m1,1,m2,1),...,(m1,m,m2,m) obtendo a b-
ésima amostra bootstrap de tamanho m.
1.2- Estimamos simultaneamente, via máxima verossimilhança, os parâmetros
marginais <formula/> e os parâmetros de
dependênciab*^(b) ondeb*^(b) é <formula/>(b) no
modelo logístico simétrico; ou <formula/>(b) no
modelo misto simétrico; ou <formula/> no modelo
logístico assimétrico comf=1; ou(<formula/>(b),[/
img/revistas/pope/v23n2/a04img58.gif](b))no modelo misto assimétrico.
1.3- Usando as estimativas obtidas em (1.2), calculamos [/img/revistas/pope/
v23n2/a04img48.gif](b), <formula/>(b) e [/img/
revistas/pope/v23n2/a04img50.gif](b).
2- Para cada vetor de tamanho B contendo as replicações de [/img/revistas/pope/
v23n2/a04img51.gif] calculamos a média aritmética, a variância amostral, o
desvio padrão, a mediana, os percentis 1%, 2,5%, 5%, 95%, 97,5% e 99%, e os
percentis de probabilidadea1 ea2.
Seja d o vetor de parâmetros (m1,s1,x1,m2,s2,x2,b). Em 1.1 a amostragem é feita
a partir da amostra original e com reposição no caso do bootstrapnão-
paramétrico e é feita a partir da distribuição ajustada aos dados originais (F0
(<formula/>)) no caso do bootstrapparamétrico.
No caso do bootstrapnão-paramétrico, no passo 1.1 usamos o Algoritmo 2 dado a
seguir para gerar uma amostra dos modelos bivariados. Neste algoritmo, W(m1,m2)
representa a função de distribuição dos modelos logístico simétrico, logístico
assimétrico, misto simétrico ou misto assimétrico, e H1 e H2 representam as
distribuições marginais que são do tipo de uma distribuição de valores extremos
generalizada. Dada uma observação m1 de H1, a distribuição condicional de M2 é
dada por
Wc(m2|m1) = Pr{M2 < m2|M1 = m1} = <formula/>
Algoritmo 2:
1- Geramos m observações da distribuição H1(m1,s1,x1).
2- A partir da amostra obtida em (1), geramos m observações da distribuição
condicional Wc(m2|m1)usando o método iterativo Newton-Raphson.
As performances dos intervalos de confiança obtidos podem ser avaliadas através
de simulações de Monte Carlo com esquemas de bootstrap. Para tanto, iremos
gerar um número R grande de amostras do modelo ajustado, e para cada uma delas
efetuar B reamostragens, com reposição ou a partir do modelo ajustado. Este
experimento está sumarizado no Algoritmo 3:
Algoritmo 3:
1. Para i=1,...,R,
1.1. Geramos a i-ésima amostra de tamanho m do modelo bivariado utilizando o
Algoritmo 2. Estimamos simultaneamente por máxima verossimilhança os parâmetros
do modelo.
1.2. A partir da i-ésima amostra gerada em (1.1) obtemos B novas amostras x*
(ib) amostrando com reposição no caso não-paramétrico, ou obtemos B amostras x*
(ib) do modelo ajustado. Para cada uma dessas B amostras:
1.2.1. Estimamos simultaneamente, por máxima verossimilhança, os parâmetros
marginais e os parâmetros de dependência.
1.2.2. Usando as estimativas obtidas em (1.2.1), calculamos [/img/revistas/
pope/v23n2/a04img48.gif](ib), <formula/>(ib) e [/
img/revistas/pope/v23n2/a04img50.gif](ib).
1.2.3. A partir dos vetores de tamanho B contendo as quantidades calculadas em
(1.2.1) e (1.2.2) calculamos os percentis 1%, 2,5%, 5%, 95%, 97,5%, 99%,a1,
ea2.
1.2.4. Verificamos se os intervalos obtidos contêm o "verdadeiro"
valor do parâmetro.
2. Comparamos a cobertura obtida em (1.2.4) com a cobertura nominal.
5. Avaliação da Qualidade das Estimativas de Máxima Verossimilhança para
Extremos Mensais
Para avaliarmos a qualidade das estimativas de máxima verossimilhança,
começamos ilustrando o processo de estimação utilizando três séries financeiras
de máximos e mínimos mensais: IBOVESPA do Brasil, S&P500 dos Estados
Unidos, e o índice MSCI EAFE da Morgan Stanley Capital International,
representando os mercados da Europe, Australásia and Far East, coletados no
período de Janeiro de 1996 a Maio de 2001. Os extremos foram, portanto,
coletados em blocos de tamanho n=22, formando séries de tamanho m=65.
A Tabela_3 apresenta as estatísticas univariadas dos máximos e mínimos mensais
das séries financeiras, que sugerem uma distribuição assimétrica para todos os
extremos.
A associação positiva entre os pares de extremos é ilustrada na Figura_1, onde
vemos o diagrama de dispersão entre os mínimos mensais do IBOVESPA e do
S&P500, para os dados originais e transformados.
Não tendo observado nenhum tipo de tendência, ajustamos os quatro modelos
bivariados aos 6 pares de extremos, obtendo as estimativas de máxima
verossimilhança para todos os parâmetros e para as medidas r, te R12. O
parâmetro f do modelo logístico assimétrico foi fixado igual a 1 para evitar
problemas de não identificabilidade do modelo. O software SAS, release 6.12,
foi usado no procedimento de otimização simultânea. Todos os ajustes sugeriram
dependência. O passo seguinte foi testar formalmente a independência
assintótica. O teste escore (7) rejeitou a independência para todos os pares de
extremos da Tabela_(4). Foram efetuados o teste ML e o teste LR para a escolha
do melhor modelo para cada par, e as estimativas dos modelos finais são dadas
nas tabelas_4 e 5.
Na Tabela_4, damos as estimativas dos parâmetros marginais e (erros padrões).
Observamos que as estimativas dos parâmetros de forma foram quase todas
positivas (Fréchet), caracterizando distribuições de retornos diários com
caudas pesadas. Por outro lado, para os pares de mínimos mensais (IBOVESPA,
EAFE) e (S&P500, EAFE), o parâmetro x não é significativamente diferente de
zero para o EAFE, indicando ter esta marginal uma distribuição Gumbel e seus
retornos diários correspondentes uma distribuição com caudas mais leves do que
os demais.
A Tabela_5 fornece as estimativas dos modelos bivariados e também dá as
estimativas para r e t, as quais indicam uma associação moderada entre os
extremos.
O modelo misto assimétrico para os máximos mensais do S&P500 (1) e EAFE (2)
forneceu R12 = 0,9569 para a= 0,01. Isto significa que dado que um retorno
positivo alto (lucro grande) m2,0,01 tenha ocorrido para o índice EAFE, a
probabilidade do índice S&P500 ser menos extremo (lucros menores) é maior
que esta probabilidade calculada quando trocamos os índices. Isto significa
que, com respeito a lucros e em relação ao EAFE, o índice S&P500 possui
maior peso na dependência observada.
Mas R12 = 0,9569 é próximo de 1. Qual o erro acumulado com as operações
sucessivas de estimação e modelagem? Então, precisamos avaliar a precisão e
qualidade das estimativas de máxima verossimilhança dos parâmetros e das
medidas derivadas dos modelos bivariados, o que faremos a seguir através dos
procedimentos bootstrap.
5.1 Resultados do bootstrap
Para a realização do bootstrap, escolhemos três pares de índices financeiros de
tal forma que tenhamos um exemplo para cada modelo ajustado. Iremos reamostrar
das amostras dos pares dos mínimos mensais do (IBOVESPA, S&P500) (modelo 4:
logístico simétrico); dos máximos mensais do (IBOVESPA, EAFE) (modelo 2: misto
simétrico); e dos máximos mensais do (S&P500, EAFE) (modelo 3: misto
assimétrico). Fixamos B = 5000 e implementamos os algoritmos dados.
Apresentamos nas tabelas_6 e 7 os resultados do bootstrapnão-paramétrico para
os modelos 3 e 4. Os resultados para o modelo 2 são similares e a tabela
correspondente foi retirada (seguindo sugestão de um dos revisores). Na
primeira linha dessas tabelas repetimos as estimativas dos parâmetros e das
medidas de interesse calculadas a partir dos conjuntos de dados originais e
dadas nas tabelas_4 e 5. As linhas seguintes contem os resultados do bootstrap.
A quarta linha apresenta os erros padrões que nos fornecem a variabilidade das
estimativas de máxima verossimilhança apresentadas na primeira linha.
Com base nos erros padrões podemos avaliar a acuracidade das estimativas de
máxima verossimilhança do coeficiente de correlação r, da medida de dependência
t e da medida R12 (quando o modelo é assimétrico) em relação aos seus
verdadeiros valores. Ainda nas tabelas_7 e 6 encontramos os intervalos de
confiança não-paramétricos do tipo percentil de níveis 90%, 95% e 98% de
confiança.
Os resultados nos permitem concluir que a variabilidade não chega a afetar
algumas características importantes dos modelos. Por exemplo, os intervalos de
confiança para os parâmetros de forma x contém apenas valores positivos,
portanto ainda dentro da família Fréchet. Quanto à medida R12, verificamos na
Tabela_6 que para o par de máximos mensais S&P500 e EAFE, o erro padrão
estimado foi de 0,071 e o intervalo de confiança não-paramétrico do tipo
percentil com 95% de cobertura para R12 é [0,863,1,114], o qual contém o valor
1. Então, para este par de índices financeiros não podemos garantir que o
S&P500 seja o índice mais responsável pela dependência observada, uma vez
que quando R12 = 1 o par de índices estará sob o ajuste de um modelo simétrico.
Com base nos resultados podemos dizer que a interpretação da medida R12 deve
ser sempre feita com bastante cautela.
As tabelas_8 e 9 apresentam os resultados do bootstrapparamétrico baseado em
B=5000 replicações dos modelos 3 e 4 da Tabela_5. Novamente suprimimos a tabela
com os resultados do modelo 2 por conter resultados similares.
Verificamos que em geral as médias das replicações bootstrapobtidas não-
parametricamente ficaram mais próximas dos verdadeiros valores dados na
primeira linha das tabelas, do que os resultados obtidos parametricamente. Além
disto, em geral sugeriram uma menor variabilidade para os estimadores
utilizados.
Analisando na Tabela_8 a medida R12, novamente vemos que o intervalo de 95% de
confiança tipo percentil não-paramétrico contém o valor 1. Isto reforça as
conclusões já tiradas de que as interpretações de R12 devem sempre levar em
consideração sua estimativa pontual mais a variabilidade das mesmas obtidas a
partir de esquemas bootstrap.
Devido ao esforço computacional extra considerável que envolve o cálculo dos
intervalos de confiança do tipo BCa para os modelos bivariados, calculamos este
intervalo apenas para os parâmetros do modelo 4. Notamos que em geral os
intervalos de confiança do tipo percentil são menores sob o esquema
paramétrico. Já os intervalos de confiança tipo BCa tiveram tamanhos não muito
diferentes sob os dois esquemas bootstrap, sendo porém um pouco menores do que
os do tipo percentil paramétrico ou não-paramétrico. Por exemplo, para o
parâmetro r do modelo 4, os tamanhos dos intervalos tipo percentil (PER), BCa,
paramétrico (P), não-paramétrico (NP), para o nível de 98% são: PER-P: 1,016,
BCa-P: 0,998, PER-NP: 1,250, BCa-NP: 0,991. Para os níveis de 95% e 90% esses
tamanhos são, respectivamente, (0,707, 0,687, 0,967, 0,721) e (0,571, 0,546,
0,752, 0,581).
A seguir utilizamos simulações Monte Carlo seguidas de esquemas de
bootstrappara avaliar o desempenho dos intervalos construídos. Fixamos R=5000 e
B=5000 e implementamos o Algoritmo 3. Devido ao grande esforço computacional,
envolvendo inclusive softwares diferentes, apresentamos os resultados apenas
para o modelo 4. Observamos que os intervalos BCa-P e BCa-NP tiveram
performances parecidas e um pouco melhores do que os outros dois (PER-P e PER-
NP) para todos os níveis de confiança de 98%, 95% e 90%. Por exemplo, o
intervalo de 95% BCa-NP incluiu o verdadeiro valor do parâmetro r 94.78% das
vezes. No caso da cobertura nominal de 98% e 90% a performance do BCa-NP foi de
97.56% e 89.84%.
Os resultados obtidos pelos dois esquemas permitem uma avaliação favorável
quanto a precisão e qualidade das estimativas de máxima verossimilhança obtidas
a partir dos modelos bivariados de valores extremos, indicando que a
substituição da distribuição exata, com n=22, pela assintótica (n® ¥), e o
tamanho moderado da amostra (m=65) para a estimação por máxima verossimilhança,
não tiveram efeito importante na variabilidade das estimativas, exceto no caso
da medida R12.
6. Avaliação da Qualidade das Estimativas de Máxima Verossimilhança para
Extremos Bimestrais
Nesta seção repetimos as análises feitas na Seção 5, agora considerando os
máximos e mínimos bimestrais.
O objetivo é verificar se existe ou não aumento na variabilidade das
estimativas de máxima verossimilhança dos modelos bivariados se diminuímos o
tamanho da amostra de extremos (agora m=32). Por outro lado, notemos que ao
coletar extremos bimestrais temos n=44, e portanto a qualidade da aproximação
da distribuição exata pela assintótica deve melhorar.
Sendo assim, repetimos todo o processo de ajuste dos modelos, passando pela
estimação simultânea dos parâmetros, realizando testes de independência e de
escolha dos modelos. As estimativas de máxima verossimilhança, correspondentes
aos melhores ajustes obtidos com os modelos bivariados para os diversos pares
de extremos, são fornecidas nas tabelas_10 e 11.
Observamos que para os pares de máximos bimestrais não ocorreram mudanças no
modelo final ajustado. Para os mínimos bimestrais ocorreu uma mudança no par de
índices IBOVESPA e EAFE, cujo modelo era logístico simétrico nos mínimos
mensais, passando a ser misto simétrico.
Novamente, para averiguarmos a acuracidade das estimativas de máxima
verossimilhança utilizamos esquemas bootstrap paramétricos e não-paramétricos
com 5000 replicações, cujos resultados para os modelos 3b e 4b estão nas
tabelas_12_a_15. As estimativas relacionadas com esses modelos se encontram na
primeira linha das referidas tabelas. Algumas características observadas nas
seções anteriores se repetem para os extremos bimestrais.
Observando a quarta linha das tabelas_12_a_15, verificamos que a variabilidade
das estimativas de máxima verossimilhança é maior que aquela apresentada nas
tabelas_6_a_9. Os maiores aumentos na variabilidade ocorreram no caso dos
parâmetros marginais, chegando a ser, em alguns casos, 3,5 vezes maior que a
obtida para os extremos mensais.
Com base nos resultados obtidos, constatamos uma certa perda na qualidade das
estimativas de máxima verossimilhança, uma vez que ocorreu um aumento
significativo na variabilidade. Ou seja, ao se melhorar a qualidade da
aproximação da distribuição exata pela distribuição assintótica, se perde na
qualidade das estimativas de máxima verossimilhança.
7. Conclusões
Neste artigo abordamos o problema da verificação da precisão das estimativas de
máxima verossimilhança em amostras de tamanho m pequeno no caso de modelos
bivariados da teoria dos valores extremos. Para ilustrar consideramos três
índices financeiros, um nacional e dois internacionais, e analisamos os máximos
e mínimos coletados em blocos de tamanho fixo n. Os extremos mensais (n=22)
resultaram em amostras de tamanho m=65, e os bimestrais (n=44) em m=32.
Para modelar a ocorrência de eventos extremos simultâneos utilizamos duas
classes de modelos bivariados de valores extremos: misto e logístico, e seus
dois tipos: simétricos e assimétricos. Obtivemos as estimativas de máxima
verossimilhança para os parâmetros das distribuições marginais, para a
estrutura de dependência, e para as medidas de dependência r, t, e R12. Em
seguida, através de esquemas bootstrapparamétricos e não-paramétricos,
acessamos a variabilidade dessas estimativas. Calculamos os desvios padrões e
intervalos de 90%, 95% e 98% de confiança bootstrapdos tipos percentil e BCa,
paramétricos e não-paramétricos. Avaliamos a performance desses intervalos
usando simulações Monte Carlo com esquemas bootstrap.
Observamos que para extremos mensais o tamanho pequeno das amostras não parece
causar grande variabilidade nas estimativas. Para a medida R12 relacionada com
a assimetria dos modelos bivariados, ou seja, com a não permutabilidade das
variáveis, constatamos que os procedimentos bootstrapforam muito úteis, já que
indicaram que essa medida deve ser usada com cautela. Não se deve portanto
afirmar que um mercado tem mais influência na dependência observada à luz
apenas das estimativas pontuais de R12.
Finalmente, investigamos o trade-offque existe ao se melhorar a qualidade da
aproximação da distribuição exata de extremos bivariados pela distribuição
assintótica, a partir do aumento do tamanho do bloco (npassa de 22 a 44 para
extremos bimestrais), mas provavelmente perdendo na qualidade das estimativas
de máxima verossimilhança, uma vez que o tamanho da amostra de extremos passa a
ser m=32. De fato, constatamos uma perda na qualidade das estimativas de máxima
verossimilhança, uma vez que ocorreu um aumento significativo na variabilidade.
Ou seja, para se ter uma melhor representação da distribuição exata pela
distribuição assintótica, se perde na qualidade das estimativas de máxima
verossimilhança.