Modelos de regressão aleatória com diferentes estruturas de variância residual
para descrever o tamanho da leitegada
===============================================================================
Introdução
O tamanho da leitegada ao nascer pode ser analisado sob diferentes modelos,
sendo mais simples e, até o momento, mais usual analisá-lo pelo de
repetibilidade, assumindo-se que as leitegadas oriundas das diferentes ordens
de parto são medidas repetidas da característica (CHEN et al., 2003; KAUFMANN
et al., 2000). Entretanto esse modelo pressupõe que a correlação entre as
medidas repetidas é igual à unidade, portanto todas as (co) variâncias
genéticas e fenotípicas entre as diferentes medidas são de mesma magnitude, ou
seja, os mesmos genes controlam o tamanho da leitegada no decorrer das
parições, o que é uma modelagem simplista.
Características longitudinais, como o tamanho da leitegada ao nascer, também
podem ser analisadas por meio de modelos animais multicaracterísticas
(HANENBERG et al., 2001; IRGANG et al., 1994). Nesses modelos, assume-se que
cada ordem de parição é uma característica diferente. As correlações entre as
médias nas diferentes parições podem ser diferentes da unidade, ou seja, as
correlações são levadas em consideração na análise, embora não se faça qualquer
pressuposição sobre a estrutura de covariância.
Os modelos de regressão aleatória (MRA) têm sido amplamente reconhecidos em
análises de dados longitudinais no melhoramento animal e utilizados para
modelar várias características em algumas espécies de animais domésticos, como
suínos (HUISMAN et al., 2002; LUKOVIC et al., 2003; LUKOVIC et al., 2004),
ovinos (SARMENTO et al., 2006), bovinos de corte (NOBRE et al., 2003) e de
leite (VAN DER WERF et al., 1998), entre outros. Os MRA surgiram como uma
alternativa capaz de modelar, adequadamente, características longitudinais no
contexto do melhoramento animal, a exemplo do tamanho da leitegada ao nascer.
Ajustando-se um modelo de regressão aleatória, assume-se, implicitamente, uma
determinada estrutura de covariância entre as ordens de parto, que é imposta
pelo MRA escolhido. Assim, consideram-se as correlações na análise e assume-se
uma determinada estrutura para as correlações.
Nos MRA, a modelagem que considera as variâncias residuais heterogêneas pode
melhorar a partição da variação total, mas proporciona um aumento no número de
parâmetro a ser estimado no processo de maximização da função de
verossimilhança. Segundo El Faro et al. (2008), o número elevado de parâmetro
no modelo, a estrutura de covariância e o fato de as matrizes de incidência
serem mais densas que os modelos convencionais podem dificultar a convergência
na estimação dos componentes de variância, sendo entraves na utilização dessa
metodologia para avaliações genéticas com grande volume de dado.
Este trabalho tem por objetivo comparar modelos de regressão aleatória com
diferentes estruturas de variância residual, a fim de se buscar a melhor
modelagem para as variâncias associadas à característica tamanho da leitegada
ao nascer.
Material e métodos
Analisaram-se 1.701 registros de tamanho da leitegada ao nascer (TLN) -
nascidos morto e vivo - da 1ª à 7ª ordem de parição de fêmeas Dalland (C-40),
pertencentes à Granja São José-Irmãos Canalli (rebanho 1), situada no município
de Monte Alto, SP, e à Suinocultura São José (rebanho 2), situada no município
de Cabo Verde, MG. Os animais estavam alojados em instalações convencionais de
alvenaria de tijolo, revestidas de cimento e de piso impermeável, com piquetes
nas unidades destinadas à reprodução. A ração, na forma farelada, era formulada
à base de milho e farelo de soja, suplementada com minerais e vitaminas,
atendendo às exigências nutricionais de todas as fases da criação; os animais
eram vermifugados sistematicamente.
Foram consideradas, para análise, apenas informações oriundas de porcas filhas
de reprodutores com, no mínimo, três filhas e de grupos contemporâneos com, no
mínimo, três observações. Após essas considerações, a matriz de parentesco
ficou com 657 animais no total, e o banco de dado ficou com 1.701 registros de
TLN de 421 porcas filhas de 20 cachaços e 120 matrizes, cujo número de
observação, média e desvio-padrão referente a cada ordem de parição estão
apresentados na Tabela_1.
![](/img/revistas/rca/v42n4/a29tab01.jpg)
O tamanho da leitegada ao nascer foi, inicialmente, analisado por meio de
modelo animal, unicaracterística, de regressão aleatória, cujo modelo geral de
análise pode ser representado como segue:
[/img/revistas/rca/v42n4/a29equ01.jpg]
Em que Yij é o tamanho da leitegada na jésima ordem de parição, do iésimo
animal; Fij é o efeito fixo de grupo de contemporâneos (33 níveis), formado
pelo ano de parto, estação de parição e pelo rebanho; Øk é o késimo polinômio
de Legendre da ordem de parição padronizada para o intervalo de -1 a +1;βjk são
os coeficientes de regressão do tamanho da leitegada ao nascer sobre a ordem de
parição para modelar a trajetória média da população; aik , cik e dik são os
coeficientes de regressão aleatória do efeito genético aditivo-direto, do
comum-de-leitegada e do de ambiente permanente respectivamente;kb, ka, kc e kp
são as ordens dos polinômios de Legendre; eij é o efeito aleatório residual.
Na forma matricial, o modelo anterior, com suas pressuposições, pode ser
escrito como segue:
Y = Xb + Za = Hc + Wp +e
[/img/revistas/rca/v42n4/a29equ02.jpg]
Em que y é o vetor das N observações, medidas em Nd animais; b é o vetor de
efeitos fixos que inclui as soluções para o grupo contemporâneo; a, c e p são,
respectivamente, os vetores dos coeficientes de regressão aleatória do efeito
genético aditivo-direto, do comum-de-leitegada e do de ambiente permanente; e é
o vetor dos diferentes resíduos; X, Z, H e W são, respectivamente, as matrizes
de incidência para os efeitos fixos, aleatórios genético aditivo, comum-de-
leitegada e de ambiente permanente. Ka, Kc e Kp são, respectivamente, as
matrizes de (co)variância entre os coeficientes de regressão aleatória do
efeito genético aditivo, comum-de-leitegada e do de ambiente permanente; A é a
matriz dos numeradores dos coeficientes de parentesco aditivo; INd é a matriz
identidade de dimensão Nd, sendo Nd o número de animal com observações
repetidas; IND é a matriz identidade de dimensão ND, sendo ND o número de
leitegada; ⊗ é o produto de Kroenecker; R é uma matriz diagonal de variância
residual.
A regressão fixa para a curva média da população e as regressões aleatórias do
efeito genético aditivo, do comum-de-leitegada e do de ambiente permanente de
animal foram modeladas por meio de polinômios ortogonais de Legendre de ordem
quadrática, definidas em análises prévias.
Com o fim de averiguar a melhor modelagem para a variância residual,
considerou-se a mesma homogênea inicialmente (modelo 1) e, posteriormente,
assumiu-se a heterogeneidade de variância por meio de 1 a 7 classes de
variância residual. Assim, assumiram-se duas (da 1a à 3a e da 4a à 7a ordem),
três (da 1a à 2a, da 3a à 4a e da 5ª à 7a ordem), quatro (1ª, da 2ª à 3a, da 4ª
à 5ª e da 6ª à 7ª ordem), cinco (1ª, 2ª, 3ª , da 4ª à 5ª e da 6ª à 7ª ordem),
seis (1ª, 2ª, 3ª, 4ª, 5ª e da 6ª à 7ª ordem) e sete (cada ordem foi assumida
como uma classe) classes de variância residual heterogêneas, porém homogêneas
dentro de cada grupo.
O número de parâmetro estimado para cada modelo foi k (k +1)/2 coeficientes de
regressão para os efeitos genéticos aditivos, comum-de-leitegada e de ambiente
permanente, além das classes da variância residual, em que k é a ordem de
ajuste do polinômio ortogonal de Legendre.
A estimativa de herdabilidade para cada ordem de parição (t) foi obtida da
seguinte forma:
[/img/revistas/rca/v42n4/a29equ03.jpg]
E as estimativas de correlações genéticas e fenotípicas, entre as medidas nas
diferentes ordens, ti e tj , são definidas, respectivamente, por:
[/img/revistas/rca/v42n4/a29equ04.jpg] e [/img/revistas/rca/v42n4/
a29equ05.jpg],
As estimativas de (co)variância genética e fenotípica para a ordem t foram
dadas por:
[/img/revistas/rca/v42n4/a29equ06.jpg]
em que i=1, 2,3...7 e j=1,2,3,....,7.
Os componentes de (co)variância foram estimados pelo método da máxima
verossimilhança restrita (REML), usando-se a opção DXMRR do pacote estatístico
DFREML (MEYER, 1998).
Os modelos, com diferentes estruturas de variância residual, foram comparados,
inicialmente, pela mudança no logaritmo da função de máxima verossimilhança
(LogL), por meio do teste da razão de verossimilhança (LR). A estatística LR
foi obtida pela seguinte expressão: LRij = 2 Log Li - 2 Log Lj, em que Log Li é
o máximo da função de verossimilhança para o modelo completo i, e Log Lj é o
máximo da função de verossimilhança para o modelo reduzido j. A estimativa LR
foi comparada com o valor do qui-quadrado tabelado, com d graus de liberdade e
nível de significância de 5%, em que d é a diferença entre o número de
parâmetro estimado pelos modelos completo e reduzido.
Também foram utilizados outros testes baseados em formas de máxima
verossimilhança restrita, tais como o critério de informação de Akaike (AIC) e
o critério de informação bayesiano de Schwarz (BIC). Ambos os testes permitem
comparação entre os modelos não aninhados e impõem penalidades de acordo com o
número de parâmetro a ser estimado. O modelo com menor valor, para ambos os
critérios, é considerado o que obteve melhor ajuste. Segundo Huisman et al.
(2002), o BIC é mais rígido que o AIC. Os critérios de informação podem ser
definidos como:
AIC = -2 Log L + 2p;
e BIC = -2 Log L + p Log (N - r (X)).
Em que p é o número de parâmetro estimado; N, o número de observação; r (X), o
posto da matriz de incidência dos efeitos fixos do modelo; e Log L, o logaritmo
da função de máxima verossimilhança restrita (WOLFINGER, 1993).
Posteriormente, o TL foi também analisado por meio de modelo animal de
repetibilidade, utilizando-se do aplicativo MTDFREML, descrito por Boldman et
al. (1995), em que se considerou, como efeito fixo, o grupo de contemporâneo,
como covariável, a ordem de parição e, como aleatórios, os efeitos genético
aditivo-direto, ambiental permanente e comum-de-leitegada.
O critério de convergência utilizado foi a variância dos valores do simplex
inferior a 10-9. Após a convergência, o programa era reiniciado, usando-se as
estimativas obtidas anteriormente como valores iniciais. Esse procedimento foi
repetido até que a diferença entre as estimativas das duas últimas
convergências fossem menor que 10-9.
Resultados e discussão
Na Tabela_2, estão o número de parâmetro estimado (p), o logaritmo da função de
máxima verossimilhança (Log L), critério de informação de Akaike (AIC),
critério de informação bayesiano (BIC) e teste da razão de verossimilhança
(LRT) para os diferentes MRA.
Analisando-se o Log L, observa-se que, com o aumento das classes de variância
de 1 a 7, houve aumento no Log L, porém essas diferenças não foram
significativas (P > 0,05) pelo teste da razão de verossimilhança, o que sugere
que o resíduo homogêneo foi suficiente para ajustar a variância nos dados.
Os valores de AIC e BIC também apontaram o modelo 1 como o que proporcionou
melhor ajuste da variância nos dados utilizados.
Segundo Meyer (2000), o LRT tende a favorecer modelos com maior número de
parâmetro, o que não ocorreu neste trabalho, uma vez que, mesmo aumentando o
número de classe residual, não foi observada significância pelo LRT. Já o AIC e
o BIC impõem penalidades de acordo com o número de parâmetro a ser estimado;
então, à medida que se aumentou o número de classe, como não houve aumento
significativo no Log L, não foi observada diminuição no AIC nem no BIC, o que
demonstra que o modelo que considerou a variância residual homogênea (modelo 1)
foi o mais indicado para a estrutura dos dados deste trabalho.
Variâncias residuais heterogêneas têm sido relatadas por vários autores, como
El Faro et al. (2008) e Sarmento (2007), que trabalharam com bovinos leiteiros
e ovinos respectivamente. Essa variação no decorrer de curvas de lactação e de
crescimento pode ser atribuída a diversos fatores, como estágio, condições do
parto, duração do período seco etc., uma vez que estes não são facilmente
incorporados nos modelos de análise devido à falta de escrituração sobre os
mesmos. Com isso, essa variação é redirecionada para o resíduo, sendo,
portanto, necessário modelá-lo.
O tamanho da leitegada ao nascer sofre influência, principalmente, da
covariável ordem de parição, e esse efeito encontra-se ajustado nos modelos
aqui utilizados, uma vez que as regressões fixa e aleatórias foram
representadas por funções contínuas sobre a ordem de parto. Isso, então,
possivelmente explica o fato de o modelo com o resíduo homogêneo ter sido
suficiente para modelar a variância nos dados. Associados a esse fato,
trabalhos têm utilizado apenas a idade da porca ao parto ou a ordem de parição
como covariável na estimativa de parâmetro genético por meio de modelo de
repetibilidade para essa característica (IRGANG et al., 1994; TORRES FILHO et
al., 2005).
Sabe-se, no entanto, que o tamanho da leitegada é uma característica de baixa
herdabilidade, sendo, assim, muito influenciada pelo ambiente. Nesse sentido,
não é que a ordem de parição ou a idade de parto da fêmea seja o único fator
ambiental que interfere no TLN, mas, sim, que essa covariável talvez seja a
única que cause diferenças fenotípicas entre os tamanhos das leitegadas ao
longo das ordens de parição, ou seja, outros fatores ambientais, com certeza,
afetam o TLN, contudo não são fontes de variação entre as parições, uma vez que
devem afetá-las na mesma proporção.
Outros fatores que podem causar diferenças nas ordens de parto são,
possivelmente, os efeitos de ano de parto e estação de parição, uma vez que
trabalhos mostram influência de tais efeitos (HOLANDA et al., 2005; SILVA et
al., 2007). Desse modo, as fêmeas poderiam ter sido cobertas em uma época que,
durante a fecundação e a gestação, não era boa devido à falta de
disponibilidade de alimento para a produção de ração de boa qualidade, e, por
isso, esse tamanho de leitegada ao nascer ter sido prejudicado em relação ao
anterior e ao próximo, em virtude da má nutrição. Contudo esses efeitos também
estão ajustados através do efeito fixo de grupo de contemporâneo. Caso esses
efeitos não estivessem ajustados nos modelos, essa variação iria para o
resíduo, tornando-o, possivelmente, diferente (heterogêneo) entre as ordens de
parição.
As estimativas de herdabilidade e as proporções de ambiente permanente e de
comum-de-leitegada obtidas pelo modelo considerando homogeneidade de variância
residual estão apresentadas na Figura_1.
[/img/revistas/rca/v42n4/a29fig01.jpg]
As herdabilidades estimadas pelo MRA que considerou a homogeneidade de
variância residual foram próximas a zero, diferindo das obtidas por Lukovic et
al. (2004), que, também utilizando modelos de regressão aleatória, observaram
herdabilidades variando de 0,09 a 0,14. Mas, corroborando as aqui obtidas, está
a de Lourenço (2006), que também obteve herdabilidade próxima de zero (0,001).
Holl e Robson (2003), utilizando diferentes métodos de estimação de componentes
de variância, encontraram herdabilidades para o tamanho da leitegada ao nascer
variando entre 0,00 e 0,16, o que corrobora as aqui obtidas.
Em relação à estimativa de herdabilidade obtida pelo modelo de repetibilidade,
esta foi igual a 0,00, ou seja, apresentou, praticamente, a mesma magnitude
daquelas estimadas por meio do MRA que considerou a homogeneidade de variância
residual.
As herdabilidades encontradas na literatura para o tamanho de leitegada,
todavia, diferem grandemente de autor para autor. Em geral, a maioria dos
autores concorda que o tamanho de leitegada é característica de baixa
herdabilidade (CHEN et al., 2003; LUKOVIC et al., 2007; TORRES FILHO et al.,
2005).
Em relação à proporção de ambiente permanente (FIG.1), observaram-se diferentes
magnitudes em relação às ordens, que foram crescentes da 1ª (0,06) à 5ª (0,28),
e decrescentes desse ponto até a 7ª ordem (0,18). Esses resultados são próximos
dos relatados por Ferraz e Johnson (1993), porém mais altos que os relatados
por Chen et al. (2003) e Lukovic et al. (2004). Pelo modelo de repetibilidade,
como a herdabilidade estimada foi igual a 0,00, o coeficiente de repetibilidade
obtido foi igual à proporção do efeito ambiental permanente, ou seja, 0,09 -
valor este próximo ao obtido por Lukovic et al. (2007), que foi 0,11.
O efeito comum-de-leitegada, como proporção da variância fenotípica,
apresentou, em relação às ordens de parição, valores baixos (0,01 a 0,02),
corroborando os achados de Lukovic et al. (2004). Por meio do modelo de
repetibilidade, a estimativa obtida para esse efeito foi 0,02.
Na avaliação genética de suíno, a covariância entre os indivíduos de uma mesma
família resulta, além dos genes em comum que esses indivíduos possuem, do
ambiente que compartilham durante o período pré-desmame. Esse ambiente comum
afeta o desempenho dos animais em toda a sua vida e é determinado,
principalmente, pela matriz, através dos seus cuidados com a cria, sua produção
de leite etc. (CAVALCANTE-NETO et al., 2009; TORRES FILHO et al., 2005).
Atualmente, em suínos, diversos trabalhos têm utilizado o efeito comum-de-
leitegada nos modelos para estimação de componentes de variância, inclusive em
características que se manifestam tardiamente na vida da fêmea suína, como as
reprodutivas (CAVALCANTE-NETO et al., 2008, 2009; CHIMONYO et al., 2006;
KAUFMANN et al., 2000; LUKOVIC et al., 2003, 2004, 2007).
As estimativas de correlação genética direta entre as ordens de parição foram
todas positivas e de alta magnitude (TAB._3). Os valores encontrados na
literatura são, na maioria, inferiores aos obtidos neste estudo, como os
verificados por Lukovic et al. (2004), que estimaram correlações entre 0,66 e
0,99. Essa mesma tendência foi relatada por Hanenberg et al. (2001), que
encontraram estimativas de correlação genética variando de 0,79 a 0,96.
As altas correlações genéticas obtidas neste estudo entre as ordens de parição
indicam que a maioria dos genes que atuam em uma atua nas demais e no mesmo
sentido; disso resulta que os animais melhores nas primeiras parições também o
podem ser nas últimas, por exemplo. Entretanto sabe-se que a resposta
correlacionada depende não só da correlação genética entre as características
mas também das herdabilidades das características envolvidas no processo de
seleção. Dessa forma, apesar das altas correlações genéticas entre as ordens de
parição, a resposta correlacionada pela seleção indireta, mesmo sendo
eficiente, resultará, devido às baixas estimativas de herdabilidade obtidas, em
ganhos genéticos muito baixos.
As correlações fenotípicas obtidas foram positivas e variaram de baixa a
moderada magnitude (TAB._3), indicando que os tamanhos de leitegada oriundos de
diferentes ordens de parição têm certa dependência fenotípica. A correlação
fenotípica entre duas características é composta por dois componentes, um
genético e outro de meio. Como as características aqui estudadas (TL1, TL2,...,
TL7) possuem baixas herdabilidades, mesmo com as altas correlações genéticas
estimadas entre elas, sabe-se que a correlação fenotípica foi determinada,
principalmente, pela contribuição do ambiente. Os resultados obtidos por
Lukovic et al. (2004) seguiram essa mesma tendência, ou seja, as correlações
genéticas foram bem superiores às fenotípicas, porém com valores variando de
0,11 a 0,22.
Estimativas de variância genética aditiva, herdabilidade e correlação genética
entre as diferentes parições encontradas por Irgang et al. (1994) para número
de leitão nascido vivo e número de leitão aos 21 dias de idade indicaram que a
variação genética aditiva disponível para seleção pode ser diferente entre as
raças bem como entre as parições intraraça.
Conclusões
1. A utilização de homogeneidade de variância residual foi mais adequada para
modelar as variâncias associadas à característica tamanho da leitegada ao
nascer neste conjunto de dado;
2. Os valores de herdabilidade obtidos indicam que, possivelmente, na população
estudada, aquela característica não apresentaria ganho genético como resposta à
seleção.
Agradecimento
Às Granjas São José (Monte Alto, São Paulo), especialmente aos irmãos Canalli,
e São José (Cabo Verde, Minas Gerais), representada pelo Sr. Adriano Muniz,
que, gentilmente, cederam os dados para esta pesquisa.