Estatística multivariada na discriminação de raças amazônicas de pupunheiras
(Bactris gasipaes Kunth) em Manaus (Brasil)
INTRODUÇÃO
A pupunha tem um potencial econômico e social muito grande como fonte de
alimento para o homem e animais, sendo sem dúvida a palmeira mais importante na
América pré-colombiana. É tão importante quanto o milho e a mandioca, sendo o
principal cultivo dos ameríndios de um extenso território do trópico úmido e de
algumas regiões do trópico seco (Mora Urpi, 1982; 1984). Mora Urpi et al.
(1997) relataram que, na Amazônia, existem pelo menos oito raças primitivas de
pupunheiras, e ao noroeste dos Andes, pelo menos mais cinco raças. Apresentaram
a distribuição geográfica de mais 15 raças de pupunha, mostrando a existência
das raças Pará, Solimões e Putumayo, embora os limites exatos entre essas raças
não sejam claros, já que existe muita interseção de acessos entre as raças.
Dados de Mora Urpi & Clement (1988) e Clement (2000), baseados em análise
morfométrica, afirmam a existência de três raças ao longo da bacia amazônica.
Trabalhos realizados com biologia molecular, para verificar a existência das
três raças (Rodrigues, 2001; Clement et al., 2002; Souza et al., 2002), negam a
existência da raça Solimões. Quando se deseja discriminar grupos ou populações,
Sokal (1965) e Sneath & Sokal (1973) afirmam que a seleção das
características é fundamental. As técnicas de estatística multivariada têm a
capacidade de estudar características como um conjunto sinergístico, oferecendo
um método adequado a ser aplicado em estudos de raças e populações de
pupunheiras.
As técnicas de análise de agrupamento têm como objetivo dividir um grupo
original de observações em vários grupos, seguindo algum critério de
similaridade ou dissimilaridade (Cruz & Regazzi, 1994). Sneath & Sokal
(1973) relatam que os métodos de agrupamento mais utilizados são os
seqüenciais, aglomerativos, hierárquicos e não superpostos. O dendrograma é um
diagrama em forma de árvore que mostra a subdivisão dos grupos formados,
buscando máxima homogeneidade entre os indivíduos no grupo e máxima
heterogeneidade entre os grupos.
A caracterização morfológica de frutos e sementes tem sido utilizada para a
delimitação de subfamílias e tribos de Crusiaceae (Mourão & Beltratti,
2000); sendo assim, é importante a aplicação das técnicas estatísticas
multivariadas, na tentativa de discriminar raças e populações de pupunha.
A descrição sistemática de uma espécie facilita ou possibilita o uso potencial
do material genético, que é a meta principal dos Bancos de Germoplasma. Assim,
neste estudo, foi utilizada a coleção de germoplasma de pupunha do Instituto
Nacional de Pesquisas da Amazônia-INPA, visando a examinar a existência de três
raças de pupunheiras ao longo dos rios Amazonas e Solimões.
A análise de agrupamento pode ser complementada com a análise de componentes
principais, cujo objetivo é tentar explicar a estrutura de variância e co-
variância das variáveis originais, construindo, mediante processo matemático,
um conjunto menor de combinações lineares das variáveis originais que preserve
a maior parte da informação fornecida por essas variáveis.
A análise discriminante multivariada também foi utilizada numa tentativa de
classificar os locais que contêm as raças. O propósito deste trabalho é aplicar
as três técnicas estatísticas multivariadas utilizando 15 descritores
morfológicos em três raças de pupunha (Bactris gasipaes Kunth), em Manaus
(Brasil), com o objetivo de caracterizá-las morfometricamente.
MATERIAL E MÉTODOS
O banco de germoplasma de pupunha do INPA está localizado no km 38 da Rodovia
BR-174 (Manaus-Boa Vista-RR), no município de Manaus. Cada acesso de pupunha
está representado por nove plantas de uma única matriz (progênie de meios-
irmãos), em espaçamento de 5 x 5 m. O solo é um Latossolo Amarelo, textura
pesada, localizado em um platô suave-ondulado, cuja vegetação original foi
floresta alta tropical (Ranzani, 1980). O clima caracteriza-se como Afi, no
esquema Köeppen (Ribeiro, 1976). A caracterização morfológica de pupunha foi
realizada a partir de plantas com oito anos, com um cacho por planta e 10
frutos por cacho. Foi utilizada uma lista de descritores morfológicos,
recomendada para pupunha por Clement (1986) e testada por Iriarte Martel
(2002), sendo caracterizadas morfologicamente duzentas e sessenta plantas das
raças 'Pará', 'Putumayo' e 'Solimões' (Tabela_1)
Os 15 descritores morfológicos foram: número de espigas por cacho (Nuesca),
comprimento da ráquis (Comraq), distância morfológica dos frutos (Distan), peso
dos frutos (Pesfru), adensamento dos frutos no cacho (Compca), espessura das
cascas (Espcas), facilidade para descascar os frutos (Facilde), peso das cascas
(Pescas), textura da polpa (Texpol), sabor dos frutos (Sabfru), espessura da
polpa (Espend), peso das sementes (Peseme) e teores de Água, Óleo e Fibras. Foi
verificada a consistência dos descritores entre as raças, através do teste
Wilk's-lambda. Para a aplicação das análises multivariadas, o conjunto de dados
foi padronizado, ficando cada descritor com média nula e variância unitária. A
análise de agrupamento foi processada segundo a metodologia proposta por Sneath
& Sokal (1973), e foi aplicada aos dados, utilizando-se como coeficiente de
semelhança entre pares de locais a distância euclidiana, que é um coeficiente
de dissimilaridade, pois, quanto menor a distância entre dois locais, mais
similares eles são, segundo as características consideradas. A estratégia de
agrupamento adotada foi a Average Linkage (UPGMA Unweighted Pair Group Method
with Arithmetic Averages).
Na análise de componentes principais, a variância contida em cada componente
principal é expressa pelos autovalores da matriz padronizada. O maior autovalor
é associado ao primeiro componente principal, o segundo maior autovalor ao
segundo componente principal, até que o menor autovalor esteja associado ao
último componente principal, o que coloca os primeiros como os mais
importantes. Sendo assim, os primeiros componentes principais explicam,
geralmente, grande parte da variância das variáveis originais. Esta análise
permitiu reduzir o espaço de variáveis originais (15 descritores) num conjunto
menor (oito descritores), preservando o máximo da variabilidade original dos
dados. A esse conjunto, aplicou-se a análise discriminante segundo a
metodologia recomendada por Kleka (1975), Tabachnick & Fidell (1983) e
Engelman (1997). Como resultado desta análise, foram obtidas duas funções
discriminantes que conseguiram reter 100% da variância inicial, permitindo uma
reclassificação dos acessos. As análises foram processadas no software
STATISTICA, versão 6,0.
RESULTADOS E DISCUSSÃO
A Figura_1 apresenta o resultado obtido na análise de agrupamento, mostrando a
formação de três grupos. O grupo 1 é formado pelas populações de Manaus, Rio
Preto da Eva, Belém, Santarém e Coari. Esse grupo é formado por populações da
raça Pará com exceção à população Coari, que é citada na literatura como
pertencente à raça Solimões (Mora-Urpi & Clement, 1988). O grupo 2 é
formado pelas populações de Vendaval, Alto Solimões, Tabatinga, São Paulo de
Olivença, Benjamim Constant e Umari-açu, todas da raça Putumayo. O grupo 3 é
formado pelas populações de Tefé, Jutaí e Fonte Boa, todas da raça Solimões. As
populações de Manacapuru e de Santo Antonio do Içá não pertenceram a nenhum
grupo. A população de Manacapuru é citada na literatura como pertencente à raça
Pará, e Santo Antônio do Içá pertencente à raça Putumayo (Mora Urpi &
Clement, 1988).
Na análise de componentes principais, foram considerados os dois primeiros
componentes CP1 e CP2, que armazenaram 59,2% da variância original dos
descritores (Tabela_2).
As correlações entre os descritores, número de espigas por cacho (Nuesca),
comprimento da ráquis (Comraq), peso do fruto (Pesfru), espessura das cascas
(Espcas), peso das cascas (Pescas) e espessura da polpa (Espend) e o primeiro
componente são negativas, indicando que as populações localizadas à esquerda do
eixo x possuem cachos com maior número de espigas, cachos com maior comprimento
de ráquis, bem como frutos mais pesados, cascas mais grossas e mais pesadas e
maiores espessuras de polpa quando comparados com frutos das populações
localizadas à direita do eixo x (Figura_2).
As correlações entre os descritores, facilidade para descascar os frutos
(Facilde) e sabor do fruto são positivas, indicando que as populações à direita
do eixo x possuem frutos fáceis de serem descascados (frutos pequenos) e mais
saborosos do que aqueles das populações localizadas à esquerda do eixo x. No
segundo componente principal, destacam-se: distância morfológica do fruto
(Distan) e peso da semente (Peseme) com correlações positivas e número de
espigas por cacho (Nuesca) com correlação negativa, indicando que populações
localizadas mais acima possuem frutos mais alongados com sementes mais pesadas
e menor número de espigas por cacho do que aqueles frutos das populações
localizadas mais abaixo.
Nota-se, na Figura_2, que as populações localizadas à direita do eixo x: Belém,
Santarém, Rio Preto da Eva, Manaus e Coari compõem exatamente o grupo 1,
formado pela análise de agrupamento, tendo frutos com maior facilidade de serem
descascados, frutos mais saborosos, frutos com menor peso, cascas mais finas,
cascas mais leves, com menor espessura de polpa, menor número de espigas por
cacho e menor comprimento de ráquis. Ainda na Figura_2, à esquerda do eixo x,
estão localizadas as populações: Vendaval, Alto Solimões, Tabatinga, São Paulo
de Olivença, Benjamim Constant e Umari-açu que compõem exatamente o grupo 2 da
análise de agrupamento. Por se localizarem à esquerda do eixo x, esse grupo
possui frutos mais pesados, cascas mais grossas e mais pesadas, polpa mais
grossa, maior dificuldade para serem descascados, frutos com menor sabor,
frutos com maior número de espigas por cacho e maior comprimento de ráquis. O
grupo 2 é um grupo intermediário entre o grupo 1 e o grupo 3, concordando com
Mora Urpi & Clement (1988).
Em relação ao eixo y, nota-se, na Figura_2, destaque apenas para a população de
Manacapuru por localizar-se bem acima das demais. Essa população possui frutos
mais alongados e com maior peso em suas sementes, quando comparados às demais
populações.
As populações de Manacapuru e Santo Antônio do Içá são populações atípicas
nestas análises. Na análise de agrupamento, elas não pertenceram a nenhum grupo
e, na análise de componentes principais, Manacapuru localiza-se no ponto mais
alto do gráfico, enquanto Santo Antônio do Içá, no ponto mais extremo à
esquerda.
A análise discriminante foi realizada com dez descritores: número de espigas
por cacho (Nuesca), comprimento da ráquis (Comraq), peso do fruto (Pesfru),
espessura das cascas (Espcas), peso das cascas (Pescas), espessura da polpa
(Espend), facilidade para descascar os frutos (Facilde), sabor do fruto
(Sabfru), distância morfológica do fruto (Distan) e peso da semente (Peseme)
por apresentarem maior poder discriminante. As duas funções discriminantes
(raiz 1 e raiz 2), mostrada na (Figura_3), expressaram 100% da variância,
estando a contribuição dos descritores relacionada ao tamanho, qualidade e
forma dos frutos. Estes resultados permitiram classificar as raças enquanto
Mora-Urpi & Clement (1985; 1988) e Mora-Urpi et al. (1997) utilizaram
apenas o tamanho de frutos para discriminar a existência da raça Solimões.
Entretanto, Clement (1986) utilizou descritores morfológicos das plantas e dos
frutos, não conseguindo discriminar a raça Solimões das demais. A população de
Fonte Boa, segundo o autor, seria muito similar à Putumayo, podendo ser uma
transição entre esta e Solimões, e que, neste estudo, esta população ficou
caracterizada como pertencente à raça Solimões.
Também estes dados discordam de resultados obtidos com técnicas moleculares e
isoenzimas (Picanço et al., 1999; Gallego Rodrigues et al.,1999; Rodrigues,
2001; Clement et al., 2002; Sousa et al., 2002), onde concluíram que a raça
Solimões não existe. As três técnicas estatísticas multivariadas mostraram, em
conjunto, ser um método eficiente de discriminação das raças Pará, Putumayo e
Solimões.