Análise multivariada para seleção de parâmetros de monitoramento
em manancial de Juiz de Fora, Minas Gerais
1. INTRODUÇÃO
No último censo oficial, a população de Juiz de Fora foi de 516.247 habitantes com um
acréscimo de 13,37% em relação ao ano de 2000 (IBGE, 2014). Isso tem ocasionado maiores
demanda hídrica e pressão sobre os mananciais destinados ao abastecimento público.
Paralelamente, a especulação imobiliária avançou sobre as sub-bacias de mananciais de Juiz
de Fora, destacando a Represa Dr. João Penido. Ela tem área de aproximadamente 59,48 km2
e abastece cerca de 50% da cidade com vazão regularizada de 750 litros/segundo, chegando a
até 65% no período da estiagem (CESAMA, 2014). A legislação e a fiscalização não foram
capazes de evitar este processo, colocando em risco o futuro desse manancial.
Machado (2006) considera a Lei Municipal nº 6.087 / 1981 (Juiz de Fora, 1981) um
avanço na proteção da represa, contudo, ressalva que ela é baseada em critérios pouco
científicos, estando mais ligada ao processo de ocupação do que na manutenção das
qualidades mínimas de suas águas. Esta ponderação ficou ainda mais evidente com a alteração
do artigo 9º pela Lei Municipal nº 11.817 / 2009 (Juiz de Fora, 2009) que possibilita a
“implantação de infraestrutura de alto interesse público” em áreas consideradas de
preservação. Isso foi um artifício jurídico para a construção de uma Rodovia Estadual
(Rodovia do Aeroporto) que induzirá ocupação antrópica a médio e longo prazo.
A Lei Municipal nº 6.910 / 1986 (Juiz de Fora, 1986) instituiu a Bacia Hidrográfica da
Represa Dr. João Penido como Zona Especial, sujeita a regime urbanístico específico que visa
à preservação dos seus recursos naturais e a proteção ambiental e ecológica. O ideal seria a
preservação de grandes fragmentos de floresta em toda a área da bacia, contudo, as matas
ripárias nas margens já conseguiriam muitas vantagens para o manancial envolvido. São as
funções previstas para as áreas de preservação permanente (APP), depreciadas na
reformulação do Novo Código Florestal (Ab’Sáber, 2010; Casatti, 2010; Tundisi e Tundisi,
2010; Brasil, 2012a; 2012b, Rocha e Costa, 2015).
O adequado gerenciamento dos recursos hídricos tem sido uma constante preocupação
dos gestores públicos. Para que haja fornecimento de água com boa qualidade e quantidade é
necessário estabelecer um planejamento do uso e cobertura da terra nas bacias de mananciais
de abastecimento (Bhattacharyya e Kapil, 2010; Tu, 2011; Sheela et al., 2012; Thurston et al.,
2012; Abildtrup et al., 2013; Yu et al., 2013; Rocha et al., 2014).
Diante deste contexto, verifica-se a necessidade de um planejamento para a ocupação da
região em que está inserida a Represa e também um monitoramento contínuo de suas águas.
Tal monitoramento visa o controle da qualidade da água e busca avaliar diversos parâmetros,
os quais muitas vezes são difíceis de analisar e interpretar devido à grande quantidade de
dados, principalmente se as coletas e as análises de água ocorrerem por muitos anos. A fim de
suplantar esse obstáculo é feita a utilização de abordagens multivariadas como a Análise
Fatorial (AF) e a Análise de Componentes Principais (ACP) que são úteis para obter
informações significativas, promovendo a redução do número de variáveis com o mínimo de
perdas das informações (Liao et al., 2008; Bernardi et al., 2009; Autin e Edwards, 2010;
Vanzela et al., 2010; Akbar et al., 2011; Mendonça e Souza, 2011; Spezia et al., 2011; Tu,
2011; Baborowski et al., 2012; Guedes et al., 2012; Sheela et al., 2012; Rocha et al., 2014).
Com base no que foi abordado, teve-se por objetivo selecionar os parâmetros mais
relevantes para monitoramento da Represa Dr. João Penido, principal manancial de
abastecimento de Juiz de Fora, MG, verificando pela Análise Fatorial / Análise de
Componentes Principais os parâmetros que melhor explicam a variância total dos dados, ou
seja, os mais relevantes para esta sub-bacia.
2. MATERIAIS E MÉTODOS
As informações limnológicas utilizadas foram fornecidas pela CESAMA - Companhia de
Saneamento Municipal de Juiz de Fora e são referentes às análises da água na captação da
Represa Dr. João Penido, com coordenadas geográficas: 21º 41’ 03,3” S e 43º 24’ 12,68” W
(Datum WGS-84), localizada ao norte do município, 10 km da malha urbana. A construção da
Represa Dr. João Penido se deu com o barramento do ribeirão dos Burros (córrego principal),
contando também com os córregos Grama (ao centro), Vista Alegre (a leste) e outros
tributários conforme a Figura 1.
Figura 1. Mapa de Localização da área de estudo.
Fonte: Rocha et al. (2014).
Foram analisados os seguintes parâmetros: pH, cor, turbidez, ferro (Fe), manganês (Mn),
fósforo total (FT), alcalinidade HCO3
-, cloreto, dureza, oxigênio consumido (OC), oxigênio
dissolvido (OD), condutividade e demanda bioquímica de oxigênio (DBO5,20) referentes às
medições mensais realizadas entre o ano de 1998 a 2012, com exceção dos anos 2003 e 2004
não disponibilizados pela CESAMA, totalizando 13 anos de monitoramento.
Para a cidade de Juiz de Fora, o Plano Diretor de Desenvolvimento Urbano - PDDU (Juiz
de Fora, 2000), estabelece que há uma sazonalidade bem definida no município, sendo a
estação chuvosa de outubro a abril, com temperaturas mais elevadas e maiores precipitações
(média de 20,9 ºC e 199 mm por mês) e a estação seca de maio a setembro, período mais frio
e com menor presença de chuvas (média de 17,1 ºC e 40 mm por mês).
Procedeu-se ao cálculo das médias de cada parâmetro para as duas estações anualmente e
verificou-se a ocorrência de normalidade (Teste Kolmogorov-Smirnov). Foi aplicado o teste t
de Student, com o auxílio do Microsoft Office Excel 2010, para verificar a ocorrência de
variação estatisticamente significativa (p < 0,05) entre as médias históricas das matrizes
formadas com os dados de seca e chuva dos treze anos monitorados.
Alguns dados não foram mensurados durante vários meses de um mesmo ano,
impossibilitando calcular uma média referente à estação daquele ano. Por esse motivo, o
parâmetro ferro (Fe) foi excluído nos anos de 1998 e 1999; o manganês (Mn) e a
condutividade foram excluídos de 1998 a 2002; os dados de fósforo total (FT) foram
excluídos nos anos de 1998 a 2002 e 2005; os OD foram excluídos nos anos de 2000, 2002 e
2011; e a DBO5,20 nos anos de 1998 a 2002 e 2011.
Verificou-se a adequação dos dados à AF por meio dos testes de Kaiser-Meyer-Olkin
(KMO) e esfericidade de Bartlett. As análises multivariadas (AF / ACP) foram realizadas no
software SPSS® 15.0, e consistiram em três etapas, descritas por Toledo e Nicolella (2002):
elaboração da matriz de correlação; extração dos fatores comuns com possível redução das
variáveis explicativas e rotação dos eixos relativos aos fatores comuns, visando facilitar e
simplificar a interpretação, somente quando necessário.
Os dados originais, em forma de matriz, foram expressos por X= (Xi,j) em que, i = 1...n
amostragens e j = 1...p variáveis limnológicas. As amostragens abrangeram os anos de 1998 a
2012, com exceção dos anos 2003 e 2004, havendo, entretanto, ausência de dados em vários
meses, os quais foram desconsiderados nas análises.
O coeficiente de correlação superior a 0,5 expressa uma forte correlação entre as
variáveis limnológicas (Cohen, 1988 e Helena et al., 2000). Valores entre 0,3 e 0,49
expressam uma moderada correlação (Cohen, 1988). Para extração das componentes
principais, utilizou-se a matriz de correlação com vista a eliminar o problema de escalas e
unidades diferenciadas em que as variáveis foram medidas. A principal característica da ACP,
além da ortogonalidade, é que as componentes principais são obtidas em ordem decrescente
de máxima variância. Assim, a primeira componente explica o máximo da variabilidade total
dos dados; a segunda, explica o máximo da variabilidade dos dados restantes, não
correlacionados com a primeira e assim sucessivamente (Guedes et al., 2012).
Os resultados da ACP, em alguns casos, podem apresentar dificuldades na sua
interpretação. Objetivando superar tal obstáculo, adota-se o procedimento de rotação
ortogonal da matriz das cargas fatoriais que possibilita melhor interpretação dos fatores ao
redistribuir a variância explicada pelas componentes, não alterando na variância acumulada
do conjunto de componentes. A utilização da rotação ortogonal pelo método Varimax permite
um melhor ajuste ao modelo fatorial possível de explicação, sendo frequentemente utilizada
em estudos de qualidade de água e processos hidrológicos (Aprile e Farias, 2001; Andrade et
al., 2007; Girão et al., 2007; Guedes et al., 2012).
3. RESULTADOS E DISCUSSÃO
Os resultados das análises preliminares, que visaram testar a adequacidade dos dados à
AF/ACP, possibilitaram o emprego de tal metodologia. Ao testar a hipótese de que a matriz
de correlação é uma matriz identidade, teste de esfericidade de Bartlett (p ˜ 0,000), foi
descartada a hipótese nula, verificando a existência de correlações significativas entre as
variáveis. Outro teste utilizado foi o índice de adequação da amostra (KMO), que segundo
Hair et al. (2007), quantifica o grau de intercorrelação entre as variáveis. O resultado
encontrado foi KMO = 0,701, o que permite a aplicação da análise.
Informações relevantes sobre a dinâmica das variáveis pode ser obtida através da matriz
de correlação. Os parâmetros limnológicos que possuíram maior número de correlações
(Tabela 1) tiveram maior importância na composição das componentes principais (CPs). A
variável pH foi eliminada por apresentar correlações fracas com as outras variáveis e o teste
foi refeito. No processamento da AF / ACP, a partir da matriz de correlação, foram extraídas
as comunalidades, que representam o nível de associação entre a variável e os fatores
extraídos, ou seja, a porcentagem da variância da variável explicada pelos fatores utilizados
(Toledo e Nicolella, 2002). Valores abaixo de 0,5 indicam que a variável deve ser eliminada e
a AF / ACP refeita (Figueiredo Filho e Silva Júnior, 2010). Norteados por tais considerações,
eliminou-se a dureza, a alcalinidade e o manganês da análise.
Tabela 1. Matriz de correlação das variáveis limnológicas da Represa Dr. João Penido.
As três primeiras componentes, explicaram cerca de 73% da variância total dos dados.
Embora não exista um critério consensual sobre o número de fatores que devem ser extraídos
na análise, o critério de Kaiser sugere a extração dos fatores com autovalor acima de um
(Figueiredo Filho e Silva Júnior, 2010). Já Hair et al. (2007) sugerem que o número de
componentes que representem 60% da variância acumulada, refletem uma ideia aceitável da
variância original.
A Tabela 2 apresenta a matriz não rotacionada de pesos fatoriais que indica a
contribuição que cada variável possui na componente principal. Esse valor deve ser maior que
o valor absoluto de 0,5 e deve corresponder a uma única componente. O parâmetro OC
apresentou valores maiores que 0,5 em mais de uma componente, mesmo após rotação.
Optou-se por eliminá-lo e refazer o teste, resultando na Tabela 2. Caso semelhante aconteceu
com a turbidez, porém, ao rotacionar a matriz pelo método Varimax, o problema foi superado
conforme Tabela 3.
Tabela 2. Matriz de pesos fatoriais das variáveis limnológicas nas três componentes principais
selecionadas.
Nota: Os três tons de cinza destacam o peso de cada variável para aquela Componente Principal (CP).
A primeira componente, após a aplicação do algoritmo Varimax (FV1), explicou
cerca de 38,2% da variância total dos dados e teve como variável mais expressiva a cor,
cujo valor foi de 0,879 (Tabela 3).
Tabela 3. Matriz de pesos fatoriais das três componentes principais após rotação Varimax.
Nota: Os três tons de cinza destacam o peso de cada variável para o Fator Varimax – FV.
As outras variáveis desta componente também apresentaram resultados expressivos,
cujos valores estão acima de 0,700. Dentre as variáveis estudadas, a cor e o Fe foram as que
apresentaram maior número de correlações, inclusive possuindo entre si, o maior coeficiente
de Pearson da matriz (Tabela 1). Isso se justifica pelo fato do Fe, na ausência de oxigênio
dissolvido, se apresentar em sua forma reduzida (Fe2+), podendo se oxidar e precipitar
causando coloração na água (Von Sperling, 2005). Os resultados obtidos pelo teste t de
Student destacam variação sazonal para a cor e o Fe com elevação de suas médias na estação
chuvosa (Tabela 4), o que já foi observado por Rocha et al. (2014). Além disso, a turbidez
está intrinsecamente relacionada com a cor presente na água, de forma que quando a cor
aumenta, a turbidez também pode aumentar (Von Sperling, 2005). Para a CETESB (2009), a
condutividade está relacionada com a presença de sais na água, indicando indiretamente uma
medida da concentração de poluentes. A condutividade da água é proporcional ao aumento de
sólidos dissolvidos, o que pode explicar a presença da condutividade nessa componente, visto
que a cor também está relacionada com a presença dos sólidos dissolvidos. Uma fonte
importante para o OD é a produção fotossintética (CETESB, 2009). Dessa forma, o OD se
relaciona nessa componente, devido a presença de cor e turbidez que influenciam na
passagem dos raios solares no corpo d’água e com isso podem diminuir a disponibilidade de
luz para a fotossíntese e consequentemente diminuir a geração de OD na água.
A segunda componente (FV2) que explicou cerca de 17,8% da variância dos dados foi
composta pelos parâmetros fósforo total e cloreto. A presença de fósforo nas águas pode ter
origem na dissolução de compostos do solo (escala muito pequena), despejos domésticos e/ou
industriais, detergentes, excrementos de animais e fertilizantes. Concentrações elevadas de
fósforo podem contribuir, da mesma forma que o nitrogênio, para a proliferação de algas e
acelerar o processo de eutrofização. Assim como o fósforo total, a presença de cloreto
também está relacionada ao lançamento de efluentes domésticos no corpo hídrico. Enquanto o
fósforo é proveniente, principalmente de detergentes e excretas de animais, o cloreto está
presente na urina humana e estima-se que cada pessoa expele através da urina cerca 6 g de
cloreto por dia, o que faz com que os esgotos apresentem concentrações de cloreto que
ultrapassam a 15 mg.L-1 (CETESB, 2009).
A componente FV3 foi representada por uma única variável, a DBO. Dentre todas as
componentes, essa foi a mais expressiva, com valor de 0,918. Além disso, a variável explicou
cerca de 17% da variância total dos dados. Esse resultado reforça a importância desse
parâmetro, que é um dos mais utilizados para indicação da qualidade da água. A DBO
(Demanda Bioquímica de Oxigênio) se refere a quantidade de oxigênio necessária para
degradar a matéria orgânica presente no meio. Os maiores aumentos em termos de DBO, num
corpo d’água, são provocados por despejos de origem predominantemente orgânica. A
presença de um alto teor de matéria orgânica pode induzir ao completo esgotamento do
oxigênio na água, provocando o desaparecimento de peixes e outras formas de vida aquática.
Um elevado valor da DBO pode indicar um incremento da microflora presente e interferir no
equilíbrio da vida aquática (CETESB, 2009).
Tabela 4. Resultados do Teste t-Student e médias e desvios padrões das variáveis monitoradas.
O comportamento das variáveis e sua distribuição pelas componentes permitem verificar
as relações que estas apresentam entre si. Dessa forma, assim como feito por outros autores
(Helena et al., 2000; Andrade et al., 2007; Guedes et al., 2012), é possível atribuir um nome
que represente as características comuns entre tais variáveis de cada componente. Logo, a
FV1 reflete a influência de sólidos dissolvidos associados ao escoamento superficial pelo fato
das variáveis com os maiores coeficientes terem apresentado diferenças significativas entre as
estações de seca e chuva. A FV2 se associa fortemente a possíveis lançamentos de esgoto na
área da bacia. A concentração de fósforo total se mostrou muito elevada nas duas estações,
pois a média para o período seco foi de 0,346 mg.L-1 e para o período chuvoso foi de 0,333
mg.L-1. Esses valores são cerca de 3 vezes maiores que o permitido pela Resolução
CONAMA 357/2005 (Brasil, 2005) para águas doces de Classe 1 (0,1 mg.L-1 P). A FV3,
assim como a FV2, caracteriza a influência do lançamento de esgotos na área da bacia, como
já foi observado por Rocha et al. (2014).
Os resultados obtidos pelo teste t de Student apontaram as variáveis cor, turbidez, ferro,
OC e condutividade com diferença sazonal significativa (p<0,05). Todas com aumento nas
médias no período chuvoso. Contudo, não se descarta a hipótese de que outras variáveis
também sofram interferência da precipitação, uma vez que é difícil mensurar temporalmente
as influências das chuvas sobre as variáveis limnológicas (Fritzsons et al., 2003).
Acrescenta-se o fato das amostras coletadas serem provenientes da captação, onde a qualidade
da água pode ser resultado, dentre outros processos, do efeito de tamponamento ao longo do
curso hídrico e da decantação na Represa, semelhante ao descrito por Carvalho et al. (2000) e
Padial et al. (2009).
Observa-se também que o parâmetro DBO5,20 apresentou valores de desvio padrão, tanto
para a estação seca quanto para a chuvosa, maiores que os valores das médias. Isso indica que
os dados desse parâmetro estão variando muito. Esses altos valores de desvio padrão também
poderiam ser explicados pela grande lacuna de dados desse parâmetro, entre 1998-2002 e
2011.
Ao se considerar que a componente FV1, a que mais explicou as variâncias totais dos
dados, é resultante do transporte e lixiviação de materiais alóctones, deduz-se que o uso e a
ocupação irregular do solo no entorno da sub-bacia influencia diretamente na qualidade da
água deste manancial. Carneiro et al. (2010) afirmam que há uma desarticulação entre os
instrumentos de gerenciamento dos recursos hídricos e os de planejamento do uso do solo,
marcada pelo forte grau de informalidade e até mesmo ilegalidade na ocupação do solo. Este
fato é nitidamente observado na sub-bacia de contribuição da Represa Dr. João Penido, sendo
que resultados semelhantes foram encontrados por Rocha et al. (2014) num período de sete
anos de monitoramento.
4. CONCLUSÃO
A utilização do teste t de Student confirmou a necessidade de estudos que contemplem
diferentes estações (seca e chuva), tendo em vista a variação observada para importantes
parâmetros limnológicos em virtude da pluviosidade.
A Análise Fatorial / Análise de Componentes Principais promoveu a redução do número
de variáveis de qualidade da água: dos treze parâmetros analisados, cinco foram eliminados, o
que facilita a interpretação dos dados que mais influenciaram na dinâmica desta sub-bacia e
diminuindo custos com monitoramento.
A análise permitiu a seleção de três componentes principais que explicaram 73,1% da
variação total dos dados, indicando o escoamento superficial como principal determinante das
variáveis que compõem a primeira componente e a contribuição orgânica, não associada à
precipitação pluviométrica, como sugestiva das variáveis das segunda e terceira componentes.
A seleção de parâmetros de monitoramento de qualidade da água é relevante para o
gerenciamento de recursos hídricos, consideradas as especificidades de cada sub-bacia e
manancial correspondente. As informações obtidas podem apoiar decisões sobre
planejamento e uso da terra, além de reduzir gastos com monitoramento.