Home   |   Structure   |   Research   |   Resources   |   Members   |   Training   |   Activities   |   Contact

EN | PT

BrBRHUAp0080-21072012000200013

BrBRHUAp0080-21072012000200013

variedadeBr
ano2012
fonteScielo

O script do Java parece estar desligado, ou então houve um erro de comunicação. Ligue o script do Java para mais opções de representação.

Avaliação da adequação de aplicação de técnicas multivariadas em estudos do comportamento do consumidor em teses e dissertações de duas instituições de ensino superior

1. INTRODUÇÃO Os aspectos metodológicos têm grande relevância no desenvolvimento de trabalhos científicos. Para Gamboa (1987, p.17), a importância da análise da produção científica, amparada nas competências metodológicas, justifica-se, visto que sua questão é de fundamental e decisiva importância para o desenvolvimento e os resultados da pesquisa acadêmica.

Diversas obras a partir da década de 1990 têm tratado da avaliação dos aspectos metológicos por meio de pesquisas que focam a questão da qualidade da produção científica em Administração, destacando-se: administração pública (MA- CHADO- DA-SILVA, 1989); finanças (LEAL, OLIVEIRA e SOLURI, 2003); marketing (POWERS, SWAN e PATTOM, 1998; VIEIRA, 1998; BOTELHO e MACERA, 2001); - todos quantitativos (BREI e LIBERALI, 2004); operações (ARKADER, 2003); organizações (MACHADO-DA-SILVA, 1990; BERTERO e KEINERT, 1994; VERGARA e CAR- VALHO, 1995; BERTERO e KEINERT, 1999; RODRIGUES FILHO, 2002); pesquisa em administração (MARTINS, 1994; TORRES, 2000; PERIN, 2002); recursos humanos (ROESCH, ANTUNES e SILVA, 1997; CALDAS, TONELLI e LACOMBE, 2002; TONELLI et al., 2003); sistemas de informação (HOPPEN, 1998).

A preocupação dos autores dessas obras na avaliação da produção científica tem se dirigido para a discussão sobre aspectos epistemológicos e sobre aspectos metodológicos, mas no caso dessa segunda vertente o número de estudos disponíveis na literatura pesquisada é mais reduzido.

Na literatura internacional pesquisada encontram-se diversas abordagens que tratam da inadequação no entendimento de escalas básicas de medidas (GAITO, 1980; TOWNSEND e ASHBY, 1984; VELLEMAN e WILKINSON, 1993) e inadequação do uso de testes paramétricos (FRICK, 1998; YU et al., 2000). No entanto, estudos que avaliam especificamente a adequação do uso dos métodos quantitativos são praticamente inexistentes.

Os métodos quantitativos foram largamente empregados nas dissertações e teses apresentadas na Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo (FEA-USP), na Faculdade de Economia e Administração da Pontifícia Universidade Católica (FEA-PUC) e na Escola de Administração de Empresas de São Paulo da Fundação Getulio Vragas (EAESP-FGV), entre os anos de 1980 e 1993, segundo Martins (1994, p.65-66), que ressaltou na avaliação dessas obras o uso superficial das técnicas, sem consideração de seu nível de complexidade e sofisticação. Tal superficialidade também é ressaltada pelo autor na aparente despreocupação com as premissas teóricas de aplicação da maior parte dos métodos apresentados nesses trabalhos.

No tratamento quantitativo dos dados para a produção científica, tem sido crescente o emprego de técnicas de análise multivariada pelo fato de que, nas últimas décadas, vários pa- cotes computacionais estatísticos foram aperfeiçoados sobremaneira no sentido de facilitar o acesso do usuário a seus comandos na área de trabalho, sem a necessidade de serem escritas sintaxes para o processamento das técnicas estatísticas.

Essa evolução tecnológica notória nos software estatísticos proporcionou a diminuição de barreiras para os usuários, atendendo adequadamente à demanda dos cientistas das ciências sociais aplicadas, entre elas a Administração.

Entretanto, tem-se constatado, a partir da experiência de orientação e docência dos autores deste estudo, a ocorrência de erros de aplicação, seja na inadequação dos objetivos de uso das ferramentas com os objetivos propostos na pesquisa, seja na violação de premissas de aplicação das técnicas. situações em que o pesquisador apenas exercita o emprego de uma técnica e distancia-se de seu problema de pesquisa e do alcance dos objetivos inicialmente traçados.

Martins (1994, p.66) afirma que os métodos quantitativos são, em Administração, mais aplicados pelos autores de pesquisa nas áreas de marketing, produção e finanças.

A área de marketing apresenta campo fértil para utilização de técnicas quantitativas, especialmente a análise multivariada, principalmente pela necessidade de conhecer-se o mercado consumidor a partir da mensuração das opiniões, atitudes, preferências, perfil e outras características dos consumidores (MALHOTRA, 2001).

Nesse sentido, as ferramentas de análise multivariada têm sido intensamente aplicadas em marketing, especialmente na temática do comportamento do consumidor. Para Milagre (2001, p.74), o uso da técnica multivariada tornou-se mais co- mum a partir do momento que os acadêmicos e profissionais de marketing passaram a aplicá-la em estudos sobre a preferência e satisfação do consumidor, bem como seu perfil e comportamento de compras.

Assim, neste estudo pretende-se aprofundar a discussão sobre aspectos metodológicos no uso de técnicas estatísticas multivariadas, especialmente sob o recorte de suas aplicações nos estudos em marketing sobre o comportamento do consumidor. Para tanto, serão focalizadas as técnicas: análise de regressão, análise discriminante, análise de regressão logística, correlação canônica, análise multivariada de variância, análise conjunta, modelagem de equações estruturais, análise fatorial, análise de conglomerados, análise de correspondência e escalonamento multidimensional.

Nesse contexto, os objetivos a serem alcançados neste estudo são: • identificar a intensidade de uso das técnicas multivariadas na área de marketing, temática do comportamento do consumidor, tendo como unidade de análise dissertações e teses de duas universidades públicas no período de 1997 a 2006: Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo e Escola de Administração da Universidade Federal do Rio Grande do Sul (EA- UFRGS).

• identificar o nível de adequação do uso das técnicas multivariadas aos problemas de pesquisa apresentados nessas dissertações e teses selecionadas; • identificar fontes de erros da aplicação das técnicas multivariadas, a partir do não atendimento a suas premissas básicas, no conjunto da produção científica examinada.

A seleção desses programas de pós-graduação como público-alvo deste estudo deveu-se à necessidade de delimitação, dada a dificuldade operacional de um levantamento amostral representativo da produção nacional, principalmente pela indisponibilidade de material em base de dados on-line por uma parcela importante das instituições do País.

Nesse sentido, optou-se inicialmente por um recorte focado nos programas de pós-graduação de alto desempenho na última avaliação da Coordenação de Aperfeiçoamento de Pessoal de Nível Superior (Capes), que estava disponível quando este estudo teve início. Registre-se que a opção por esse critério não se motivou pela suposição de que os programas com avaliação menos positiva, abaixo da nota seis, tratariam as técnicas em estudo de forma mais ou menos corretas. A avaliação da Capes apontava, na Avaliação Trienal 2007, três Instituições com nota seis: a FEA-USP, a EA-UFRGS e a EAESP-FGV. Observação: essas instituições permanecem bem avaliadas mesmo com sua atual pontuação pela Capes, referente ao período de avaliação de 2007 a 2009 (Avaliação Trienal 2010), a saber: FEA-USP, nota sete; EA-UFRGS, nota seis; EAESP-FGV, nota seis.

Um segundo critério adveio da necessidade de garantir a maior homogeneidade possível da população-alvo, que não é objetivo específico neste estudo a comparação entre instituições. Nesse sentido, a seleção levou em conta a natureza da instituição: pública ou privada. Considerando que, entre as três citadas, duas são públicas, optou-se pela análise das dissertações e teses das instituições públicas: FEA-USP e EA-UFRGS.

Destacam-se alguns fatores restritivos na abrangência dessa investigação: • delimitação do público-alvo: os resultados deste estudo são apenas válidos para as dissertações e teses da FEA-USP e da EA-UFRGS, de 1997 a 2006; • as informações sobre o atendimento às premissas das técnicas multivariadas são baseadas nos relatos dos autores de cada dissertação ou tese sob análise, que evidentemente podem conter uma descrição subestimada ou superestimada do que foi realizado.

2. FUNDAMENTAÇÃO TEÓRICA Nesta seção haverá uma introdução sobre análise multivariada, seguida por uma apresentação geral das técnicas multivariadas e suas premissas.

2.1. Análise multivariada Segundo Steiner (1995), a necessidade de entender a relação entre diversas variáveis aleatórias faz da análise multivariada uma metodologia com grande potencial de uso.

Para Lourenço e Matias (2001), por um lado as técnicas estatísticas multivariadas são mais complexas do que aquelas da estatística univariada. Por outro lado, apesar de uma razoável complexidade teórica fundamentada na matemática, as técnicas multivariadas, por permitirem o tratamento de diversas variáveis ao mesmo tempo, podem oferecer ao pesquisador um material bastante robusto para a análise dos dados da pesquisa.

Conforme Hair Jr. et al. (2009), a análise multivariada auxilia na formulação de questões relativamente complexas de forma específica e precisa, possibilitando a condução de pesquisas teoricamente significativas.

2.2. Técnicas estatísticas de análise multivariada A escolha dos métodos e tipos de análises empregados nos trabalhos científicos deve ser determinada pelo problema de pesquisa. Nesse sentido, Johnson e Wichern (1998, p.2) propõem uma classificação dos objetivos para atendimento do problema em cinco categorias, como poder ser visto no quadro_1.

O passo seguinte para a escolha da técnica de análise multivariada, após se considerarem os objetivos do problema de pesquisa, é verificar o tipo de relação examinada, número de variáveis dependentes e tipo de escala utilizada.

Sobre o tipo de relação, as técnicas são classificadas como de dependência ou de interdependência. Na primeira situação, uma ou mais variáveis (variáveis dependentes) podem ser explicadas ou preditas por outras (variáveis independentes). Na segunda, todas as variáveis são analisadas simultaneamente, sem a orientação de dependência ou independência.

Sobre o tipo de escala utilizada, pode-se generalizar a classificação teórica de mensuração em dois grandes grupos: variáveis métricas e variáveis não métricas.

Do cruzamento entre o tipo de relação examinada, número de variáveis dependentes e tipo de escala utilizada, tem-se um esquema de classificação para o conjunto de técnicas, exibido nos quadros_2 e 3.

2.3. Premissas das técnicas multivariadas No quadro_4, apresenta-se a relação de premissas teóricas na aplicação das técnicas multivariadas, bem como a indicação, por meio de "X", de cada técnica que apresenta associação com determinada condição. Nesse quadro, não foi incluída a análise conjunta pelo fato de nenhuma das premissas teóricas se aplicar a essa técnica.

Todas as técnicas estatísticas de análise multivariada têm suposições intrínsecas, matemáticas e estatísticas que, caso não satisfeitas, podem influenciar de forma bastante negativa os resultados da análise.

Nesse ponto, deve-se registrar que essas premissas ou suposições são inerentemente integrantes ao processo de construção teórica da técnica e, sem seu atendimento, não se pode garantir que o algoritmo inerente à técnica realmente terá o comportamento que se espera.

2.3.1. Multicolinearidade A abordagem algébrica da multicolinearidade pode ser retratada sucintamente pelo diagrama de Ballentine. Na figura_1, os círculos de Y, X2 e X3 representam, respectivamente, as variações em Y (a variável dependente) e X2 e X3 (as variáveis explicativas). O grau de multi(colinearidade) pode ser medido pelo nível de sobreposição (área sombreada) dos círculos X2 e X3 (GUJARATI, 2000, p.319-320).

Os efeitos da multicolinearidade podem ser classificados em termos de explicação e estimação. Com relação à explicação, na situação de multicolinearidade, o processo de separação de efeitos individuais de cada variável independente sobre uma dependente torna-se mais difícil, ficando mais complicada a determinação da contribuição de cada variável independente, porque os efeitos das variáveis independentes estão misturados.

• "A multicolinearidade resulta em partes maiores de variância compartilhada e níveis mais baixos de variância única da qual os efeitos das variáveis independentes individuais podem ser determinados" (HAIR JR. et al., 2009, p.191).

Com relação à estimação, graus elevados de multicolinearidade podem fazer com que os coeficientes das variáveis independentes sejam incorretamente estimados e tenham até mesmo os sinais errados.

Em regressão múltipla, essa premissa é relaxada quando o objetivo for predição (GUJARATI, 2000).

2.3.2. Ausência de erros correlacionados (autocorrelação dos resíduos) Segundo Kendall e Buckland (1971, p.8), o significado de autocorrelação pode ser entendido como a "correlação entre membros de séries de observações ordenadas no tempo (séries temporais) ou no espaço (crosssection)".

No escopo das técnicas, análise de regressão e correlação canônica pressupõe-se que não exista essa correlação, ou seja, admite-se que o erro referente a uma previsão qualquer não seja influenciado pelo erro de outra previsão qualquer.

Se houver correlação entre os erros, não se poderá afirmar a respeito de sua independência nos níveis de significância em que se está tentando fazer previsão da variável dependente. Provavelmente, alguma outra variável independente esteja afe-tando os resultados, sem ter sido incluída na análise (HAIR JR. et al., 2009, p.86).

A literatura consultada apresenta alguns testes para detecção da presença de autocorrelação, entre eles: teste de Geary (ou teste das carreiras), teste de Breush-Godfrey, teste M de Durbin e teste de Durbin-Watson, o mais largamente utilizado (GUJARATI, 2000; HAIR JR. et al., 2009).

2.3.3. Observações atípicas As observações atípicas ou extremas (outliers) são aquelas substancialmente diferentes das outras.

Sobre os outliers multivariados, esses são casos com valores extremos no conjunto de múltiplas variáveis e operacionalmente definidos por meio de três medidas mais comumente usadas e disponíveis na maioria dos pacotes estatísticos comerciais: distância de Cook, distância de Mahalanobis e distância de Leverage (HAIR JR. et al., 2009). De um ponto de vista prático, segundo Hair Jr. et al.

(2009, p.77), observações atípicas podem ter um efeito sensível sobre qualquer tipo de análise empírica, como o cálculo da renda média familiar de 21 pessoas, havendo para 20 delas variações entre R$ 20.000,00 e R$ 100.000,00 ao ano, para a 21ª uma renda de R$ 1 milhão ao ano. A observação atípica deve ser vista sob a ótica do quão representativa ela é na população, devendo o pesquisador avaliar se o valor marginal deve ser mantido ou eliminado, no caso de exercer influência indevida sobre os resultados.

2.3.4. Correlação entre as variáveis preditas As variáveis dependentes na MANOVA devem apresentar certo grau de correlação, embora não muito acentuado; caso contrário, seria recomendável empregar a análise univariada de variância para cada uma das variáveis dependentes.

Testes individuais por variável dependente realizados na análise univariada de variância (ANOVA) ignoram as correlações entre as variáveis dependentes e usam menos do que a informação total disponível para avaliar as diferenças globais dos grupos. Quando as variáveis dependentes apresentam correlação entre elas, a MANOVA tem maior poder de detectar diferenças significantes nos grupos do que a ANOVA.

2.3.5. Homoscedasticidade Diz-se que, quando a variância dos termos de erro parece constante ao longo do domínio da variável preditora, tem-se homoscedasticidade (HAIR JR. et al., 2009). Essa é uma propriedade fundamental que deve ser garantida, sob pena de invalidar toda a análise estatística. Quando a homoscedasticidade não é atendida, podem ser observadas melhores previsões em alguns níveis das variáveis independentes do que em outros. Essa variabilidade afeta os erros padrões e torna os testes de hipóteses muito restritos ou insensíveis (HAIR JR.

et al., 2009, p.85).

A homoscedasticidade pode inicialmente ser verificada por meio de gráficos de resíduos (erros). Os gráficos dos erros contra os valores reais e contra os valores previstos são importantes. Se os pontos estão distribuídos aleatoriamente, sem demonstrar um comportamento definido, homoscedasticidade.

A literatura consultada apresenta uma série de testes estatísticos para avaliação da homoscedasticidade, entre eles (GARSON, 2007; HAIR JR. et al., 2009): teste de Goldfeld-Quandt; teste de Park; teste de de Breusch-Pagan- Godfrey; teste de White's; teste de Levene para homogeneidade das variâncias; teste de Bartlett's para homogeneidade das variâncias; teste F-max; teste Box's M.

2.3.6. Linearidade Conforme Hair Jr. et al. (2009), de forma geral os modelos lineares preveem valores que se ajustam a uma linha reta, que tem uma mudança com unidade constante da variável dependente em relação a uma mudança constante na variável independente.

Essa suposição está implícita em todas as técnicas multivariadas baseadas em medidas correlacionais de associação. Como as correlações representam apenas a associação linear entre variáveis, os efeitos não lineares não serão representados no valor da correlação, resultando em uma subestimação da força real da relação (HAIR JR. et al., 2009, p.86).

A inspeção simples de gráficos como o diagrama de disper- são (scatterplot), por exemplo, é um método simples e comum para a verificação de linearidade.

Além disso, a análise de correlação e outros testes mais complexos são disponíveis para detecção dessa premissa.

Huberty (1994) e Eisenbeis (1997) admitem o relaxamento dessa premissa quando a normalidade multivariada é atendida e quando a amostra é razoavelmente grande.

2.3.7. Normalidade Nas técnicas estatísticas de análise multivariada que utilizam variáveis métricas e testes estatísticos para análise dos resultados, a normalidade multivariada é a condição mais fundamental de aplicação. Entretanto, no caso da análise de regressão, a premissa de normalidade univariada, considerando-se apenas a variável referente aos resíduos.

Johnson e Wichern (1998) alertam que, para dados reais, a presença de variáveis com distribuição normal multivariada exata dificilmente ocorre. Hair Jr. et al.

(2009, p.83) alertam que, se a variação em relação à distribuição normal é suficientemente grande, todos os testes estatísticos resultantes são inválidos, uma vez que a normalidade é exigida no emprego das estatísticas F e t.

Para Sharma (1996, p.380), poucos métodos disponíveis para testar a normalidade multivariada. Baseado nas funções de Skewness e Kurtosis, o índice de Mardia encontra-se disponível no pacote estatístico LISREL e no pacote estatístico EQS.

2.3.8. Número de variáveis Para a adequada aplicação da técnica escalonamento multidimensional, o número de variáveis deve ser maior ou igual a 3, segundo Hair Jr. et al. (2009).

2.3.9. Número de categorias por variável Uma exigência da técnica análise de correspondência é que o número mínimo de categorias por variável deve ser três, porém, sem ser muito elevado, de acordo com Hair Jr. et al. (2009). A exigência de no mínimo três categorias por variável ocorre para a análise de correspondência binária, tendo em vista que a fórmula do cálculo do número máximo de dimensões do mapeamento gerado pela técnica, a partir de uma tabela com r linhas e c colunas, é igual ao número mínimo entre r e c subtraído de 1 (HAIR JR.et al., 2009, p.513).

2.3.10. Número de dimensões Para o emprego de escalonamento multidimensional, o número de dimensões não pode superar o número de casos. Se houver mais dimensões que objetos, a solução da técnica será instável. Se houver muito poucos objetos em relação a dimensões, as medidas de ajuste serão falsamente boas (SPSS, 2003).

2.3.11. Padronização das variáveis As técnicas análise de conglomerados e escalonamento multidimensional requerem uma padronização de variáveis métricas que apresentem diferentes magnitudes. No caso da análise fatorial, a padronização não é uma premissa; entretanto pode ser aplicada aos dados antes do processamento desta técnica (HAIR JR. et al., 2009). A necessidade de padronização deve-se ao fato de a maioria das medidas de distância ser bastante sensível a diferentes escalas ou magnitudes entre as variáveis (HAIR JR. et al., 2009, p.445).

2.3.12. Tamanho da amostra Aliado a um correto procedimento de amostragem, o tamanho da amostra (número de casos, indivíduos, observações, entrevistas) deve ser adequado para permitir a generalização dos resultados, os quais podem ser verificados quanto à significância estatística dos testes.

As facilidades oferecidas pela maioria dos pacotes computacionais de aplicação estatística podem comprometer a observância do tamanho mínimo da amostra pelo pesquisador, fato que pode causar uma série de problemas importantes. Para Hair Jr. et al. (2009), essa omissão pode resultar em: baixíssmo poder estatístico dos testes de significância; um ajuste muito adequado dos dados, tornando os resultados artificialmente bons.

2.3.13. Tamanho dos grupos Uma das exigências para o emprego adequado da técnica de análise discriminante é o dimensionamento de cada grupo estabelecido pela variável dependente.

Segundo Hair Jr. et al. (2009), cada grupo deve ter no mínimo 20 observações para estabelecer-se a função discriminante.

3. METODOLOGIA DE PESQUISA Nesta seção, serão apresentados os tópicos referentes a: caracterização da população, desenho metodológico da pesqui- sa empírica, construção do critério de adequação da aplicação das técnicas multivariadas, instrumento de coleta de dados e variáveis de resultados.

3.1. Caracterização da população-alvo Retomando as considerações iniciais sobre o público-alvo, a população sob análise contempla as dissertações e teses em Administração, área de marketing, temática do comportamento do consumidor, apresentadas nos programas de pós- graduação da Faculdade de Economia, Administração e Contabilidade da Universidade de São Paulo e da Escola de Administração da Universidade Federal do Rio Grande do Sul, no período entre 1997 e 2006.

O universo de interesse foi definido como a dissertação ou tese com foco em marketing, especificamente comportamento do consumidor, e utilização de técnica estatística de análise multivariada como instrumento de solução do problema de pesquisa, apresentada aos programas de pós-graduação em Administração das instituições públicas com mais alta avaliação pela Capes na área de Administração.

A unidade populacional, no entanto, refere-se à aplicação de técnica estatística multivariada nesse universo de interesse, podendo ser mais do que uma aplicação em cada estudo integrante do universo de interesse.

A identificação da população-alvo foi realizada em três etapas: • seleção dos trabalhos que apresentavam o termo comportamento do consumidor como uma das palavras-chave; • leitura dos resumos dos trabalhos não selecionados na pri- meira etapa, com o objetivo de identificar aqueles que tra- tavam do comportamento do consumidor, ainda que não apresentassem o termo como palavra-chave e, assim, se- lecioná-los; • exame do conteúdo dos trabalhos selecionados na primeira e na segunda etapa, identificando aqueles com aplicação de alguma técnica de análise multivariada.

Na tabela_1 apresenta-se o ambiente de identificação da população-alvo deste estudo, registrando 196 dissertações e teses sobre comportamento do consumidor (universo ' U), 56 dissertações e teses com aplicação de técnicas estatísticas multivariadas (universo de interesse ' UI) e 99 aplicações de técnicas estatísticas de análise multivariada (população-alvo ' PA).

3.2. Desenho metodológico da pesquisa A construção metodológica da pesquisa empírica foi orientada, inicialmente, pela avaliação do processo de solução do problema gerador de dissertações e teses com aplicação de técnica estatística de análise multivariada, na temática aqui selecionada.

Considerou-se, ainda, o fato de que essa avaliação exige ser orientada por um critério, o qual foi construído dentro deste próprio estudo, não tendo sido submetido a um processo de validação anterior.

Essas duas condições, por si sós, remetem este estudo ao âmbito da pesquisa exploratória, visto que o processo de aprofundamento do entendimento do problema é uma etapa aqui cumprida para subsidiar a construção do critério de avaliação da adequação da aplicação da estatística multivariada aos trabalhos selecionados do período de 1997 a 2006.

Portanto, este estudo insere-se na abordagem quantitativa, utilizando a análise de conteúdo. O delineamento exploratório para este estudo vai ao encontro da abordagem de Selltiz (1974, p.60), que evidencia ser uma das finalidades desse método a apresentação de um recenseamento de problemas considerados urgentes por pessoas que trabalham em determinado campo de relações sociais. Exemplifica essa convergência o alerta feito em outros estudos de que a rigidez teórica, explicitada nas premissas para aplicações das técnicas estatísticas de análise multivariada, parece não ser acompanhada de rigidez empírica, explicitada nas concessões feitas pelos pesquisadores, o que, por vezes, pode resultar em conclusões não precisas sobre a solução dos problemas.

A opção pelo uso da técnica de análise de conteúdo foi orientada especialmente pela necessidade primária deste estudo de interpretar a situação problema das dissertações e teses selecionadas com o propósito de identificar o processo de sua solução por meio da seleção de uma técnica estatística de análise multivariada pertinente.

Da mesma forma como encontrado na abordagem de vários autores, entre eles Richardson (1999, p.221-222) e Rocha e Deusdará (2005, p.309), também aqui a identificação precisa da natureza da técnica de análise oscila entre a discussão quantitativa e a qualitativa.

Assim, de um lado, busca-se uma objetividade bastante intensa (RICHARDSON, 1999, p.221) para categorização dos problemas das dissertações e teses, mediante a definição de critérios rígidos de julgamento da solução desses problemas. De outro, o processo geral de avaliações a ser implementado às unidades de análise (dissertações e teses) está contaminado por julgamentos, na medida em que a análise do conteúdo supõe também o exame das características ausentes ou registros parciais do atendimento às premissas da técnica estatística utilizada.

Nesse sentido, algumas definições de análise de conteúdo parecem contemplar o caminho metodológico da coleta de dados, de acordo com propostas encontradas em Janis (1986, apud RICHARDSON, 1999, p.222): • "Assim, a análise de conteúdo pode ser definida como qualquer técnica: na base de regras explicitamente formuladas e sempre quando os juízos do analista sejam considerados como relatórios de um observador científico".

Entretanto, a definição encontrada em Bardin (1979, p.31) propicia a convivência com as duas abordagens, na medida em que inclui em sua definição de análise de conteúdo, a geração de indicadores quantitativos ou não no processo analítico: • "Análise de conteúdo é um conjunto de técnicas de análise das comunicações, visando obter, através de procedimentos sistemáticos e objetivos de descrição dos conteúdos das mensagens, indicadores (quantitativos ou não), que permitam inferir conhecimentos relativos às condições de produção dessas mensagens".

3.3. A construção do critério de avaliação da aplicação das técnicas multivariadas Dois critérios são apresentados a seguir com a finalidade de avaliar o grau de acerto na aplicação das técnicas multivariadas.

3.3.1. Procedimento de categorização do problema de pesquisa da unidade de análise ' critério 1 Nesste artigo destacam-se os resultados correspondentes à pertinência e à adequação do emprego das técnicas multivariadas. A orientação para categorizar o problema de pesquisa de cada unidade de análise (unidade i de análise) foi dada pela finalidade ou objetivo teórico de aplicação de diferentes técnicas estatísticas de análise multivariada. Segundo Johnson e Wichern (1998, p.2), as categorias são sintetizadas em cinco modalidades: redução dos dados ou simplificação estrutural; agrupamento; dependência entre variáveis; predição; formulação de hipóteses e testes.

A categoria identificada na unidade i de análise foi confrontada com a categoria objetivo das técnicas multivariadas, na condição de tratamento estatístico aplicado para solução do problema. A avaliação feita por meio desse confronto tem um caráter dicotômico, ou seja, foi considerada como uma aplicação adequada da técnica multivariada quando a categoria objetivo de aplicação da técnica ajustou-se à categoria do problema de pesquisa da unidade i de análise.

3.3.2. Procedimento de avaliação do atendimento às premissas das técnicas multivariadas ' critério 2 O atendimento às premissas das técnicas multivariadas foi decorrente da confirmação de que todas as premissas postuladas pela teoria foram atendidas. A violação de pelo menos uma das premissas, explicitada no conteúdo apresentado na unidade i de análise, bem como a não explicitação da situação de cada premissa (atendimento ou não atendimento) resultou na categoria não atendimento às premissas. Dessa forma, o critério de avaliação do atendimento às premissas é dicotômico: atendimento a todas as premissas das técnicas e não atendimento a pelo menos uma das premissas dessas técnicas.

3.3.3. Avaliação final do nível de adequação do uso das técnicas multivariadas O registro do nível de adequação do uso das técnicas multivariadas foi feito em três níveis, como pode ser visto na figura_2, que estão descritos a seguir.

• Nível 1 (não adequação do uso da técnica) ' não ajuste da categoria objetivo de aplicação das técnicas à categoria do problema de pesquisa da unidade i de análise, independentemente do atendimento ou não atendimento às premissas dessa técnica (não atendimento ao critério 1).

• Nível 2' ajuste da categoria objetivo de aplicação das técnicas à categoria do problema de pesquisa da unidade i de análise e não atendimento a pelo menos uma das premissas das técnicas ou à não explicitação da situação de cada premissa (atendimento ou não atendimento) no documento da unidade i (atendimento ao critério 1 e não atendimento ao critério 2).

• Nível 3' ajuste da categoria objetivo de aplicação das téc- nicas à categoria do problema de pesquisa da unidade i de análise e atendimento de todas as premissas da técnica, conforme documento da unidade i (atendimento ao critério 1 e ao critério 2).

3.4. Instrumento de coleta de dados e resultados Para a coleta de dados foi desenvolvido um instrumento para o registro das ocorrências encontradas em cada unidade i de análise. Esses registros referem- se a: • identificação numérica das unidades de análise; • ano de defesa do trabalho; • descrição do problema de pesquisa; • categorização do problema de pesquisa a partir dos objetivos de aplicação das técnicas de análise multivariada; • identificação da técnica de análise multivariada utilizada no trabalho; • aplicação do critério 1 ' categorização do problema de pesquisa da unidade de análise; • identificação e contagem das premissas atendidas na aplicação das técnicas; • aplicação do critério 2 ' procedimento de avaliação do atendimento às premissas das técnicas multivariadas; • avaliação final do nível de adequação do uso das técnicas multivariadas.

Os resultados são identificados por meio da ocorrência evidenciada em cada critério. A partir desses resultados, a complementação do plano analítico pressupõe: • evidenciar quais técnicas estatísticas de análise multivariada foram mais utilizadas no período de estudo, independentemente da categoria dos problemas de pesquisa; • evidenciar as categorias dos problemas de pesquisa que es- tariam apresentando maior número de ocorrências de apli- cação; • evidenciar quais premissas são mais negligenciadas no processo de aplicação das técnicas multivariadas.

4. ANÁLISE DOS RESULTADOS A primeira etapa de análise dos resultados tratou de apresentar as evidências quanto à intensidade de uso das técnicas multivariadas de modo geral, conforme o primeiro objetivo.

A segunda parte, conforme o segundo objetivo, tratou do nível de adequação do uso das técnicas multivariadas aos problemas de pesquisa das dissertações e teses sob análise.

A terceira parte identificou, a partir do não atendimento às premissas básicas de aplicação dessas técnicas, fontes potenciais de erro.

4.1. Resultados relativos ao primeiro objetivo Entre 1997 e 2006, as dissertações e teses sobre a temática comportamento do consumidor, defendidas nos programas de pós-graduação em Administração da FEA- USP e da EA-UFRGS, apresentaram maior intensidade de uso de técnicas estatísticas multivariadas para atender ao objetivo de reduzir ou simplificar a estrutura de dados coletada (62,5%), conforme apresentado no gráfico a seguir, com a aplicação da técnica de análise fatorial exploratória, única representante dessa ca- tegoria.

A categoria de investigação de dependência entre variáveis foi a segunda mais utilizada (46,4%). Nesse contexto, seis téc- nicas de análise multivariada apresentam essa categoria como um dos objetivos de aplicação: análise de regressão (15 casos), análise discriminante (3 casos), análise multivariada da variância (3 casos), análise conjunta (3 casos), regressão logística (1 caso) e correlação canônica (1 caso).

Clique_para_ampliar

A construção de hipóteses e testes, exclusivamente representada neste estudo pela técnica estatística multivariada de modelagem de equações estruturais somou 19 casos (33,9%).

a categoria de agrupamento de objetos ou variáveis foi utilizada em 18 estudos (33,9%), com maior número de casos no uso da técnica de análise de conglomerados (12 casos), seguido da técnica de análise de correspondência (5 casos) e da técnica de escalonamento multidimensional (1 caso).

Constatou-se que apenas um dos estudos selecionados utilizou técnica de análise multivariada com o objetivo de predição de algum fenômeno ou fato (regressão logística), o que possivelmente ocorra mais pela ausência de interesse por esse problema de pesquisa na temática de comportamento do consumidor do que pela restrição do número de técnicas disponíveis, visto que essa categoria é representada, neste estudo, por três técnicas de análise multivariada: análise de regressão, análise discriminante e regressão logística.

Ainda, a fim de ilustrar o ambiente de uso das técnicas estatísticas multivariadas, registre-se que, em 64,3% dos estudos selecionados, pelo menos duas técnicas são utilizadas para atendimento à solução dos problemas de pesquisa. O uso mais intenso das técnicas ocorre, em termos relativos, nas teses, com 81,2% dos casos com aplicação de pelo menos duas técnicas, contra 57,5% nas dissertações, sugerindo maior sofisticação dos estudos no primeiro grupo. Na tabela_2 consta a quantidade de técnicas de análise multivariada diferentes usadas nas dissertações e teses.

De 1997 a 1998 não se detectou aplicação de técnica estatística multivariada nas instituições de ensino alvo deste estudo. Quanto à categoria de aplicação das técnicas multivariadas ao longo do período de 1997 a 2006, devem-se registrar as seguintes considerações: • a categoria de redução dos dados ou simplificação estrutural apresentou ligeira queda no período, porém mantém pelo menos 30% de aplicação desde 1999; • as técnicas integrantes de categoria de investigação de dependência entre variáveis apresentaram tendência de queda no período de 1999 a 2003, voltando a crescer a partir de 2004; • a categoria de construção de hipóteses e testes apresentou, de forma geral, comportamento relativamente estável, registrando pico de uso em 2003 (67%); • a categoria de agrupamento de objetos ou variáveis apresentou tendência de crescimento no período estudado; • as técnicas integrantes de categoria predição apresentaram uso em 2004.

Quanto à intensidade de uso de cada técnica ao longo do tempo, nada se pode afirmar sobre possíveis tendências de apli- cação. Ainda assim, alguns aspectos merecem ser destaca- dos: • somente a partir de 2005 foram encontrados estudos que utilizaram a técnica estatística multivariada de análise multivariada de variância; • houve aplicação de análise fatorial exploratória em pelo menos 30% dos estudos, em todos os anos selecionados; • a técnica de modelagem de equações estruturais apresentou incremento de uso, relativamente a outras técnicas, no período de 2000 a 2003.

A tabela_3 ilustra esses resultados.

4.2. Resultados relativos ao segundo objetivo Um resultado positivo deste estudo é a coerência, nas dis- sertações e teses selecionadas, quanto à adequação das téc- nicas multivariadas ao problema de pesquisa. Assim, pelo critério 1, todas as aplicações das técnicas multivariadas são ade-quadas.

4.3. Resultados relativos ao terceiro objetivo Na tabela_4 apresentam-se os índices de atendimento às premissas das técnicas multivariadas que foram registra- dos nas análises das dissertações e teses estudadas neste trabalho.

Convém lembrar que, analogamente ao quadro_4, não foi incluída a análise conjunta na tabela_4 pelo fato de nenhuma das premissas teóricas aplicar-se a essa técnica. O total de aplicações de análise multivariada é 96, porque não foram incluídas as três análises conjuntas.

Antes de prosseguir com os comentários a respeito da tabela_4, cumpre esclarecer que o cálculo dos valores em porcentagem sobre o número de aplicações de cada técnica tem a finalidade apenas de simplificar a comparação entre os resultados por técnica, apesar de elas apresentarem números absolutos de uso muito baixos.

Primeiramente serão destacados os resultados da avaliação das premissas das técnicas de dependência.

As técnicas de análise de regressão, análise discriminante e correlação canônica apresentaram baixos níveis de atendimento às premissas subjacentes a seu uso nessas dissertações e teses. Apenas 2 num total de 15 estudos atenderam a mais da metade das premissas de análise de regressão e nenhum dos poucos casos de aplicação de análise discriminante e cor- relação canônica atendeu a mais da metade das premissas. Quanto a MANOVA e modelagem de equações estruturais, foram altos os índices de atendimento de mais da metade de suas condições: todos os 3 casos e 15 entre os 19 casos estudados, respectivamente.

A técnica de análise de regressão foi a que apresentou o menor número de premissas atendidas. Mais da metade das dissertações e teses (8, num total de 15) não atendeu a nenhuma das premissas exigidas. Com exceção do tamanho da amostra, nenhuma das premissas apresentou mais de um quarto de atendimento, com destaque negativo para homoscedasticidade e linearidade, com atendimento por 1 caso entre os 19 estudados, em cada uma dessas premissas.

O atendimento à multicolinearidade verificado em duas aplicações da análise discriminante foi resultante do uso do métodostepwise.

Quanto à regressão logística, com uma análise limitada em função do pequeno número de aplicações encontradas, a aplicação foi menos prejudicada até em função do pequeno número de premissas que necessitam ser atendidas (multicolinearidade, tratamento de observações atípicas ' outliers e sensibilidade ao tamanho da amostra).

Quanto à correlação canônica, sobre a multicolinearidade registre-se que sua verificação deu-se por meio de um processo de inércia, visto que as variáveis de entrada da técnica foram escores fatoriais construídos com baixa correlação pela análise fatorial.

Com três casos de aplicação da análise multivariada de variância, é reforçada a ausência da prática de verificação da linearidade e multicolinearidade (sob o conceito de verifica- ção direta) no uso das técnicas estatísticas multivariadas. Em nenhum dos casos verificou-se a premissa de linearidade e em apenas um foi verificada a premissa de multicolinearidade.

A técnica estatística de análise multivariada de modelagem de equações estruturais apresentou a maior quantidade de premissas atendidas nos estudos selecionados. Assim, 15 entre os 19 trabalhos atenderam a mais da metade das premissas exigidas.

Com relação às técnicas de interdependência, é também possível detectar quais são as premissas com menor índice de atendimento.

A análise fatorial apresentou baixos níveis de atendimento às premissas subjacentes a seu uso nessas dissertações e teses. Apenas 9 entre os 35 estudos atenderam a mais da metade das premissas e 4 atenderam a todas as premissas dessa técnica, conforme a tabela_4. Contribuiu para esse baixo nível de aten- dimento a não verificação da premissa de linearidade, com menos de 20% de estudos que declararam seu uso.

A técnica de análise de conglomerados apresentou um número expressivo de premissas atendidas (9 casos entre os 12 estudados de atendimento a mais de 50% das premissas). Registre-se que as duas premissas que exigiram maior participação do pesquisador quando da aplicação da técnica (multicolinearidade e tratamento de observações atípicas ' outliers) são as que obtiveram menor taxa de uso (3 casos em cada).

Nos 5 casos em que se detectou a aplicação da análise de correspondência, foram respeitadas duas das três premissas encontradas na literatura pesquisada. A condição não atendida em alguns trabalhos ocorreu para a premissa de tamanho suficiente da amostra para garantia de frequências esperadas maiores ou iguais a 5.

No único trabalho em que se detectou a aplicação do escalonamento multidimensional, foram respeitados três dos quatro preceitos encontrados no referencial teórico consultado. A exceção ocorreu para a premissa de padronização de variáveis que deveria, mas não foi aplicada.

4.4. Critério 2 de avaliação dos níveis de adequação no uso das técnicas multivariadas O resultado final da avaliação das aplicações encontra- das na população-alvo sugere um frágil ambiente operacio- nal de aplicação das técnicas multivariadas no que se refere a seu uso e especificamente ao atendimento às respectivas pre- missas.

4.5. Avaliação final do nível de adequação do uso das técnicas multivariadas A avaliação final do nível de adequação do uso das técnicas multivariadas pode ser sintetizada pelos índices percentuais obtidos nos três níveis retratados na figura_2.

• Nível 1 ' todas as aplicações das 11 técnicas multivariadas (inclusive análise conjunta) apresentaram convergência en- tre a categoria-objetivo de aplicação de cada técnica com a categoria do problema da pesquisa.

• Nível 2 ' 14 de 15 estudos (regressão linear), 1 de 1 estudo (discriminante), 1 de 2 estudos (logística), 1 de 1 estudos (correlação canônica), 5 de 5 estudos (MANOVA), 16 de 19 estudos (modelagem de equações estruturais), 31 de 35 estudos (fatorial), 11 de 12 estudos (conglomerados), 5 de 5 estudos (análise correspondência) e 1 de 1 estudo (escalonamento) das aplicações das técnicas atenderam parcialmente a suas premissas.

• Nível 3 ' 1 de 15 estudos (regressão linear), 0 de 1 estudo (discriminante), 1 de 2 estudos (logística), 0 de 1 estudo (correlação canônica), 0 de 5 estudos (MANOVA), 3 de 19 estudos (modelagem de equações estruturais), 4 de 35 estudos (análise fatorial), 1 de 12 estudos (análise de conglomerados), 0 de 5 estudos (análise de correspondência) e 0 de 1 estudo (escalonamento multidimensional) das aplicações das técnicas apresentaram uso adequado quanto ao atendimento de suas premissas.

5. CONCLUSÕES Nos trabalhados avaliados, as soluções para os problemas de pesquisa concentraram-se no emprego de técnicas de redução ou simplificação estrutural dos dados (35 estudos), seguido de técnicas de investigação de dependência entre variáveis (26 estudos).

Embora não seja possível fazer afirmações sobre tendência de intensidade de uso da análise multivariada, este estudo permitiu observar as técnicas que se destacaram nos trabalhos focalizados. Houve aplicação de análise fatorial exploratória em pelo menos 30% dos estudos, em todos os anos selecionados neste trabalho. A técnica de modelagem de equações estruturais apresentou incremento de uso, relativamente a outras técnicas, no período de 2000 a 2003.

Cumpre destacar o acerto dos analistas na identificação das situações favoráveis de uso das técnicas multivariadas na resolução dos problemas de pesquisa das dissertações e teses focalizadas neste estudo.

Quanto à qualidade de aplicação dessas técnicas, destaque-se que a verificação de todas as suas premissas foi constatada em 6,7% (regressão linear), 0% (discriminante), 50% (logística), 0% (correlação canônica), 0% (MANOVA), 15,8% (modelagem de equações estruturais), 11,4% (análise fatorial), 8,3% (análise de conglomerados), 0% (análise de correspondência) e 0% (escalonamento multidimensional).

Assim, ainda que não possam ser extrapolados para a produção acadêmica de outras instituições ou de outros períodos de tempo, os achados deste estudo sugerem a necessidade de maior cuidado conceitual nas aplicações das técnicas mul- tivariadas.

A partir dos resultados aqui obtidos, pode-se ressaltar a importância das bancas de qualificação no sentido de alertar os pesquisadores sobre a necessidade desses cuidados, incentivando a prática do atendimento às premissas inerentes a essas técnicas.

Sobre isso parece pertinente a sugestão da disponibilização pelos programas de pós-graduação em Administração de infraestrutura de suporte ao pesquisador quando da utiliza- ção da pesquisa quantitativa. Além disso, o oferecimento de cursos de capacitação a esses pesquisadores, bem como aos docentes desses programas, pode auxiliar, internamente, na melhor qualidade da orientação e, externamente, na melhor qualidade das observações em bancas de qualificação das quais participam.

Espera-se que o resultado apurado neste estudo, relativo ao elevado nível de não adequação do uso das técnicas multivariadas na população-alvo, em função da não verificação de todas as suas premissas, seja um estímulo aos pesquisadores para a busca de um entendimento mais detalhado e aprofundado das técnicas a serem empregadas como parte do processo de solução do problema de pesquisa, de forma a minimizar eventuais erros decorrentes de aplicação não adequada.


transferir texto