Dificuldades Para A Obtenção De Informações Estatísticas

            As amostras são usualmente utilizadas para inferir generalizações sobre uma população, sendo que a exatidão destas generalizações depende essencialmente de dois pontos: a) processo de delineamento; e b) processo de operacionalização.
            Assim, uma boa amostra - tomando-se todos os cuidados em cada um dos dois processos - pode proporcionar informações mais precisas sobre uma população, e a custo muito mais baixo, do que um censo completo, desde que se tenha um excelente sistema de referência. Em outras palavras, mesmo os melhores estimadores não proporcionam boas estimativas se as amostras não forem bem delineadas e, principalmente, bem planejadas e executadas. Chamamos a atenção para o segundo ponto, pois é mais fácil modificar o delineamento amostral até que se chegue a um ponto desejado, do que estabelecer uma operacionalização da aplicação da amostra em campo.
            No Instituto de Economia Agrícola, dos anos 50s aos anos 90s, operou-se um levantamento por amostragem probabilística, denominado Objetivo, para previsão e estimativas de safras e obtenção de dados sócios-econômicos.
            Nos últimos anos, este levantamento foi desconsiderado para a elaboração das estimativas de safras agrícolas, desgastado pelo tempo devido, principalmente, às dificuldades de atualização do cadastro. Permaneceu apenas para as estimativas sobre emprego rural, pois o número de respondentes mostrou-se satisfatório para a obtenção de informação no âmbito do Estado. Assim as estimativas de safras passaram a ser obtidas apenas por meio do Levantamento por Município (Subjetivo), que é realizado desde 1942/43 até os dias de hoje, mas que não possibilita verificar a sua precisão por não ter base estatística.
            Em meados de 1997, a Secretaria de Agricultura e Abastecimento do Estado de São Paulo (SAA) encerrou os trabalhos do chamado Projeto LUPA ( Levantamento Censitário de Unidades de Produção Agrícolas) com a publicação de um livro com as estatísticas censitárias municipais, que se tornou, assim, entre outras finalidades, um ótimo sistema de referência (cadastro) para a elaboração de amostras probabilísticas. Este fato resultou em discussões sobre o novo rumo para a obtenção de Estatísticas Estaduais Agrícolas e culminou com a criação da Comissão Técnica de Estatísticas Econômicas (CTEE) na SAA para tratar do assunto. Foi elaborada uma proposta do esquema de amostragem para ser utilizada no Sistema Estadual de Estatísticas Agrícolas (SEEA), então sugerida pela Comissão. Recentemente, essa Comissão foi revogada e o SEEA não pôde ser implantado.
            O esquema de amostragem, delineado para o SEEA, foi aplicado na obtenção das estatísticas do levantamento Objetivo realizado em novembro de 2000. Esta amostra foi concebida com uma nova abordagem, utilizando 41 variáveis na forma multivariada, condensadas em 16 fatores, a fim de agrupar os elementos homogêneos dentro de estratos e os heterogêneos entre os estratos, com o objetivo de minimizar a variância diante da heterogeneidade e do elevado número de variáveis (41). Este processo diminuiu sensivelmente o tamanho da amostra e, através de um estudo de Monte Carlo, verificou-se que este delineamento poderia produzir resultados de boa qualidade, principalmente quanto à precisão das estimativas ao nível estadual.
            Sabe-se que alguns erros resultam do processo de levantamento e são inevitáveis. Portanto, devem ser tomados todos os cuidados para que estes sejam mínimos. Diante disso, faz-se necessário uma análise estatística dos resultados de qualquer levantamento, procedendo-se a estudo dos erros não amostrais e de amostragem a fim de detectar as principais causas e, assim, avaliar a extensão do problema. Isto permite não só estabelecer metas para controlá-los e esforços para minimizá-los como também validar as estimativas obtidas.
            No estudo dos erros provenientes deste levantamento, foram encontrados alguns problemas no que se refere à falta de resposta (erro amostral), afetando determinados Escritórios de Desenvolvimento Rural, com influência nas estimativas para produtos de importância econômica nessas regiões e, consequentemente, subestimando as estimativas para o Estado.
            Outro aspecto da falta de resposta refere-se às suas origens. Neste levantamento encontraram-se oito categorias, em ordem de severidade:

a) unidade amostral não procurada;
b) unidade amostral não localizada;
c) unidade amostral inacessível;
d) informante ausente;
e) recusa do informante;
f) ignorância do informante;
g) não entendimento por parte do entrevistador; e
h) perda de informação.

            A primeira categoria, com maior grau de severidade, teve uma grande contribuição para o índice de falta de resposta, apresentando-se de várias formas: falta de recursos para executar o levantamento, falta de tempo suficiente para executar a tarefa e questionários devolvidos em branco, entre outros casos. Essa situação evidencia, de modo geral, maior atenção nos próximos levantamentos no que se refere às condições de trabalho, tanto humanas quanto materiais.
            Outra categoria com grandes contribuições para o alto índice de falta de resposta foi a de ausência do informante, que também poderá ser reduzida em levantamentos futuros por meio do treinamento dos entrevistadores. Esta categoria e as de unidades amostrais não localizada e inacessível vêm perdendo importância no Estado, devido ao aumento do número de proprietários absenteístas. A localização do informante tem sido facilitada pela crescente residência na área urbana, contribuindo, assim, para o menor custo de levantamento.
            Deixando de lado o viés da falta de resposta, existem procedimentos para ajustar a amostra. Um deles consiste em considerar a amostra de respondentes probabilística apenas com tamanho menor e o outro procedimento é supor que, em média, os não respondentes responderiam da mesma forma que os respondentes. Os dois procedimentos levam à mesma estimativa da média e do total, diferenciando-se apenas na forma de cálculo das variâncias, que é possível se houver dois ou mais respondentes em cada estrato. Para o caso de apenas um elemento no estrato, tem-se adotado o procedimento empírico de igualar o coeficiente de variação a 100% e, para o caso de não haver respondentes, é impossível o cálculo. Neste levantamento, não houve registro do segundo caso e 31 dos 174 estratos tiveram somente um respondente, isto é, pode-se proceder ao cálculo dos coeficientes de variação (erros amostrais).
            De forma geral, os coeficientes de variação apresentaram, principalmente no primeiro procedimento, precisão aceitável, embora superior à esperada. Outro forma de aferir os resultados é a comparação com aqueles encontrados em levantamentos anteriores e em outras fontes. Cabe ressaltar que, de forma geral, os resultados se mostraram coerentes no maior número de variáveis, sendo que variáveis consideradas pouco volúveis, como o número de unidades de produção agrícola e a área total, apresentaram valores muito próximos daqueles do Censo.
            Todos os detalhes da apresentação dos problemas encontrados e sugestões de como tratá-los estão publicados em artigo técnico. Vale salientar, aqui, que considerações sobre a qualidade de dados estatísticos não costumavam ser feitas nos levantamentos anteriores da SAA, nem em levantamentos de outras instituições, o que não significa que sejam isentas de problemas estatísticos. Portanto, é importante que haja essa consciência da qualidade da informação a fim de se obter estatísticas agrícolas de boa qualidade para não comprometer o setor do agronegócio.

Data de Publicação: 05/06/2001

Autor(es): Vera Lucia Ferraz dos Santos Francisco Consulte outros textos deste autor
Consulte outros textos deste autor