post-image

Amostras comercializadas pelo Polling Data


O PollingData pode fornecer vários tipos de ajuda para fazer a sua pesquisa ser eficiente e válida. Podemos fornecer amostra customizadas para cada modo de entrevista, ajudando a controlar todos os aspectos relacionados com a seleção das amostras, incluindo a seleção dos respondentes (com exceção de respondentes online), a estratificação geográfica e cotas. Também podemos ajudar na ponderação dos dados para corrigir os viéses que surgem na aplicação prática da pesquisa para tornar os resultados mais precisos e confiáveis.

Amostras comercializadas pelo Polling Data

A seleção de uma pequena parte da população de forma que seja possível tirar conclusões sobre toda a população está na essência das pesquisas de opinião. Este pequeno grupo é a amostra, e uma amostra bem escolhida é imprescindível para uma pesquisa de qualidade. Um dos aspectos mais importantes nesta escolha é a estratificação geográfica, pois essa garante que a amostra represente de forma mais eficiente a população alvo.

Para tornar os resultados mais confiáveis, também é importante controlar variáveis demográficas (as cotas) durante a coleta de dados, assim evitando certos viéses que podem surgir durante essa etapa da pesquisa. O PD (PollingData) geralmente recomenda uma combinação de variáveis que tendem a influenciar as opiniões da população: sexo, idade, escolaridade, ocupação e área/região.

Mesmo com todos esses controles recomendados durante a coleta de dados, podem surgir distorções relevantes. Recomendamos que estas distorções sejam corrigidas durante a análise dos dados, usando uma técnica conhecida como ponderação. Além de ajustar as variáveis demográficas utilizadas nas cotas, também pode ser interessante controlar outras variáveis. Para ser considerada como variável de ponderação, é necessário escolher informações cuja distribuição na população seja conhecida (preferencialmente à partir de pesquisas idôneas). Por exemplo, em pesquisas eleitorais pode ser importante ajustar variáveis como religião, recebimento do bolsa família e voto em eleições anteriores.

Duas questões são essenciais para o cliente difinir a sua pesquisa. A primeira questão está relacionada à abrangência geográfica desejada (Nacional, Estadual ou Municipal) e a segunda ao modo de entrevista que será adotado.

Existem três modos de entrevista principais usados no Brasil para realizar pesquisas de opinião pública. Esse modo de entrevista se refere à forma como as pessoas pertencentes à amostra são contactadas e entrevistadas. Cada modo tem características bastante específicas, as quais serão descritas brevemente a seguir:

  • Presencial: Pesquisas presenciais são realizadas pessoalmente por um entrevistador. Elas podem ser feitas nos domicilios ou em pontos de fluxo. Se desejado, o controle geográfico desse tipo de pesquisa pode ser muito refinado, chegando até o nível do bairro (dependendo da cidade). Tipicamente, os questionários mais extensos são aplicados nesse modo de entrevista.
  • Telefônica: Pesquisas por telefone também são realizadas por um entrevistador, mas podem ser feitas por entrevistadores humanos ou URA’s (Unidade de Resposta Audível). Os sistemas URA podem entrevistar os respondentes com áudio pré-gravado ou gerado dinamicamente. O controle geográfico geralmente fica no nível da área do DDD. Tipicamente perdem qualidade no nível do município, devida a falta de informação geográfica nos números telefônicos. O tamanho do questionário também pode ser limitante para o uso deste modo.
  • Online: Pesquisas online são realizadas no computador ou no celular pelo próprio respondente. Nessas pesquisa a seleção da amostra é tipicamente limitada ao uso de cotas, pois os respondentes tem que ser recrutados para participar da pesquisa pela internet. O controle geográfico depende das informações disponíveis, porém geralmente chega-se apenas ao nível do Estado. Se existe a necessidade de um questionário interativo, com experimentos e/ou mídias, esse modo tipicamente é a melhor opção.


Comercializamos tanto a amostra, quanto a ponderação, utilizando uma metodologia padrão do PD, desenvolvida durante 20 anos de experiência com pesquisas de opinião pública, tanto no exterior quanto no Brasil. O sucesso dessas metodologias se deve, em grande parte, a conciliação das exigências teóricas da amostragem com as necessidades práticas da coleta de dados. Esses detalhes metodológicos são discutidos na seção de metodológica.

Os preços de cada tipo de amostra/ponderação estão na tabela 1. Esses preços se referem apenas ao desenho da amostra, e a ponderação realizada após o término da pesquisa, usando a metodologia padrão do PD. A amostra e a ponderação podem ser customizadas (geralmente implicando no aumento do preço das mesmas). O cliente pode comprar apenas a amostra, se desejar, ou a combinação da amostra mais a ponderação, opção esta que implica em uma performance melhor da pesquisa. Esses valores NÃO incluem o custo da etapa de coleta de dados ou de desenho do questionário, as quais devem ser realizadas por empresas especializadas.

Table 1: Preços de amostras do PD
Tipo de amostra
Nível
Geográfico
Presencial Telefônica Online* Ponderação
dos resultados
Nacional R$ 4.500 R$ 3.500 R$ 1.000 R$ 2.000
Estadual R$ 3.000 R$ 2.500 R$ 1.000 R$ 1.500
Cada Município (>= 1 milhão) R$ 1.800 R$ 1.500 R$ 1.000 R$ 1.000
Cada Município (< 1 milhão) R$ 1.200 R$ 1.000 R$ 1.000 R$ 1.000
* Inclui apenas estratificação da amostra e cotas.

Para adquirir uma amostra/ponderação, é necessário escolher o modo de pesquisa e a abrangência geográfica, como também determinar quais variáveis serão utilizadas nas cotas (e na ponderação). Se houver interesse, ou dúvidas, entre em contato com o PD por email ou telefone:

+55 (19) 99889-3939

Metodologia

Nesta seção discutiremos algumas das características específicas da metodologia de amostragem/ponderação do PD. Não são incluídos detalhes sobre todos os aspectos envolvidos em cada etapa do desenho da amostra; o foco aqui são os aspectos metodológicos desenvolvidos pelo PD para aumentar a eficiência de pesquisas de opinião pública no Brasil. Se houver interesse em entender mais detalhadamente todas as etapas de uma pesquisa, e como avaliar a qualidade da mesma, recomendamos esse post com explicações não técnicas, e essa tese de doutorado com explicações teóricas. Outra opção interessante é esse vídeo de uma live sobre pesquisas eleitorais.

O conteúdo desta seção pode ser navegado através dos links abaixo, permitindo acesso a detalhes de cada modo de pesquisa comercializado pelo PD:




Pesquisas domiciliares pessoais

As pesquisas domiciliares, nas quais o entrevistador encontra os respondentes nas suas casas, permitem um controle geográfico bastante fino, não só no sentido da estratificação geográfica, mas também no que se refere à seleção de respondentes. Neste tipo de pesquisa, a seleção da amostra é usualmente feita em estágios, sorteando-se primeiramente municípios, depois setores censitários (definido abaixo) e finalmente os domicílios e seus moradores.

O setor censitário, que é a menor unidade geográfica para a qual existem informações oficiais do Instituto Brasileiro de Geografia e Estatistica (IBGE), contém, em média, 300 domicílios (em áreas urbanas). Assim é possível distribuir uma amostra para pesquisas pessoais domiciliares com enorme controle sobre a dispersão geográfica, visto que a malha censitária do país é composta por mais de 300 mil setores. Na figura abaixo, como exemplo, mostro o setor censitário onde se localiza a minha residência.

Exemplo de um setor censitário


Amostra presencial do PD

O PD oferece ajuda para esse tipo de pesquisa para o nível nacional, para qualquer estado e para qualquer município do país. Outros níveis são possíveis, porém requerem uma amostra customizada. A metodologia padrão do PD é denominada de Amostragem Probabilística com Cotas. Ela pode ser descrita como amostragem estratificada probabilistica de conglomerados em 3 estágios (ou 2 estágios no nível municipal), com a seleção dos conglomerados feita com probabilidade proporcional ao tamanho nos estágios iniciais, e por cotas no estágio final. Esta amostra é domiciliar, pois a qualidade desse tipo de pesquisa quase certamente é melhor do que pesquisas feitas em ponto de fluxo. A seguir fazemos uma breve descrição da metodologia.

Estágio 1 (Seleção dos municípios)

Esse estágio somente é necessário para pesquisas no nível Nacional ou estadual. A seleção dos municípios é realizada com probabilidades proporcionais ao tamanho (população ou número de eleitores), controlando algumas características importantes como renda média e voto no atual presidente na eleição anterior.

Na seleção de municípios, a amostra é estratificada geograficamente. A geografiaa ser utilizada depende do tamanho da amostra, porém geralmente controla-se Região (N/NE/CO/SE/S), Tipo (Capital/Região Metropolitana/Interior) e Porte do município (Pequeno/Médio/Grande). Também é possível estratificar por Macroregiões ou Microregiões. O padrão do PD é utilizar alocação proporcional da amostra para cada uma das áreas/regiões de estratificação.

A seleção utilizando a renda média e o tamanho dos municípios, faz com que essas características sejam aproximadamente reproduzidas na amostra selecionada, com uma distribuição semelhante à distribuição populacional.

Estágio 2 (Seleção dos setores)

Uma vez selecionados os municípios (no primeiro estágio), selecionam-se os setores censitários destes municípios. A seleção dos setores é realizada com probabilidades proporcionais ao tamanho (população do setor), controlando principalmente a renda média do responsável pelo domicílio.

Nessa seleção a amostra é estratificada geograficamente. A estratificação se baseia numa segmentação geográfica desenvolvida pelo PD, a qual é individualizada para cada município do país. Essa segmentação leva em conta a latitude, a longitude e a renda média dos setores censitários, além de também considerar se os setores agrupados pertencem ao mesmo Distrito, Subdistrito e Bairro. A grande vantagem desta segmentação é que ela permite controlar a quantidade de estratos desejados em cada cidade, os quais são homogêneos com relação a renda, porém respeitam a geografia da cidade.

Um exemplo dessa segmentação para a cidade de Belo Horizonte/MG é apresentada na figura abaixo. No primeiro sub-gráfico denominado “Distritos”, mostramos os 3 distritos de BH de acordo com o Instituto Brasileiro de Geografia (IBGE). Nos outros sub-gráficos, mostramos as possíveis segmentações geográficas cada uma contendo um número específico de grupos/estratos (descritos no título). A metodologia padrão do PD seleciona então o maior número possível de estratos (até no máximo 10), com a condição de que haja pelo menos uma entrevista no menor estrato (fazendo alocação proporcional).

Estratificação geográfica

Estágio 3 (Seleção dos respondentes)

O próximo passo é a seleção dos moradores de domicílios que se encontram nos setores censitários selecionados no segundo estágio. Na metodologia padrão do PD, a seleção dos moradores não é probabilística, mas é realizada com o uso de cotas. Existe bastante polêmica sobre qual é a melhor forma de selecionar as pessoas nesse terceiro estágio, porém em termos práticos, utilizar cotas (bem pensadas) mantém a eficiência do desenho amostral, com a vantagem de reduzir o custo/tempo da coleta de dados. A alternativa usualmente considerada é a seleção probabilística dos respondentes, porém na prática a eficiência é similar a da seleção por cotas. Para uma discusão bastante profunda e teórica sobre o assunto, veja essa tese de doutorado.

Não cabe discutir aqui a melhor forma de selecionar as variáveis das cotas, porém para o leitor interessado recomendo esse link. Na metodologia padrão do PD, as variáveis geralmente utilizadas nas cotas são Sexo, Idade, Escolaridade e Ocupação. Dependendo do escopo da pesquisa, essas cotas podem ser calculadas usando o perfil específico das pessoas que residem nas áreas de interesse da pesquisa (se a informação exisitir). Caso contrário é utilizado o perfil de áreas das quais existem informações públicas.

Em termos práticos, o produto final entregue a quem adquirir uma amostra padrão do PD será um conjunto de mapas em pdf dos setores selecionados na amostra (como o setor mostrado acima), e as respectivas folhas de cota em Excel, indicando quantas pessoas de cada perfil devem ser entrevistadas em cada setor. Segue abaixo um exemplo de uma folha de cota para o setor de número \(530010805160174\), localizado em Brasília.

Exemplo de uma folha de cota

Ponderação dos resultados

A ponderação padrão do PD para pesquisas pessoais utiliza as mesmas variáveis utilizadas na definição das cotas (Sexo, Idade, Escolaridade e Ocupação) além de Área/Região, porém outras variáveis podem ser utilizadas, tais como tipo de residência, recebimento do Bolsa Família e Religião, se o cliente desejar. No caso de amostras com abrangência geográfica nacional ou estadual, os ajustes são realizados dentro de cada área/região de interesse; nos outros casos, o ajuste é para o total da pesquisa e a área é tratada como mais uma variável de ponderação.

Para que variáveis possam ser utilizadas na ponderação da pesquisa, têm que ser contempladas na formulação do questionário (ou incluídas na base de dados). Além disso, é necessário que a distribuição populacional delas seja conhecida, ou seja, estas informações devem estar presentes em pesquisas públicas (preferencialmente confiáveis).

Pesquisas telefônicas

Existem dois tipos principais de metodologia para pesquisas telefônicas: uma de RDD (Random Digit Dialing), onde o cadastro utilizado para selecionar uma amostra tem todos os números de telefone que existem no país, e a outra de Listagem, onde o cadastro é proveniente da listagem dos telefones comprados de algum(ns) fornecedor(es). A diferença entre os dois tipos de pesquisa telefônica pode parece sutil, porém é de bastante importância, tanto com relação à qualidade da pesquisa quanto com relação ao tempo de coleta dos dados.

No caso da RDD, utilizam-se cadastros da Agência Nacional de Telecomunicações (ANATEL), onde todos os números de telefones que já foram alocados para alguma operadora telefônica são listados. No cadastro de telefones fixos, é possível identificar o município ao qual o número pertence, mas no cadastro de telefones móveis, não existe nenhuma identificação geográfica. A grande vantagem desse tipo de pesquisa telefônica é que a cobertura do cadastro é de 100%, ou seja, todas as pessoas do país que têm telefones têm que estar no cadastro. A desvantagem é que existem muitos números que, apesar de terem sido alocados a operadoras, não estão em uso. Por este motivo, durante a coleta dos dados é comum que muitos telefones sendo contactados não existem, algo que reduz a velocidade da execução da pesquisa. Muitas vezes é necessário utilizar um discador automático para que seja possível completar a pesquisa em tempo hábil. A discagem manual de cada número que não existe implica na perda de vários segundos, enquando a utilização da discagem automática leva à perda de muito menos tempo. Outra dificuldade da RDD ocorre no caso de pesquisas municipais. Como não é possível saber à qual cidade um telefone celular do cadastro da ANATEL pertence (apenas conhecemos o DDD), é necessário fazer um filtro de município no questionário da pesquisa, algo que dificulta a coleta de dados, além de aumentar o tempo necessário para completar a pesquisa.

No caso das Listagens, utilizam-se cadastros comprados de fornecedores. A grande vantagem dessa abordagem é que a proporção de números telefones inativos deve ser bem menor do que no caso do RDD, além do fato de existir a possibilidade de haver informações geográficas para telefones celulares. A desvantagem é que não é possível saber a cobertura dessas listagens, como também se são atuais. Além disso, as informações geográficas podem estar desatualizadas. Provavelmente a coleta dos dados com esse tipo de pesquisa será mais rápida, porém a eficiência da amostragem pode ser comprometida por causa da cobertura.

A estratificação geográfica em pesquisas telefônicas, é sempre possível até o nível do DDD, que é um nível geográfico com refinamento maior do que o nível do Estado, como pode ser visto no gráfico abaixo. Desta forma, tanto pesquisas nacionais quanto estaduais podem ter uma estratificação geográfica bastante razoável. Porém, em pesquisas municipais, a efetividade da estratificação dependerá da qualidade da listagem, e não é possível no caso das pesquisas RDD com telefones celulares. Nesse último caso, pode-se tentar adquirir as informações sobre localização perguntando no questionário o bairro ou CEP da residência do respondente e estas informações podem ser usadas durante a etapa de análise dos dados, como será discutido posteriormente. Porém, muitas pessoas desconhecem o seu CEP, e a definição de bairro não é uma informação muito confiável para ser utilizada com o objetivo de melhorar a qualidade da pesquisa.

Mapa de DDDs do Brasil

Amostra telefônica do PD

O PD oferece amostras desse tipo de pesquisa para o nível nacional, para qualquer estado e para qualquer município do país. O PD também oferece a opção de pesquisa RDD ou Listagem, mas a metodologia similar para os dois casos. A metodologia básica é a amostragem de conglomerados em dois estágios, onde no primeiro estágio seleciona-se agrupamentos de prefixos telefônicos, e no segundo selecionam-se os números de telefone em si. Um prefixo são os primeiros 5 dígitos de um telefone celular (além do DDD) e os 4 primeiros do telefone fixo. Por exemplo, o prefixo do telefone (11)98765-4321 é (11)98765. Nesse caso, o agrupamento de telefones desse prefixo seriam todos os telefones sequenciais entre os números (11)98765-0000 e (11)98765-9999. No geral, cada agrupamentos de prefixos tem 10 mil números telefônicos, embora existam algumas exceções.

Existem duas motivações principais para utilizar os agrupamentos de prefixos telefônicos. Em primeiro lugar, a ANATEL disponibiliza os números existentes no Brasil dessa forma. Em segundo lugar, a utilização desses agrupamentos permite combinar informações da ANATEL com informações de listagens compradas de fornecedores. A ideia é que enriquecer a lista de telefones da ANATEL com listagens compradas, faz com que seja possível melhorar a efetividade da coleta de dados sem diminuir significativamente a qualidade da pesquisa. O PD temos quatro opções metodológicas para seleção da amostra, o que permitindo que o cliente escolha a opção que melhor atende a suas necessidades, balanceando o custo da coleta dos dados com a qualidade dos resultados da pesquisa. O custo de adquirir uma amostra de qualquer uma das quatro opções é o mesmo, deixando assim a decisão sobre o gasto com a coleta de dados para o cliente.

O PD enriqueceu a base de telefones da ANATEL com mais de 330 milhões de telefones ativos (ao menos desde 2018), de diversas operadoras de telefonia (Celulares pré e pós pagos da OI/VIVO/CLARO/TIM, NEXTEL, Fixos da VIVO/GVT/CLARO TV/SKY). Por isso é provavél que a perda de cobertura resultante do uso da listagem seja mínima, porém é difícil mensurar o efeito. Para uma discussão um pouco mais aprofundada sobre o potencial viés de se utilizar listagens telefônicas, veja esse link. As quatro variações metodológicas amostrais são descritas abaixo, variando do uso de 100% de telefones da ANATEL até 100% de telefones de listagens, além de incluir duas opções híbridas intermediárias:

  • RDD pura de prefixos: Nessa opção, os prefixos telefônicos são selecionados com probabilidades proporcionais ao número de telefones da ANATEL com o prefixo. Dentro de cada prefixo selecionado, selecionam-se telefones com probabilidades uniformes (iguais). Nesse método, usa-se apenas informações da ANATEL para selecionar a amostra, garantindo que todos os telefones existentes no Brasil tenham chance de ser selecionados. Por outro lado, como vários telefones ainda não foram utilizados pelas operadoras, a coleta dos dados pode demorar mais pra terminar a coleta de dados.
  • RDD Híbrida de prefixos: Nessa opção, os prefixos telefônicos também são selecionados com probabilidades proporcionais ao número de telefones da ANATEL com o prefixo, porém apenas prefixos que contenham pelo menos 1 telefone listado (padrão que pode ser alterado) podem ser selecionados. Dentro de cada prefixo selecionado, selecionam-se telefones com probabilidades uniformes (iguais). A suposição aqui é que se um telefone do agrupamento do prefixo já está em uso, provavelmente outros telefones também estarão sendo utilizados, dessa forma aumentando a velocidade da coleta de dados.
  • Listagem Híbrida de prefixos: Nessa opção, os prefixos telefônicos também são selecionados com probabilidades proporcionais ao número de telefones da ANATEL com o prefixo, porém apenas prefixos que contenham pelo menos 1 telefone listado (padrão que pode ser alterado) podem ser selecionados. A diferença com relação a RDD Híbrida é que dentro de cada prefixo selecionado, selecionam-se apenas telefones listados, com probabilidades uniformes (iguais). Como apenas telefones listados são selecionados, a velocidade da coleta de dados deve ser ainda maior que as opções anteriores.
  • Listagem pura de prefixos: Nessa opção, os prefixos telefônicos são selecionados com probabilidades proporcionais ao número de telefones listados. E dentro de cada prefixo selecionado, selecionam-se apenas telefones listados, com probabilidades uniformes (iguais). A diferença entre essa opção e a Listagem Híbrida é que nesse caso serão selecionados telefones de prefixos com mais números listados, e na anterior serão priorizados prefixos de acordo com o número de telefones que existem. Como nesse caso apenas tefefones listados são considerados nas duas etapas da seleção da amostra, a velocidade da coleta de dados deve ser maior.


Apesar de haverem algumas diferenças sutis entre as 4 opções, elas podem ser importantes tanto em aspectos práticos como o custo/tempo da coleta de dados, quanto em aspectos teóricos que aumentam a credibilidade da pesquisa, como a certeza de que todos os telefones do Brasil podem pertencer a pesquisa.

Nas pesquisas telefônicas, a seleção dos moradores também é realizada com o uso de cotas. Na metodologia padrão do PD, as variáveis utilizadas nas cotas são Sexo, Idade, Escolaridade e Ocupação. Também inclui um controle do tipo de telefone usado (fixo ou celular). A contemplação dos dois tipos de telefones é importante para obter uma pesquisa de qualidade porque esses dois tipos podem implicar em perfis demográficos diferentes. Pessoas que têm Somente Celular, Somente Fixo e Celular e Fixo são bem diferentes entre si, e a exclusão de algum desses grupos pode aumentar bastante o viés de cobertura desse modo de pesquisa. O padrão do PD é fazer 80% das entrevistas com telefones celulares e 20% com telefones fixos, porém esse parâmetro é customizável. Apesar da inclusão dos dois tipos de telefone complicar um pouco a logística da coleta de dados e a análise dos resultados, o ganho em cobertura compensa o esforço.

Amostras telefônicas municipais

Historicamente, se enfrenta uma das grandes dificuldades do modo de entrevista por telefone nas pesquisas municipais, principalmente com relação à estratificação geográfica. Ela é sempre possível em pesquisas nacionais e estaduais até o nível do DDD, que é um nível geográfico com refinamento maior do que o nível do estado. Porém, em pesquisas municipais, a estratificação depende da qualidade da listagem. Não é possível no caso das pesquisas RDD com telefones celulares.

O PD desenvolveu uma metodologia especificamente para estratificação geográfica de pesquisas telefônicas municipais, porém ela só é possível utilizando o método da Listagem pura discutido na seção anterior, porém sem a seleção de prefixos (ou seja, nenhuma informação da ANATEL é utilizada). Ou seja, a seleção da amostra é realizada utilizando uma amostra aleatória simples dos telefones listados. Esse método associa cada CEP a um setor censitário, e utiliza a segmentação geográfica discutida na seção para estratificar a amostra. Apesar de existirem algumas classificações ambíguas entre CEP’s e setores, o método tem se mostrado bastante eficiente na prática. Na tabela interativa abaixo, é possível ver quantidade de números telefônicos adquiridos pelo PD para cada cidade do Brasil, classificados por tipo (Fixo e Celular). Pesquisa telefônica municipais geograficamente estratificadas são comercializadas para qualquer cidade listada nessa tabela, com a ressalva que o tamanho da amostra deve ser compatível com o número de telefones existentes: no geral, são necessários 100 números telefônicos para completar uma entrevista.


Em termos práticos, o produto final entregue a quem adquirir uma amostra padrão do PD consistem em duas listagens telefônicas, uma para telefônes fixos e outra para telefones celulares, com os telefones e informações relevantes que devem ser incluidas na base de dados se for realizada uma entrevista naquele número. Além disso, também estão incluídas as macro-cotas com o perfil das pessoas que devem ser entrevistadas em cada Área/Região. No caso específico das pesquisas municipais com estratificação geográfica, também serão enviadas todas as informações necessárias para classificar o respondente num bairro/segmento geográfico de acordo com o seu CEP.

Ponderação dos resultados

A ponderação padrão do PD para pesquisas telefônicas utiliza as mesmas variáveis utilizadas na definição das cotas (Sexo, Idade, Escolaridade e Ocupação) além de Área/Região. No caso de amostras com abrangência geográfica nacional ou estadual, os ajustes são realizados dentro de cada área/região de interesse; nos outros casos o ajuste é para o total da pesquisa e a área é tratada como mais uma variável de ponderação. No caso específico de amostra municípais, é preciso ter cuidado de incluir as informações contidas nas listagens vendidas pelo PD na base de dados da pesquisa, permitindo assim a inclusão de Área/Região no esquema de ponderação.

Em pesquisas telefônicas atenção especial é dada à questão do tipo do telefone, pois são necessários dois cadastros (de fixos e de celulares) para selecionar a amostra. A motivação para considerar essa informação na ponderação é porque pessoas que têm os dois tipos de telefone têm mais chance de pertencer à pesquisa e a sua proporção na amostra pode ser super-estimada. Além disso, existem estudos mostrando que tais pessoas têm perfil de voto mais conservador, aumentando o potencial de algum viés relevante na pesquisa. Em pesquisas realizadas por URA é importante tentar corrigir o viés que pode ocorrer por subgrupos da população não participarem de pesquisas desse tipo, porém quais ajustes devem ser feitos ainda não é tão claro.

No esquema de ponderação, também podem ser incluídas outras variáveis previamente escolhidas, como por exemplo, tipo de residência, recebimento do Bolsa Família e Religião, se o cliente desejar. Para que variáveis possam ser utilizadas na ponderação da pesquisa, elas têm que ser incluídas no questionário (ou na base de dados). Além disso, é necessário que a distribuição populacional delas seja conhecida, ou seja, essas informações devem estar presentes em pesquisas públicas (preferencialmente confiáveis).

Pesquisas online

Em pesquisas online, para que uma pessoa possa participar da pesquisa, é necessário que tenha acesso à internet. Como nesses casos geralmente é o próprio respondente que preenche o questionário (auto-preenchimento), ele pode fazê-lo de qualquer local, como de sua casa, do seu trabalho, de uma lan house, ou até do smartphone. A etapa de recrutamento é muito importante. Ela consiste em entrar em contato com os potenciais respondentes, enviando para eles o link necessário para responder à pesquisa. Existem várias formas de recrutamento, inclusive algumas que não dependem da internet, o que permite que pessoas que utilizam com pouca frequência a internet, ou sem acesso à internet na sua casa ou celular, possa participar da pesquisa.

A forma mais comum de recrutamento é online, utilizando painéis online. Nestes painéis pessoas se cadastram para poderem ser contactadas para participar de pesquias, pois recebem algum incentivo (financeiro ou não) para tanto. Outra forma de recrutamento que vem se tornando mais popular é chamada de river sampling, onde as pessoas são recrutadas enquanto utilizam a internet da forma como normalmente fazem. Esse tipo de recrutamento também tende a oferecer algum tipo de incentivo online, como pontos ou acesso exclusivo aos mais variados produtos e serviços. Outra forma bastante popular de recrutamento é através de listagens de emails. O recrutamento offline também é possível, muitas vezes feito no momento em que a pessoa iniciaria o acesso à internet, como em Lan Houses ou wi-fi’s públicos, algumas vezes oferencendo como incentivo pela participação na pesquisa o acesso gratuíto. Também é possível que o recrutamento seja feito pelo telefone (Whatsapp, SMS ou Smartphone), ou quando uma pessoa realizar uma compra numa loja física; em alguns casos mais raros, até pode ser feito pelo correio.

Amostra online do PD

Como as informações disponíveis sobre os respondentes dependem muito da forma de recrutamento utilizada, não é possível desenvolver uma metodologia abrangente para a seleção de amostras nesse modo de pesquisa. Assim, geralmente o controle é estritamente baseado em cotas, e é difícil dizer de antemão quais variáveis devem ser utilizadas. Decisões como essas tem que ser tomadas após a definição de como será feita a coleta de dados.

Em termos práticos, o produto final entregue a quem adquirir uma amostra padrão do PD serão macro-cotas dentro de cada estrato geográfico considerado, com o perfil da população online para controlar a auto-seleção dos respondentes na pesquisa. Para mais informações sobre pesquisas online, e os possíveis viéses desse tipo de pesquisa, veja esse post.

Ponderação dos resultados

A ponderação padrão do PD para pesquisas utiliza as mesmas variáveis utilizadas na definição das cotas (Sexo, Idade, Escolaridade e Ocupação) além de Área/Região, porém outras variáveis podem ser utilizadas. No caso de amostras com abrangência geográfica nacional ou estadual, os ajustes são realizados dentro de cada área/região de interesse, nos outros casos o ajuste é para o total da pesquisa e a área é tratada como mais uma variável de ponderação.

No caso específico das pesquisas online, atenção especial é dada a informações como frequência de uso da internet e tipo de uso da internet do respondente, para remover viés conhecidos desse tipo de pesquisa. Para que variáveis como essas possam ser utilizadas na ponderação da pesquisa, elas têm que ser incluídas no questionário (ou na base de dados).


comments powered by Disqus