Uso de Dados Secundários na pesquisa científica
Uso de dados secundários na pesquisa em políticas públicas
O uso de dados secundários ganhou centralidade na pesquisa aplicada em políticas públicas com a expansão de portais de dados abertos, a padronização de princípios de governança de dados e o barateamento das ferramentas analíticas. Para gestores e pesquisadores, trabalhar com bases já existentes permite respostas mais rápidas a problemas complexos, escalabilidade de análises e reprodutibilidade — desde que se observem boas práticas metodológicas e legais. Iniciativas internacionais como os Princípios FAIR (Findability, Accessibility, Interoperability e Reusability) orientam a gestão e a reusabilidade de ativos digitais, ampliando a capacidade de descoberta, acesso e reutilização de dados para fins científicos e de políticas públicas (WILKINSON et al., 2016).
Em paralelo, a Open Data Charter consolidou princípios de dados abertos (abertura por padrão; tempestividade e completude; acessibilidade e usabilidade; comparabilidade e interoperabilidade; dados para melhor governança e engajamento; e para desenvolvimento inclusivo), reforçando a abertura e a reutilização de dados governamentais como insumos para o ciclo de políticas (formulação, implementação, monitoramento e avaliação). No plano regional, a América Latina e o Caribe (ALC) expandiram catálogos nacionais (por exemplo, dados.gov.br, datos.gob.mx, datos.gov.co, datos.gob.cl, datos.gob.ar, catalogodatos.gub.uy) e fortaleceram sistemas estatísticos nacionais (IBGE, INEGI, DANE, INE/Chile, INDEC, INEI/Peru), além de contar com repositórios regionais como o CEPALstat e globais como o World Bank Open Data.
Este artigo apresenta, em estilo analítico, quatro seções: (i) o que são dados secundários; (ii) prós e contras de seu uso; e (iii) exemplos de dados públicos na ALC, com referências e citações em padrão ABNT e fontes da internet não provenientes da Wikipédia.
O que são dados secundários
Dados secundários são informações coletadas previamente para um propósito específico (estatístico, administrativo, regulatório ou operacional) e posteriormente reaproveitadas para responder a novas perguntas de pesquisa. A literatura metodológica os define como dados produzidos por outros pesquisadores ou instituições e analisados em momento subsequente, seja em sua forma agregada (indicadores) seja em microdados (registros unitários anonimizados). (JOHNSTON, 2014; WICKHAM, 2019).
No campo das políticas públicas, as quatro fontes mais recorrentes de dados secundários são: (a) estatísticas oficiais baseadas em censos e pesquisas amostrais (por exemplo, Censo Demográfico e PNAD Contínua no Brasil; ENOE no México; GEIH na Colômbia; CASEN no Chile); (b) registros administrativos gerados por operações de governo (saúde, educação, assistência social, justiça, segurança, orçamento e finanças públicas); (c) dados de gestão e monitoramento de políticas (sistemas de prestação de contas, transparência ativa e avaliação de programas); e (d) dados de organismos internacionais comparáveis entre países (Banco Mundial, CEPAL, FMI). Esses insumos são usualmente publicados em portais nacionais de dados abertos e em sites das agências estatísticas, bem como em repositórios regionais e globais.
A distinção entre dados primários e secundários é conceitual e operacional: primários são aqueles coletados diretamente pelo pesquisador para a pergunta de pesquisa corrente; secundários foram coletados por terceiros, com desenhos e definições pré-estabelecidos. Em ambos os casos, é indispensável cumprir princípios de qualidade e ética. O referencial dos Princípios Fundamentais de Estatísticas Oficiais da ONU e a agenda FAIR oferecem bases robustas para governança, documentação e reuso responsável.
Prós e contras do uso de dados secundários
Vantagens
Rapidez e economicidade: dados secundários reduzem tempo e custo de pesquisa, pois evitam levantar do zero informações que já existem — vantagem especialmente crítica em contextos de restrição orçamentária e necessidade de respostas ágeis (JOHNSTON, 2014; QUALTRICS, 2021).
Escala e comparabilidade: permite análises em séries temporais extensas e comparações entre unidades subnacionais ou países, além de avaliações quase-experimentais quando há choques de política. Portais oficiais na ALC e repositórios internacionais (World Bank Open Data; CEPALstat) ampliam a disponibilidade de séries harmonizadas.
Reprodutibilidade e transparência: conjuntos de dados abertos, com metadados claros e licenças explícitas, favorecem a replicação e o escrutínio público. Os Princípios FAIR e a Open Data Charter apontam critérios para tornar dados encontráveis, acessíveis, interoperáveis, reutilizáveis, abertos por padrão e comparáveis (WILKINSON et al., 2016; ODC, 2015).
Abrangência temática: registros administrativos e bases estatísticas cobrem múltiplas políticas (saúde, educação, proteção social, finanças públicas, segurança), possibilitando integração e linkage entre bases (respeitados os marcos de proteção de dados) para análises sistêmicas. Diretrizes como a UN NQAF oferecem guias para gestão da qualidade em várias fontes.
Limitações e riscos
Aderência entre pergunta e desenho original: como o desenho da base foi feito para outro propósito, podem existir mismatch conceitual (variáveis e classificações), diferenças operacionais e mudanças metodológicas ao longo da série, afetando validade interna e comparabilidade. O arcabouço de Total Survey Error (TSE) destaca erros de cobertura, amostragem, não resposta, medição e processamento que, mesmo em dados oficiais, precisam ser compreendidos e mitigados (GROVES; BIEMER).
Qualidade variável em dados administrativos: registros administrativos sofrem com subcobertura, inconsistências, incentivos operacionais e erros de vinculação. Guias recentes da ONU/UNECE orientam a avaliação da qualidade e o uso de dados administrativos em estatísticas, recomendando processos de documentação, auditoria e governança (UNECE, 2021; UNSD/UN-NQAF, 2019-2025).
Acesso, privacidade e ética: a reutilização deve observar marcos legais, como a LAI e a Política de Dados Abertos no Brasil, e leis de proteção de dados (por exemplo, LGPD no Brasil; Lei 1581/2012 na Colômbia), equilibrando transparência e proteção de dados pessoais. Em muitos casos, microdados são anonimizados e/ou disponibilizados sob salvaguardas. Bases administrativas tendem a refletir a lógica de produção do serviço (quem acessa e é registrado), podendo sub-representar grupos. A literatura identifica vieses de seleção, de cobertura e de ligação de registros (linkage), com recomendações para diagnóstico e mitigação (HARRON et al., 2017; KATZ et al., 2022).
Capacidades institucionais e manutenção: portais e séries oficiais requerem orçamentos, governança e rotinas de atualização. Experiências internacionais mostram que, sem investimento continuado, qualidade de estatísticas-chave pode se deteriorar — um alerta útil para a governança de dados na região.
Como mitigar os riscos
Para maximizar benefícios e reduzir limitações, recomenda-se: (i) planejamento metodológico explícito, com teoria de mudança e perguntas bem especificadas; (ii) verificação de metadados e versões; (iii) aplicação de frameworks de qualidade (UN NQAF, TSE, OECD Data Quality Framework) e checklists de dados administrativos; (iv) análise de sensibilidade a variações de definição/classificação; e (v) compliance legal (LGPD, habeas data, decretos de dados abertos), com avaliação de risco ético e anonimização onde aplicável.
Exemplos de dados públicos na América Latina
A seguir, um panorama sintético de fontes abertas e oficiais na região, com exemplos de boletins, séries e microdados relevantes para desenho, implementação, monitoramento e avaliação de políticas. As descrições enfatizam acesso público e documentação, essenciais ao reuso rigoroso.
Brasil
Portal Brasileiro de Dados Abertos (dados.gov.br): ponto central de busca a conjuntos de dados federais e subnacionais, com API pública (documentada) e orientação de uso. Útil para mapping de bases, descoberta por tema e integração com scripts de coleta/ETL.
IBGE – PNAD Contínua: séries trimestrais e anuais de mercado de trabalho, educação e rendimentos; essenciais para avaliação de políticas laborais e de inclusão produtiva. Metodologias e tabelas estão disponíveis no site oficial. IBGE
DATASUS / TABNET: agregados e, em alguns casos, microdados de saúde (morbidade, mortalidade, atenção primária etc.), com dicionários e rotinas de tabulação; base central para análises de políticas de saúde e vigilância epidemiológica.
Transparência e Finanças Públicas (Portal da Transparência; SICONFI; Tesouro Transparente): despesas, receitas, contratos, convênios e contabilidade pública, com APIs e CKAN. Permite avaliação de gasto, estudos de eficiência alocativa, compliance e accountability.
Marco legal: Lei de Acesso à Informação (Lei 12.527/2011) e Decreto 8.777/2016 (Política de Dados Abertos) balizam a abertura e o reuso; a LGPD (Lei 13.709/2018) regula o tratamento de dados pessoais.
Exemplo de uso aplicado: avaliação do impacto de transferências de renda sobre desemprego e informalidade combinando PNAD Contínua (desfechos) e execução orçamentária (programas), com desenho quasi-experimental e controle de tendências.
México
Plataforma Nacional de Datos Abiertos (datos.gob.mx) e INEGI: bases estatísticas e geográficas, séries econômicas e sociais, cartografias e microdados. INEGI mantém seção específica de dados abertos. Úteis para estudos de produtividade, mercado de trabalho, pobreza e ordenamento territorial.
Saúde (Secretaría de Salud): coleções de dados abertos epidemiológicos (incluindo diretrizes derivadas do Decreto de Dados Abertos de 2015).
Exemplo de uso aplicado: cruzar ENIGH/ENOE (INEGI) com dados de gasto setorial para avaliar focalização de políticas sociais e sua associação com indicadores de pobreza.
Colômbia
Portal Nacional de Datos Abiertos (datos.gov.co) e DANE: catálogo de bases abertas e estatísticas oficiais por tema (preços, mercado de trabalho, demografia). A plataforma expõe metadados e painéis de acompanhamento da oferta de dados.
Marco legal: Lei 1581/2012 (proteção de dados pessoais) e guias institucionais de proteção de dados orientam o reuso responsável em pesquisa. Alcaldía de Bogotá
Exemplo de uso aplicado: estimar efeitos de programas de segurança cidadã utilizando séries de vitimização/criminalidade (DANE e dados setoriais) com métodos de diferenças-em-diferenças entre municípios.
Chile
Datos.gob.cl e INE/Chile: catálogos de dados e geodados abertos com documentação metodológica; úteis para estudos de pobreza multidimensional, produtividade, educação e meio ambiente.
Exemplo de uso aplicado: análises de desigualdades territoriais combinando geodados (INE/Chile) com execução orçamentária municipal.
Argentina
Datos Argentina (datos.gob.ar) e INDEC: estatísticas por tema (pobreza, trabalho, preços, segurança pública) e bases de dados para reuso. Insumos para políticas de desenvolvimento produtivo e proteção social.
Exemplo de uso aplicado: avaliação de impactos regionais de políticas de preços (precios cuidados) sobre consumo, combinando séries do INDEC e informações administrativas setoriais.
Peru
INEI e Portal de Dados Abertos (datosabiertos.gob.pe): microdados e documentação de pesquisas e censos, com serviços para consulta. Úteis para estudos de mercado de trabalho, pobreza e gestão territorial andina/amazônica. Proyectos INEI+1
Exemplo de uso aplicado: medir efeitos de programas de infraestrutura rural em renda domiciliar usando microdados do INEI e dados de investimento público subnacional.
Uruguai
Catálogo Nacional de Datos Abiertos (catalogodatos.gub.uy) e portal institucional de dados abertos (gub.uy/datos-abiertos), com comunidades ativas e guias (AGESIC). Dados úteis para políticas urbanas, mobilidade e serviços públicos. Catálogo de Dados+1
Exemplo de uso aplicado: avaliação de transparência municipal combinando dados abertos locais (por exemplo, Montevideo) com indicadores de desempenho e participação cívica.
Repositórios regionais e multilaterais
CEPALstat: indicadores regionais para monitoramento dos ODS e séries histórico-comparativas (demografia, economia, ambiente).
World Bank Open Data e BOOST (Orçamentos Abertos): dados macro, setoriais e fiscais (linha a linha) para avaliação de políticas e transparência orçamentária.
FMI – IMF Data: séries macroeconômicas e financeiras de alta periodicidade para monitoramento de conjuntura.
Boas práticas para pesquisas com dados secundários
Definição da pergunta e desenho analítico: especifique hipóteses e indicadores antes de escolher a base. Consulte metadados e notas técnicas para entender mudanças metodológicas (quebras de série).
Rastreabilidade e documentação: registre versões, extrações, filtros e transformações; priorize fontes com licenças e APIs estáveis (dados.gov.br, SICONFI, Transparência).
Qualidade e comparabilidade: aplique dimensões de qualidade (relevância, acurácia, atualidade, coerência, comparabilidade, completude) e indicadores propostos por marcos (OECD, UNICEF, UN).
Ética e proteção de dados: assegure conformidade com LGPD (Brasil) e marcos análogos (Colômbia) quando houver dados pessoais; prefira microdados anonimizados e avalie risco de reidentificação.
Transparência e reprodutibilidade: sempre que possível, publique código e dicionários; referencie versões de datasets e URLs oficiais; descreva limitações e vieses, especialmente em dados administrativos (UNECE; OSR/UK).
Boas práticas para pesquisas com dados secundários
Dados secundários não são um “atalho” metodológico, mas um campo estruturado por princípios e padrões de qualidade. Quando combinados com boas práticas de documentação, avaliação de qualidade e conformidade legal, eles potencializam a capacidade de pesquisadores e formuladores de políticas na América Latina para desenhar, implementar e avaliar intervenções públicas com agilidade, escopo e transparência. As fontes listadas (portais nacionais, agências estatísticas e repositórios multilaterais) oferecem um ponto de partida sólido. O desafio passa por fortalecer capacidades analíticas e governança de dados nas instituições públicas e acadêmicas, de forma a garantir que a expansão do acesso venha acompanhada de qualidade, proteção de direitos e impacto público
Referências
BANCO MUNDIAL. World Bank Open Data – Data. Disponível em: https://data.worldbank.org/. Acesso em: 30 set. 2025.
BANCO MUNDIAL. BOOST – Open Budgets Portal. Disponível em: https://www.worldbank.org/en/programs/boost-portal. Acesso em: 30 set. 2025.
BRASIL. Lei nº 12.527, de 18 de novembro de 2011 (Lei de Acesso à Informação). Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm. Acesso em: 30 set. 2025.
BRASIL. Decreto nº 8.777, de 11 de maio de 2016 (Política de Dados Abertos do Poder Executivo federal). Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2015-2018/2016/decreto/d8777.htm. Acesso em: 30 set. 2025.
CEPAL. CEPALSTAT – Portal de Dados e Publicações Estatísticas. Disponível em: https://statistics.cepal.org/portal/cepalstat/. Acesso em: 30 set. 2025.
BRASIL. Conecta gov.br – API do Portal Brasileiro de Dados Abertos (documentação). Disponível em: https://www.gov.br/conecta/catalogo/apis/api-portal-de-dados-abertos. Acesso em: 30 set. 2025.
CHILE. Datos.gob.cl – Portal Nacional de Datos Abiertos. Disponível em: https://datos.gob.cl/. Acesso em: 30 set. 2025.
CHILE. Instituto Nacional de Estadísticas (INE). Geodatos Abiertos (link corrigido). Disponível em: https://www.ine.gob.cl/herramientas/portal-de-mapas/geodatos-abiertos. Acesso em: 30 set. 2025.
COLÔMBIA. Datos.gov.co – Portal Nacional de Datos Abiertos. Disponível em: https://www.datos.gov.co/. Acesso em: 30 set. 2025.
COLÔMBIA. Departamento Administrativo Nacional de Estadística (DANE). Portal institucional. Disponível em: https://www.dane.gov.co/. Acesso em: 30 set. 2025.
BRASIL. Tesouro Nacional – Siconfi. API de Dados Abertos. Disponível em: https://www.tesourotransparente.gov.br/consultas/consultas-siconfi/siconfi-api-de-dados-abertos. Acesso em: 30 set. 2025.
BRASIL. DATASUS – Informações de Saúde (TABNET). Disponível em: https://datasus.saude.gov.br/informacoes-de-saude-tabnet/. Acesso em: 30 set. 2025.
BRASIL. IBGE – PNAD Contínua. Disponível em: https://www.ibge.gov.br/estatisticas/sociais/habitacao/17270-pnad-continua.html. Acesso em: 30 set. 2025.
PERU. Instituto Nacional de Estadística e Informática (INEI). Microdatos. Disponível em: https://proyectos.inei.gob.pe/microdatos/. Acesso em: 30 set. 2025.
MÉXICO. Instituto Nacional de Estadística y Geografía (INEGI). Datos Abiertos. Disponível em: https://www.inegi.org.mx/datosabiertos/. Acesso em: 30 set. 2025.
ARGENTINA. Instituto Nacional de Estadística y Censos (INDEC). Bases de datos. Disponível em: https://www.indec.gob.ar/indec/web/Institucional-Indec-BasesDeDatos. Acesso em: 30 set. 2025.
MÉXICO. Diario Oficial de la Federación. DECRETO por el que se establece la regulación en materia de Datos Abiertos (20/02/2015). Disponível em: https://www.dof.gob.mx/nota_detalle.php?codigo=5382838&fecha=20/02/2015. Acesso em: 30 set. 2025.
OPEN DATA CHARTER. Princípios. Disponível em: https://opendatacharter.org/principles/. Acesso em: 30 set. 2025.
NAÇÕES UNIDAS (UNSD). UN NQAF Manual – National Quality Assurance Framework Manual for Official Statistics. Disponível em: https://unstats.un.org/unsd/methodology/dataquality/un-nqaf-manual/. Acesso em: 30 set. 2025.
UK OFFICE FOR STATISTICS REGULATION. Quality Assurance of Administrative Data (QAAD). Disponível em: https://osr.statisticsauthority.gov.uk/publication/administrative-data-and-official-statistics/. Acesso em: 30 set. 2025.
NATIONAL CENTRE FOR RESEARCH METHODS (NCRM). Data Quality: Total Survey Error (slides). Disponível em: https://www.ncrm.ac.uk/resources/online/data_quality_and_survey_error/downloads/slides/data_quality_total_survey_error.pdf. Acesso em: 30 set. 2025.
UNECE. Guidelines for Assessing the Quality of Administrative Data for Use in Censuses. Disponível em: https://unece.org/sites/default/files/2021-10/ECECESSTAT20214_WEB.pdf. Acesso em: 30 set. 2025.
URUGUAI. Catálogo Nacional de Datos Abiertos. Disponível em: https://catalogodatos.gub.uy/. Acesso em: 30 set. 2025.
WILKINSON, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 2016. Disponível em: https://www.nature.com/articles/sdata201618. Acesso em: 30 set. 2025.
WICKHAM, R. J. Secondary Analysis Research. Nursing Research, 2019. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC7520737/. Acesso em: 30 set. 2025.
BRASIL. Portal Brasileiro de Dados Abertos. Disponível em: https://dados.gov.br/. Acesso em: 30 set. 2025.
FUNDO MONETÁRIO INTERNACIONAL (FMI). IMF Data Portal. Disponível em: https://data.imf.org/. Acesso em: 30 set. 2025.
BRASIL. Portal da Transparência do Governo Federal – API. Disponível em: https://portaldatransparencia.gov.br/api-de-dados. Acesso em: 30 set. 2025.
ARGENTINA. Dados Abertos – Dados Argentina. Disponível em: https://dados.gob.ar/. Acesso em: 30 set. 2025.
URUGUAI. Dados abertos – Portal oficial. Disponível em: https://www.gub.uy/datos-abertos. Acesso em: 30 set. 2025.
Uso de dados secundários na pesquisa em políticas públicas
O uso de dados secundários ganhou centralidade na pesquisa aplicada em políticas públicas com a expansão de portais de dados abertos, a padronização de princípios de governança de dados e o barateamento das ferramentas analíticas. Para gestores e pesquisadores, trabalhar com bases já existentes permite respostas mais rápidas a problemas complexos, escalabilidade de análises e reprodutibilidade — desde que se observem boas práticas metodológicas e legais. Iniciativas internacionais como os Princípios FAIR (Findability, Accessibility, Interoperability e Reusability) orientam a gestão e a reusabilidade de ativos digitais, ampliando a capacidade de descoberta, acesso e reutilização de dados para fins científicos e de políticas públicas (WILKINSON et al., 2016).
Em paralelo, a Open Data Charter consolidou princípios de dados abertos (abertura por padrão; tempestividade e completude; acessibilidade e usabilidade; comparabilidade e interoperabilidade; dados para melhor governança e engajamento; e para desenvolvimento inclusivo), reforçando a abertura e a reutilização de dados governamentais como insumos para o ciclo de políticas (formulação, implementação, monitoramento e avaliação). No plano regional, a América Latina e o Caribe (ALC) expandiram catálogos nacionais (por exemplo, dados.gov.br, datos.gob.mx, datos.gov.co, datos.gob.cl, datos.gob.ar, catalogodatos.gub.uy) e fortaleceram sistemas estatísticos nacionais (IBGE, INEGI, DANE, INE/Chile, INDEC, INEI/Peru), além de contar com repositórios regionais como o CEPALstat e globais como o World Bank Open Data.
Este artigo apresenta, em estilo analítico, quatro seções: (i) o que são dados secundários; (ii) prós e contras de seu uso; e (iii) exemplos de dados públicos na ALC, com referências e citações em padrão ABNT e fontes da internet não provenientes da Wikipédia.
O que são dados secundários
Dados secundários são informações coletadas previamente para um propósito específico (estatístico, administrativo, regulatório ou operacional) e posteriormente reaproveitadas para responder a novas perguntas de pesquisa. A literatura metodológica os define como dados produzidos por outros pesquisadores ou instituições e analisados em momento subsequente, seja em sua forma agregada (indicadores) seja em microdados (registros unitários anonimizados). (JOHNSTON, 2014; WICKHAM, 2019).
No campo das políticas públicas, as quatro fontes mais recorrentes de dados secundários são: (a) estatísticas oficiais baseadas em censos e pesquisas amostrais (por exemplo, Censo Demográfico e PNAD Contínua no Brasil; ENOE no México; GEIH na Colômbia; CASEN no Chile); (b) registros administrativos gerados por operações de governo (saúde, educação, assistência social, justiça, segurança, orçamento e finanças públicas); (c) dados de gestão e monitoramento de políticas (sistemas de prestação de contas, transparência ativa e avaliação de programas); e (d) dados de organismos internacionais comparáveis entre países (Banco Mundial, CEPAL, FMI). Esses insumos são usualmente publicados em portais nacionais de dados abertos e em sites das agências estatísticas, bem como em repositórios regionais e globais.
A distinção entre dados primários e secundários é conceitual e operacional: primários são aqueles coletados diretamente pelo pesquisador para a pergunta de pesquisa corrente; secundários foram coletados por terceiros, com desenhos e definições pré-estabelecidos. Em ambos os casos, é indispensável cumprir princípios de qualidade e ética. O referencial dos Princípios Fundamentais de Estatísticas Oficiais da ONU e a agenda FAIR oferecem bases robustas para governança, documentação e reuso responsável.
Prós e contras do uso de dados secundários
Vantagens
Rapidez e economicidade: dados secundários reduzem tempo e custo de pesquisa, pois evitam levantar do zero informações que já existem — vantagem especialmente crítica em contextos de restrição orçamentária e necessidade de respostas ágeis (JOHNSTON, 2014; QUALTRICS, 2021).
Escala e comparabilidade: permite análises em séries temporais extensas e comparações entre unidades subnacionais ou países, além de avaliações quase-experimentais quando há choques de política. Portais oficiais na ALC e repositórios internacionais (World Bank Open Data; CEPALstat) ampliam a disponibilidade de séries harmonizadas.
Reprodutibilidade e transparência: conjuntos de dados abertos, com metadados claros e licenças explícitas, favorecem a replicação e o escrutínio público. Os Princípios FAIR e a Open Data Charter apontam critérios para tornar dados encontráveis, acessíveis, interoperáveis, reutilizáveis, abertos por padrão e comparáveis (WILKINSON et al., 2016; ODC, 2015).
Abrangência temática: registros administrativos e bases estatísticas cobrem múltiplas políticas (saúde, educação, proteção social, finanças públicas, segurança), possibilitando integração e linkage entre bases (respeitados os marcos de proteção de dados) para análises sistêmicas. Diretrizes como a UN NQAF oferecem guias para gestão da qualidade em várias fontes.
Limitações e riscos
Aderência entre pergunta e desenho original: como o desenho da base foi feito para outro propósito, podem existir mismatch conceitual (variáveis e classificações), diferenças operacionais e mudanças metodológicas ao longo da série, afetando validade interna e comparabilidade. O arcabouço de Total Survey Error (TSE) destaca erros de cobertura, amostragem, não resposta, medição e processamento que, mesmo em dados oficiais, precisam ser compreendidos e mitigados (GROVES; BIEMER).
Qualidade variável em dados administrativos: registros administrativos sofrem com subcobertura, inconsistências, incentivos operacionais e erros de vinculação. Guias recentes da ONU/UNECE orientam a avaliação da qualidade e o uso de dados administrativos em estatísticas, recomendando processos de documentação, auditoria e governança (UNECE, 2021; UNSD/UN-NQAF, 2019-2025).
Acesso, privacidade e ética: a reutilização deve observar marcos legais, como a LAI e a Política de Dados Abertos no Brasil, e leis de proteção de dados (por exemplo, LGPD no Brasil; Lei 1581/2012 na Colômbia), equilibrando transparência e proteção de dados pessoais. Em muitos casos, microdados são anonimizados e/ou disponibilizados sob salvaguardas. Bases administrativas tendem a refletir a lógica de produção do serviço (quem acessa e é registrado), podendo sub-representar grupos. A literatura identifica vieses de seleção, de cobertura e de ligação de registros (linkage), com recomendações para diagnóstico e mitigação (HARRON et al., 2017; KATZ et al., 2022).
Capacidades institucionais e manutenção: portais e séries oficiais requerem orçamentos, governança e rotinas de atualização. Experiências internacionais mostram que, sem investimento continuado, qualidade de estatísticas-chave pode se deteriorar — um alerta útil para a governança de dados na região.
Como mitigar os riscos
Para maximizar benefícios e reduzir limitações, recomenda-se: (i) planejamento metodológico explícito, com teoria de mudança e perguntas bem especificadas; (ii) verificação de metadados e versões; (iii) aplicação de frameworks de qualidade (UN NQAF, TSE, OECD Data Quality Framework) e checklists de dados administrativos; (iv) análise de sensibilidade a variações de definição/classificação; e (v) compliance legal (LGPD, habeas data, decretos de dados abertos), com avaliação de risco ético e anonimização onde aplicável.
Exemplos de dados públicos na América Latina
A seguir, um panorama sintético de fontes abertas e oficiais na região, com exemplos de boletins, séries e microdados relevantes para desenho, implementação, monitoramento e avaliação de políticas. As descrições enfatizam acesso público e documentação, essenciais ao reuso rigoroso.
Brasil
Portal Brasileiro de Dados Abertos (dados.gov.br): ponto central de busca a conjuntos de dados federais e subnacionais, com API pública (documentada) e orientação de uso. Útil para mapping de bases, descoberta por tema e integração com scripts de coleta/ETL.
IBGE – PNAD Contínua: séries trimestrais e anuais de mercado de trabalho, educação e rendimentos; essenciais para avaliação de políticas laborais e de inclusão produtiva. Metodologias e tabelas estão disponíveis no site oficial. IBGE
DATASUS / TABNET: agregados e, em alguns casos, microdados de saúde (morbidade, mortalidade, atenção primária etc.), com dicionários e rotinas de tabulação; base central para análises de políticas de saúde e vigilância epidemiológica.
Transparência e Finanças Públicas (Portal da Transparência; SICONFI; Tesouro Transparente): despesas, receitas, contratos, convênios e contabilidade pública, com APIs e CKAN. Permite avaliação de gasto, estudos de eficiência alocativa, compliance e accountability.
Marco legal: Lei de Acesso à Informação (Lei 12.527/2011) e Decreto 8.777/2016 (Política de Dados Abertos) balizam a abertura e o reuso; a LGPD (Lei 13.709/2018) regula o tratamento de dados pessoais.
Exemplo de uso aplicado: avaliação do impacto de transferências de renda sobre desemprego e informalidade combinando PNAD Contínua (desfechos) e execução orçamentária (programas), com desenho quasi-experimental e controle de tendências.
México
Plataforma Nacional de Datos Abiertos (datos.gob.mx) e INEGI: bases estatísticas e geográficas, séries econômicas e sociais, cartografias e microdados. INEGI mantém seção específica de dados abertos. Úteis para estudos de produtividade, mercado de trabalho, pobreza e ordenamento territorial.
Saúde (Secretaría de Salud): coleções de dados abertos epidemiológicos (incluindo diretrizes derivadas do Decreto de Dados Abertos de 2015).
Exemplo de uso aplicado: cruzar ENIGH/ENOE (INEGI) com dados de gasto setorial para avaliar focalização de políticas sociais e sua associação com indicadores de pobreza.
Colômbia
Portal Nacional de Datos Abiertos (datos.gov.co) e DANE: catálogo de bases abertas e estatísticas oficiais por tema (preços, mercado de trabalho, demografia). A plataforma expõe metadados e painéis de acompanhamento da oferta de dados.
Marco legal: Lei 1581/2012 (proteção de dados pessoais) e guias institucionais de proteção de dados orientam o reuso responsável em pesquisa. Alcaldía de Bogotá
Exemplo de uso aplicado: estimar efeitos de programas de segurança cidadã utilizando séries de vitimização/criminalidade (DANE e dados setoriais) com métodos de diferenças-em-diferenças entre municípios.
Chile
Datos.gob.cl e INE/Chile: catálogos de dados e geodados abertos com documentação metodológica; úteis para estudos de pobreza multidimensional, produtividade, educação e meio ambiente.
Exemplo de uso aplicado: análises de desigualdades territoriais combinando geodados (INE/Chile) com execução orçamentária municipal.
Argentina
Datos Argentina (datos.gob.ar) e INDEC: estatísticas por tema (pobreza, trabalho, preços, segurança pública) e bases de dados para reuso. Insumos para políticas de desenvolvimento produtivo e proteção social.
Exemplo de uso aplicado: avaliação de impactos regionais de políticas de preços (precios cuidados) sobre consumo, combinando séries do INDEC e informações administrativas setoriais.
Peru
INEI e Portal de Dados Abertos (datosabiertos.gob.pe): microdados e documentação de pesquisas e censos, com serviços para consulta. Úteis para estudos de mercado de trabalho, pobreza e gestão territorial andina/amazônica. Proyectos INEI+1
Exemplo de uso aplicado: medir efeitos de programas de infraestrutura rural em renda domiciliar usando microdados do INEI e dados de investimento público subnacional.
Uruguai
Catálogo Nacional de Datos Abiertos (catalogodatos.gub.uy) e portal institucional de dados abertos (gub.uy/datos-abiertos), com comunidades ativas e guias (AGESIC). Dados úteis para políticas urbanas, mobilidade e serviços públicos. Catálogo de Dados+1
Exemplo de uso aplicado: avaliação de transparência municipal combinando dados abertos locais (por exemplo, Montevideo) com indicadores de desempenho e participação cívica.
Repositórios regionais e multilaterais
CEPALstat: indicadores regionais para monitoramento dos ODS e séries histórico-comparativas (demografia, economia, ambiente).
World Bank Open Data e BOOST (Orçamentos Abertos): dados macro, setoriais e fiscais (linha a linha) para avaliação de políticas e transparência orçamentária.
FMI – IMF Data: séries macroeconômicas e financeiras de alta periodicidade para monitoramento de conjuntura.
Boas práticas para pesquisas com dados secundários
Definição da pergunta e desenho analítico: especifique hipóteses e indicadores antes de escolher a base. Consulte metadados e notas técnicas para entender mudanças metodológicas (quebras de série).
Rastreabilidade e documentação: registre versões, extrações, filtros e transformações; priorize fontes com licenças e APIs estáveis (dados.gov.br, SICONFI, Transparência).
Qualidade e comparabilidade: aplique dimensões de qualidade (relevância, acurácia, atualidade, coerência, comparabilidade, completude) e indicadores propostos por marcos (OECD, UNICEF, UN).
Ética e proteção de dados: assegure conformidade com LGPD (Brasil) e marcos análogos (Colômbia) quando houver dados pessoais; prefira microdados anonimizados e avalie risco de reidentificação.
Transparência e reprodutibilidade: sempre que possível, publique código e dicionários; referencie versões de datasets e URLs oficiais; descreva limitações e vieses, especialmente em dados administrativos (UNECE; OSR/UK).
Boas práticas para pesquisas com dados secundários
Dados secundários não são um “atalho” metodológico, mas um campo estruturado por princípios e padrões de qualidade. Quando combinados com boas práticas de documentação, avaliação de qualidade e conformidade legal, eles potencializam a capacidade de pesquisadores e formuladores de políticas na América Latina para desenhar, implementar e avaliar intervenções públicas com agilidade, escopo e transparência. As fontes listadas (portais nacionais, agências estatísticas e repositórios multilaterais) oferecem um ponto de partida sólido. O desafio passa por fortalecer capacidades analíticas e governança de dados nas instituições públicas e acadêmicas, de forma a garantir que a expansão do acesso venha acompanhada de qualidade, proteção de direitos e impacto público
Referências
BANCO MUNDIAL. World Bank Open Data – Data. Disponível em: https://data.worldbank.org/. Acesso em: 30 set. 2025.
BANCO MUNDIAL. BOOST – Open Budgets Portal. Disponível em: https://www.worldbank.org/en/programs/boost-portal. Acesso em: 30 set. 2025.
BRASIL. Lei nº 12.527, de 18 de novembro de 2011 (Lei de Acesso à Informação). Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2011-2014/2011/lei/l12527.htm. Acesso em: 30 set. 2025.
BRASIL. Decreto nº 8.777, de 11 de maio de 2016 (Política de Dados Abertos do Poder Executivo federal). Disponível em: https://www.planalto.gov.br/ccivil_03/_ato2015-2018/2016/decreto/d8777.htm. Acesso em: 30 set. 2025.
CEPAL. CEPALSTAT – Portal de Dados e Publicações Estatísticas. Disponível em: https://statistics.cepal.org/portal/cepalstat/. Acesso em: 30 set. 2025.
BRASIL. Conecta gov.br – API do Portal Brasileiro de Dados Abertos (documentação). Disponível em: https://www.gov.br/conecta/catalogo/apis/api-portal-de-dados-abertos. Acesso em: 30 set. 2025.
CHILE. Datos.gob.cl – Portal Nacional de Datos Abiertos. Disponível em: https://datos.gob.cl/. Acesso em: 30 set. 2025.
CHILE. Instituto Nacional de Estadísticas (INE). Geodatos Abiertos (link corrigido). Disponível em: https://www.ine.gob.cl/herramientas/portal-de-mapas/geodatos-abiertos. Acesso em: 30 set. 2025.
COLÔMBIA. Datos.gov.co – Portal Nacional de Datos Abiertos. Disponível em: https://www.datos.gov.co/. Acesso em: 30 set. 2025.
COLÔMBIA. Departamento Administrativo Nacional de Estadística (DANE). Portal institucional. Disponível em: https://www.dane.gov.co/. Acesso em: 30 set. 2025.
BRASIL. Tesouro Nacional – Siconfi. API de Dados Abertos. Disponível em: https://www.tesourotransparente.gov.br/consultas/consultas-siconfi/siconfi-api-de-dados-abertos. Acesso em: 30 set. 2025.
BRASIL. DATASUS – Informações de Saúde (TABNET). Disponível em: https://datasus.saude.gov.br/informacoes-de-saude-tabnet/. Acesso em: 30 set. 2025.
BRASIL. IBGE – PNAD Contínua. Disponível em: https://www.ibge.gov.br/estatisticas/sociais/habitacao/17270-pnad-continua.html. Acesso em: 30 set. 2025.
PERU. Instituto Nacional de Estadística e Informática (INEI). Microdatos. Disponível em: https://proyectos.inei.gob.pe/microdatos/. Acesso em: 30 set. 2025.
MÉXICO. Instituto Nacional de Estadística y Geografía (INEGI). Datos Abiertos. Disponível em: https://www.inegi.org.mx/datosabiertos/. Acesso em: 30 set. 2025.
ARGENTINA. Instituto Nacional de Estadística y Censos (INDEC). Bases de datos. Disponível em: https://www.indec.gob.ar/indec/web/Institucional-Indec-BasesDeDatos. Acesso em: 30 set. 2025.
MÉXICO. Diario Oficial de la Federación. DECRETO por el que se establece la regulación en materia de Datos Abiertos (20/02/2015). Disponível em: https://www.dof.gob.mx/nota_detalle.php?codigo=5382838&fecha=20/02/2015. Acesso em: 30 set. 2025.
OPEN DATA CHARTER. Princípios. Disponível em: https://opendatacharter.org/principles/. Acesso em: 30 set. 2025.
NAÇÕES UNIDAS (UNSD). UN NQAF Manual – National Quality Assurance Framework Manual for Official Statistics. Disponível em: https://unstats.un.org/unsd/methodology/dataquality/un-nqaf-manual/. Acesso em: 30 set. 2025.
UK OFFICE FOR STATISTICS REGULATION. Quality Assurance of Administrative Data (QAAD). Disponível em: https://osr.statisticsauthority.gov.uk/publication/administrative-data-and-official-statistics/. Acesso em: 30 set. 2025.
NATIONAL CENTRE FOR RESEARCH METHODS (NCRM). Data Quality: Total Survey Error (slides). Disponível em: https://www.ncrm.ac.uk/resources/online/data_quality_and_survey_error/downloads/slides/data_quality_total_survey_error.pdf. Acesso em: 30 set. 2025.
UNECE. Guidelines for Assessing the Quality of Administrative Data for Use in Censuses. Disponível em: https://unece.org/sites/default/files/2021-10/ECECESSTAT20214_WEB.pdf. Acesso em: 30 set. 2025.
URUGUAI. Catálogo Nacional de Datos Abiertos. Disponível em: https://catalogodatos.gub.uy/. Acesso em: 30 set. 2025.
WILKINSON, M. D. et al. The FAIR Guiding Principles for scientific data management and stewardship. Scientific Data, 2016. Disponível em: https://www.nature.com/articles/sdata201618. Acesso em: 30 set. 2025.
WICKHAM, R. J. Secondary Analysis Research. Nursing Research, 2019. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC7520737/. Acesso em: 30 set. 2025.
BRASIL. Portal Brasileiro de Dados Abertos. Disponível em: https://dados.gov.br/. Acesso em: 30 set. 2025.
FUNDO MONETÁRIO INTERNACIONAL (FMI). IMF Data Portal. Disponível em: https://data.imf.org/. Acesso em: 30 set. 2025.
BRASIL. Portal da Transparência do Governo Federal – API. Disponível em: https://portaldatransparencia.gov.br/api-de-dados. Acesso em: 30 set. 2025.
ARGENTINA. Dados Abertos – Dados Argentina. Disponível em: https://dados.gob.ar/. Acesso em: 30 set. 2025.
URUGUAI. Dados abertos – Portal oficial. Disponível em: https://www.gub.uy/datos-abertos. Acesso em: 30 set. 2025.