Social Media for Researchers

Dados de Redes Sociais para Pesquisadores

O uso de dados de redes sociais amadureceu como frente metodológica para estudos em políticas públicas e saúde coletiva, seja ao analisar contas oficiais de instituições (alertas, campanhas, prestação de contas) seja ao observar “sinais fracos” provenientes de postagens da população que podem antecipar padrões de risco — a chamada Epidemiologia 2.0 ou infodemiologia (EYSENBACH, 2009). A literatura e as diretrizes mais recentes recomendam tratar esses dados como insumo complementar — útil para detecção precoce, escuta ativa e ajuste de comunicação — e não como substituto da vigilância tradicional (WHO, 2025; PAHO/WHO, 2020; McGOWAN et al., 2022).

Para comunicação pública, a observação sistemática das postagens de órgãos governamentais permite mensurar alcance, engajamento e dúvidas recorrentes da população; para saúde pública, a escuta social identifica narrativas, medos e boatos que exigem resposta rápida. A Organização Mundial da Saúde estruturou um arcabouço de social listening ético para avaliação de infodemia, com recomendações sobre transparência, salvaguardas e integração com dados epidemiológicos (WHO, 2025; WHO, 2023). Em paralelo, o EARS — Early AI-supported Response with Social Listening — mostra, em tempo real, como as pessoas falam de temas de saúde em espaços públicos online; sua documentação científica e dados agregados públicos permitem replicação e escrutínio (PURNAT et al., 2021; WHITE et al., 2023; WHO, 2021).

Para baixar e analisar dados de contas institucionais e conteúdos públicos, o caminho mais adequado é o uso de APIs oficiais das plataformas, observando termos de uso e proteção de dados. No ecossistema da Meta, o Content Library & API fornece acesso abrangente e auditável a conteúdo público do Facebook e do Instagram para pesquisadores credenciados (substituindo o CrowdTangle), com processo de elegibilidade e documentação pública (META, 2025; META DEV, 2025). É uma rota preferencial para estudos de comunicação governamental e campanhas de saúde, pois expõe metadados essenciais e padrões de paginação/consulta.

Para o X (antigo Twitter), a via recomendada é o X API. As páginas oficiais descrevem níveis de acesso e trilhas específicas para pesquisa acadêmica (com permissões e limites que variam ao longo do tempo); convém planejar o projeto considerando políticas e custos/tetos de leitura e escrita (X DEVELOPER PLATFORM, 2025). O desenho de coleta deve ser transparente (termos, filtros, períodos) e reprodutível (queries versionadas), sobretudo quando o objetivo é vigilância temática ou avaliação de campanhas.

O YouTube Data API v3 permite coletar, de canais oficiais, metadados de vídeos (títulos, descrições, datas, contagens de visualização e comentários), úteis para mensurar esforços de comunicação audiovisual de prefeituras, ministérios e secretarias de saúde. A documentação oficial expõe endpoints para channels e videos, paginação e limites de quota, o que facilita ETLs periódicos e dashboards de monitoramento (GOOGLE DEVELOPERS, 2025).

No TikTok, há um Research API com critérios de elegibilidade para instituições acadêmicas (inicialmente com foco Estados Unidos/Europa). A documentação oficial explica escopo de dados públicos, fluxo de credenciamento e considerações de privacidade; projetos na ALC podem se beneficiar desse canal, desde que atendam aos requisitos e respeitem a jurisdição (TIKTOK, 2025; 2024).

Para Reddit, relevante em estudos de percepção e redes de apoio, existem Data API e termos específicos para uso acadêmico; mudanças recentes reforçam limites a scraping não autorizado e negociação de acesso, o que exige planejamento jurídico-ético e leitura atenta das políticas (REDDIT, 2025; REUTERS, 2024; THE VERGE, 2024).

Exemplos Práticos

Do lado metodológico, a infodemiologia mostrou utilidade para detectar tendências de sintomas ou preocupações — mas também armadilhas. A experiência do Google Flu Trends mostrou potencial e limites: ganhos de tempestividade, porém com riscos de overfitting, mudanças de comportamento de busca e vieses de mídia (GINSBERG et al., 2009; OLSON et al., 2013; SCHNEIDER et al., 2020; YANG et al., 2015). Por isso, recomenda-se triangulação com séries clínicas/epidemiológicas, validação fora da amostra e documentação explícita de features e janelas temporais.

No plano ético-jurídico, dados de redes sociais — ainda que publicamente acessíveis — podem conter dados pessoais e suscitar expectativas legítimas de privacidade. Pesquisadores na ALC devem alinhar-se à LGPD (no Brasil) e a marcos como o GDPR na União Europeia, adotando princípios de minimização, anonimização, base legal e avaliação de risco. Guias institucionais reforçam checklists para coleta, retenção e compartilhamento responsável, e a OMS publicou orientação específica para escuta social ética em emergências (IAPP, s.d.; EUROPEAN COMMISSION, s.d.; RUG, s.d.; WHO, 2025). Boas práticas incluem: registrar consentimentos quando aplicável; evitar coleta de dados sensíveis; mascarar identificadores; limitar reidentificação; e publicar protocolos e scripts de forma auditável.

Considerações

Em síntese, dados de redes sociais ampliam a capacidade de diagnóstico situacional e resposta pública — da análise de contas oficiais à detecção de alertas difusos em “Epidemiologia 2.0”. O caminho tecnicamente sólido passa por APIs oficiais, metodologias transparentes e compliance. Ao planejar o projeto, defina objetivos de política pública, determine plataformas e endpoints adequados (Meta Content Library, X API, YouTube, TikTok, Reddit, Mastodon), estabeleça rotinas de qualidade e triangule achados com fontes primárias. Assim, a pesquisa transforma cliques e comentários em evidência útil, respeitando direitos e fortalecendo a confiança pública.

Referências

EYSENBACH, G. Infodemiology and Infoveillance: Framework for an Emerging Set of Public Health Informatics Methods. Journal of Medical Internet Research, 2009. Disponível em: https://www.jmir.org/2009/1/e11/. Acesso em: 30 set. 2025.
GINSBERG, J. et al. Detecting influenza epidemics using search engine query data. Nature, 2009. Disponível em: https://research.google.com/archive/papers/detecting-influenza-epidemics.pdf. Acesso em: 30 set. 2025.
GOOGLE DEVELOPERS. YouTube Data API v3 – Channels; Videos. 2025. Disponível em: https://developers.google.com/youtube/v3/docs/channels/list e https://developers.google.com/youtube/v3/docs/videos/list. Acesso em: 30 set. 2025.
IAPP. Brazilian General Data Protection Law (LGPD) – English translation. s.d. Disponível em: https://iapp.org/resources/article/brazilian-data-protection-law-lgpd-english-translation/. Acesso em: 30 set. 2025.
McGOWAN, B. S. et al. World Health Organization’s Early AI-supported Response with Social Listening Platform. Journal of the Medical Library Association (JMLA), 2022. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC9014949/. Acesso em: 30 set. 2025.
META. Meta Content Library and API. 2025. Disponível em: https://transparency.meta.com/researchtools/meta-content-library. Acesso em: 30 set. 2025.
META DEVELOPERS. Content Library and API – Overview; Get Access. 2025. Disponível em: https://developers.facebook.com/docs/content-library-and-api/content-library/ e https://developers.facebook.com/docs/content-library-and-api/get-access/. Acesso em: 30 set. 2025.
OLSON, D. R. et al. Reassessing Google Flu Trends Data for Detection of Seasonal and Pandemic Influenza. PLoS ONE, 2013. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC3798275/. Acesso em: 30 set. 2025.
PAHO/WHO. Understanding the infodemic and misinformation in the fight against COVID-19. 2020. Disponível em: https://iris.paho.org/bitstream/handle/10665.2/52052/Factsheet-infodemic_eng.pdf. Acesso em: 30 set. 2025.
REDDIT. Reddit Data API – Wiki; API Docs. 2025. Disponível em: https://support.reddithelp.com/hc/en-us/articles/16160319875092-Reddit-Data-API-Wiki e https://www.reddit.com/dev/api/. Acesso em: 30 set. 2025.
REUTERS. Reddit to update web standard to block automated scraping. 25 jun. 2024. Disponível em: https://www.reuters.com/technology/reddit-update-web-standard-block-automated-website-scraping-2024-06-25/. Acesso em: 30 set. 2025.
SCHNEIDER, P. P. et al. Using web search queries to monitor influenza-like illness. JMIR Public Health and Surveillance, 2020. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC7268271/. Acesso em: 30 set. 2025.
THE VERGE. Reddit is now blocking major search engines and AI bots—except the ones that pay. 24 jul. 2024. Disponível em: https://www.theverge.com/2024/7/24/24205244/reddit-blocking-search-engine-crawlers-ai-bot-google. Acesso em: 30 set. 2025.
TIKTOK. Research Tools — About; Access and Eligibility; Privacy research posts. 2024–2025. Disponível em: https://developers.tiktok.com/doc/about-research-api/; https://developers.tiktok.com/products/research-api/; https://developers.tiktok.com/blog/privacy-publications-2024. Acesso em: 30 set. 2025.
WHO. Social listening in infodemic management for public health. 2025. Disponível em: https://www.who.int/publications/i/item/9789240108202. Acesso em: 30 set. 2025.
WHO. WHO launches pilot of AI-powered public-access social listening tool (EARS). 2021. Disponível em: https://www.who.int/news-room/feature-stories/detail/who-launches-pilot-of-ai-powered-public-access-social-listening-tool. Acesso em: 30 set. 2025.
X DEVELOPER PLATFORM. X API – Docs; Academic research; v2 Support. 2025. Disponível em: https://developer.x.com/en/docs/x-api; https://developer.x.com/en/use-cases/do-research/academic-research; https://developer.x.com/en/support/x-api/v2. Acesso em: 30 set. 2025.
MASTODON. API – Timelines; Playing with public data. 2025. Disponível em: https://docs.joinmastodon.org/methods/timelines/; https://docs.joinmastodon.org/client/public/. Acesso em: 30 set. 2025.

Dados de Redes Sociais para Pesquisadores

O uso de dados de redes sociais amadureceu como frente metodológica para estudos em políticas públicas e saúde coletiva, seja ao analisar contas oficiais de instituições (alertas, campanhas, prestação de contas) seja ao observar “sinais fracos” provenientes de postagens da população que podem antecipar padrões de risco — a chamada Epidemiologia 2.0 ou infodemiologia (EYSENBACH, 2009). A literatura e as diretrizes mais recentes recomendam tratar esses dados como insumo complementar — útil para detecção precoce, escuta ativa e ajuste de comunicação — e não como substituto da vigilância tradicional (WHO, 2025; PAHO/WHO, 2020; McGOWAN et al., 2022).

Para comunicação pública, a observação sistemática das postagens de órgãos governamentais permite mensurar alcance, engajamento e dúvidas recorrentes da população; para saúde pública, a escuta social identifica narrativas, medos e boatos que exigem resposta rápida. A Organização Mundial da Saúde estruturou um arcabouço de social listening ético para avaliação de infodemia, com recomendações sobre transparência, salvaguardas e integração com dados epidemiológicos (WHO, 2025; WHO, 2023). Em paralelo, o EARS — Early AI-supported Response with Social Listening — mostra, em tempo real, como as pessoas falam de temas de saúde em espaços públicos online; sua documentação científica e dados agregados públicos permitem replicação e escrutínio (PURNAT et al., 2021; WHITE et al., 2023; WHO, 2021).

Para baixar e analisar dados de contas institucionais e conteúdos públicos, o caminho mais adequado é o uso de APIs oficiais das plataformas, observando termos de uso e proteção de dados. No ecossistema da Meta, o Content Library & API fornece acesso abrangente e auditável a conteúdo público do Facebook e do Instagram para pesquisadores credenciados (substituindo o CrowdTangle), com processo de elegibilidade e documentação pública (META, 2025; META DEV, 2025). É uma rota preferencial para estudos de comunicação governamental e campanhas de saúde, pois expõe metadados essenciais e padrões de paginação/consulta.

Para o X (antigo Twitter), a via recomendada é o X API. As páginas oficiais descrevem níveis de acesso e trilhas específicas para pesquisa acadêmica (com permissões e limites que variam ao longo do tempo); convém planejar o projeto considerando políticas e custos/tetos de leitura e escrita (X DEVELOPER PLATFORM, 2025). O desenho de coleta deve ser transparente (termos, filtros, períodos) e reprodutível (queries versionadas), sobretudo quando o objetivo é vigilância temática ou avaliação de campanhas.

O YouTube Data API v3 permite coletar, de canais oficiais, metadados de vídeos (títulos, descrições, datas, contagens de visualização e comentários), úteis para mensurar esforços de comunicação audiovisual de prefeituras, ministérios e secretarias de saúde. A documentação oficial expõe endpoints para channels e videos, paginação e limites de quota, o que facilita ETLs periódicos e dashboards de monitoramento (GOOGLE DEVELOPERS, 2025).

No TikTok, há um Research API com critérios de elegibilidade para instituições acadêmicas (inicialmente com foco Estados Unidos/Europa). A documentação oficial explica escopo de dados públicos, fluxo de credenciamento e considerações de privacidade; projetos na ALC podem se beneficiar desse canal, desde que atendam aos requisitos e respeitem a jurisdição (TIKTOK, 2025; 2024).

Para Reddit, relevante em estudos de percepção e redes de apoio, existem Data API e termos específicos para uso acadêmico; mudanças recentes reforçam limites a scraping não autorizado e negociação de acesso, o que exige planejamento jurídico-ético e leitura atenta das políticas (REDDIT, 2025; REUTERS, 2024; THE VERGE, 2024).

Exemplos Práticos

Do lado metodológico, a infodemiologia mostrou utilidade para detectar tendências de sintomas ou preocupações — mas também armadilhas. A experiência do Google Flu Trends mostrou potencial e limites: ganhos de tempestividade, porém com riscos de overfitting, mudanças de comportamento de busca e vieses de mídia (GINSBERG et al., 2009; OLSON et al., 2013; SCHNEIDER et al., 2020; YANG et al., 2015). Por isso, recomenda-se triangulação com séries clínicas/epidemiológicas, validação fora da amostra e documentação explícita de features e janelas temporais.

No plano ético-jurídico, dados de redes sociais — ainda que publicamente acessíveis — podem conter dados pessoais e suscitar expectativas legítimas de privacidade. Pesquisadores na ALC devem alinhar-se à LGPD (no Brasil) e a marcos como o GDPR na União Europeia, adotando princípios de minimização, anonimização, base legal e avaliação de risco. Guias institucionais reforçam checklists para coleta, retenção e compartilhamento responsável, e a OMS publicou orientação específica para escuta social ética em emergências (IAPP, s.d.; EUROPEAN COMMISSION, s.d.; RUG, s.d.; WHO, 2025). Boas práticas incluem: registrar consentimentos quando aplicável; evitar coleta de dados sensíveis; mascarar identificadores; limitar reidentificação; e publicar protocolos e scripts de forma auditável.

Considerações

Em síntese, dados de redes sociais ampliam a capacidade de diagnóstico situacional e resposta pública — da análise de contas oficiais à detecção de alertas difusos em “Epidemiologia 2.0”. O caminho tecnicamente sólido passa por APIs oficiais, metodologias transparentes e compliance. Ao planejar o projeto, defina objetivos de política pública, determine plataformas e endpoints adequados (Meta Content Library, X API, YouTube, TikTok, Reddit, Mastodon), estabeleça rotinas de qualidade e triangule achados com fontes primárias. Assim, a pesquisa transforma cliques e comentários em evidência útil, respeitando direitos e fortalecendo a confiança pública.

Referências

EYSENBACH, G. Infodemiology and Infoveillance: Framework for an Emerging Set of Public Health Informatics Methods. Journal of Medical Internet Research, 2009. Disponível em: https://www.jmir.org/2009/1/e11/. Acesso em: 30 set. 2025.
GINSBERG, J. et al. Detecting influenza epidemics using search engine query data. Nature, 2009. Disponível em: https://research.google.com/archive/papers/detecting-influenza-epidemics.pdf. Acesso em: 30 set. 2025.
GOOGLE DEVELOPERS. YouTube Data API v3 – Channels; Videos. 2025. Disponível em: https://developers.google.com/youtube/v3/docs/channels/list e https://developers.google.com/youtube/v3/docs/videos/list. Acesso em: 30 set. 2025.
IAPP. Brazilian General Data Protection Law (LGPD) – English translation. s.d. Disponível em: https://iapp.org/resources/article/brazilian-data-protection-law-lgpd-english-translation/. Acesso em: 30 set. 2025.
McGOWAN, B. S. et al. World Health Organization’s Early AI-supported Response with Social Listening Platform. Journal of the Medical Library Association (JMLA), 2022. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC9014949/. Acesso em: 30 set. 2025.
META. Meta Content Library and API. 2025. Disponível em: https://transparency.meta.com/researchtools/meta-content-library. Acesso em: 30 set. 2025.
META DEVELOPERS. Content Library and API – Overview; Get Access. 2025. Disponível em: https://developers.facebook.com/docs/content-library-and-api/content-library/ e https://developers.facebook.com/docs/content-library-and-api/get-access/. Acesso em: 30 set. 2025.
OLSON, D. R. et al. Reassessing Google Flu Trends Data for Detection of Seasonal and Pandemic Influenza. PLoS ONE, 2013. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC3798275/. Acesso em: 30 set. 2025.
PAHO/WHO. Understanding the infodemic and misinformation in the fight against COVID-19. 2020. Disponível em: https://iris.paho.org/bitstream/handle/10665.2/52052/Factsheet-infodemic_eng.pdf. Acesso em: 30 set. 2025.
REDDIT. Reddit Data API – Wiki; API Docs. 2025. Disponível em: https://support.reddithelp.com/hc/en-us/articles/16160319875092-Reddit-Data-API-Wiki e https://www.reddit.com/dev/api/. Acesso em: 30 set. 2025.
REUTERS. Reddit to update web standard to block automated scraping. 25 jun. 2024. Disponível em: https://www.reuters.com/technology/reddit-update-web-standard-block-automated-website-scraping-2024-06-25/. Acesso em: 30 set. 2025.
SCHNEIDER, P. P. et al. Using web search queries to monitor influenza-like illness. JMIR Public Health and Surveillance, 2020. Disponível em: https://pmc.ncbi.nlm.nih.gov/articles/PMC7268271/. Acesso em: 30 set. 2025.
THE VERGE. Reddit is now blocking major search engines and AI bots—except the ones that pay. 24 jul. 2024. Disponível em: https://www.theverge.com/2024/7/24/24205244/reddit-blocking-search-engine-crawlers-ai-bot-google. Acesso em: 30 set. 2025.
TIKTOK. Research Tools — About; Access and Eligibility; Privacy research posts. 2024–2025. Disponível em: https://developers.tiktok.com/doc/about-research-api/; https://developers.tiktok.com/products/research-api/; https://developers.tiktok.com/blog/privacy-publications-2024. Acesso em: 30 set. 2025.
WHO. Social listening in infodemic management for public health. 2025. Disponível em: https://www.who.int/publications/i/item/9789240108202. Acesso em: 30 set. 2025.
WHO. WHO launches pilot of AI-powered public-access social listening tool (EARS). 2021. Disponível em: https://www.who.int/news-room/feature-stories/detail/who-launches-pilot-of-ai-powered-public-access-social-listening-tool. Acesso em: 30 set. 2025.
X DEVELOPER PLATFORM. X API – Docs; Academic research; v2 Support. 2025. Disponível em: https://developer.x.com/en/docs/x-api; https://developer.x.com/en/use-cases/do-research/academic-research; https://developer.x.com/en/support/x-api/v2. Acesso em: 30 set. 2025.
MASTODON. API – Timelines; Playing with public data. 2025. Disponível em: https://docs.joinmastodon.org/methods/timelines/; https://docs.joinmastodon.org/client/public/. Acesso em: 30 set. 2025.

Comment

Comments are closed.