Documento público

Metodologia

Esta página descreve, de forma transparente, como o Lupa no Governo produz suas análises — incluindo o uso de modelos de linguagem em etapas específicas do processo editorial.

Coleta de matérias

A cada três horas, o portal lê os feeds RSS dos principais veículos brasileiros que cobrem política federal. Para cada item novo, baixamos a matéria completa e extraímos seu texto principal, registrando título, fonte, URL, data de publicação e conteúdo bruto em nossa base.

Veículos monitorados

Adotamos uma classificação editorial declarada de cada veículo apenas para garantir pluralidade nas análises — não como julgamento de qualidade jornalística. Análises só são publicadas quando há ao menos duas fontes de veículos distintos, idealmente com linhas editoriais diferentes.

G1 (Globo)Centro
Folha de S.PauloCentro-esquerda
Poder360Centro
Carta CapitalEsquerda
Gazeta do PovoDireita
O GloboCentro-direita
UOL NotíciasCentro-esquerda

Classificação editorial

Cada matéria é submetida a um modelo de linguagem (Claude Sonnet, da Anthropic) que avalia se ela descreve uma ação concreta do Poder Executivo Federal — decreto, lei sancionada, portaria, programa lançado, política implementada — distinguindo-a de declarações, polêmicas, atos do Legislativo ou Judiciário. O modelo também propõe título, resumo neutro, área, órgão responsável, data e atribui um nível de confiança ao julgamento. Itens com baixa confiança são descartados antes de prosseguir.

Agrupamento de matérias

Matérias sobre o mesmo evento são agrupadas em uma única ação de governo. O agrupamento usa similaridade textual entre títulos e resumos extraídos, dentro de uma janela de 14 dias. Quando uma ação acumula matérias de pelo menos dois veículos diferentes, ela avança para a etapa de análise.

Análise multi-eixo

Um segundo modelo lê o texto integral das matérias agrupadas e produz uma análise por eixo de impacto (econômico, social, ambiental, fiscal, institucional). Para cada eixo relevante são extraídos:

Pontos apontados como benefício, sempre atribuídos à fonte;
Pontos apontados como prejuízo, sempre atribuídos à fonte;
Uma nota de −3 a +3 indicando o saldo das avaliações;
Um nível de confiança de 1 a 5;
A lista de fontes que sustentam o eixo.

O modelo recebe instruções estritas de não usar conhecimento próprio além das fontes fornecidas e de sempre apresentar visões divergentes proporcionalmente ao que aparece na cobertura. Em controvérsias, ambas as posições são incluídas.

Indicador visual

O saldo geral de uma ação é a média das notas dos eixos analisados, exibido em uma barra de −3 a +3. A escala é deliberadamente discreta: ela orienta a leitura, mas não substitui o conteúdo da análise nem o acesso direto às fontes citadas.

Limitações conhecidas

A classificação de linha editorial dos veículos é uma heurística simplificada e não capta variações entre seções, colunistas ou momentos.
Modelos de linguagem podem extrair argumentos imprecisos, descontextualizados ou perder nuances. A análise depende do que as fontes efetivamente publicaram.
Ações com cobertura assimétrica (apenas um lado do espectro) podem gerar saldos enviesados.
Ações sem cobertura jornalística suficiente não são publicadas.
O portal não substitui a leitura dos atos oficiais no Diário Oficial da União.

Independência editorial

O portal não recebe financiamento do governo federal, de partidos ou de candidatos. As decisões de quais matérias monitorar são determinadas pela seleção de veículos listada acima e pelo classificador descrito na seção 03 — não por escolha humana caso a caso, o que reduz risco de viés de seleção.

Vozes editoriais

Para que análises sobre temas distintos não soem todas iguais, cada texto recebe uma camada final de reescrita assinada por uma de cinco vozes editoriais — economia, política, jurídica, social e editorial geral. A escolha da voz considera a área da ação, com algum elemento aleatório.

Cada voz tem um perfil de redação distinto: léxico característico, ritmo de frase, preferência por certos tipos de fonte. A função é estilística — o conteúdo factual da análise (benefícios apontados, prejuízos apontados, notas, atribuições às fontes) é o mesmo independentemente da voz sorteada.

Importante: as vozes editoriais não correspondem a pessoas físicas. São perfis de redação configurados internamente e aplicados por modelos de linguagem. A escolha pelo formato de voz editorial (em vez de "análise da redação" sem assinatura) busca tornar explícita a variação de estilo entre análises e permitir ao leitor identificar o registro de cada texto.

Carregando…

Reportar erros

Encontrou imprecisão, viés ou omissão? Use o formulário abaixo. Cada sinalização é revisada manualmente.

Última revisão da metodologia: maio de 2026. Sobre o projeto.