Sobre o Projeto
Objetivo
O Arquivo da Violência tem como objetivo mapear todas as mortes violentas do Brasil em tempo real. O projeto começou pelo Rio de Janeiro, estado com altos índices de violência urbana, e pretende expandir para todo o território nacional.
Nosso propósito é criar um banco de dados aberto e acessível que documente cada vida perdida, contribuindo para a transparência, memória e formulação de políticas públicas de segurança.
Metodologia
O sistema utiliza uma abordagem automatizada de coleta e processamento de dados:
Coleta de Fontes
Monitoramos feeds RSS de portais de notícias locais e nacionais, buscando artigos que contenham palavras-chave relacionadas a mortes violentas (homicídio, assassinato, tiroteio, etc.).
Ingestão de Conteúdo
Os artigos identificados são baixados e armazenados em nosso banco de dados, incluindo URL, título, conteúdo completo e data de publicação.
Extração com IA
Utilizamos modelos de linguagem (LLM) para extrair informações estruturadas de cada artigo: nome da vítima, local, data do incidente e um resumo do ocorrido.
Deduplicação
Múltiplas fontes podem reportar o mesmo incidente. Nosso sistema utiliza algoritmos de correspondência fuzzy para identificar e agrupar notícias sobre o mesmo evento.
Consolidação
As extrações são consolidadas em incidentes únicos, cada um representando uma morte com todas as suas fontes e informações associadas.
Limitações
Este projeto está em desenvolvimento. As principais limitações atuais incluem:
- Cobertura limitada ao Rio de Janeiro
- Dependência de notícias publicadas (casos não noticiados não são capturados)
- Possíveis erros na extração automática de informações
- Atraso entre o evento e a publicação da notícia
Contribua
Este é um projeto de código aberto. Se você deseja contribuir com código, dados ou ideias, entre em contato ou acesse nosso repositório no GitHub.