Lastro.AI

Lastro.AI: Onde a complexidade da política monetária encontra a clareza da IA, transformando relatórios estáticos em conhecimento dinâmico e preciso.

Sobre o Projeto

O Lastro.AI é um agente de Inteligência Artificial especializado projetado para decodificar e democratizar o acesso aos complexos Relatórios de Política Monetária (RPM) e Relatórios de Inflação (RI) do Banco Central do Brasil.

Em um cenário onde a informação econômica é crucial mas frequentemente inacessível devido à linguagem técnica e formato PDF, este projeto atua como uma ponte. Por meio de Processamento de Linguagem Natural (NLP) e Retrieval-Augmented Generation (RAG), o sistema ingere documentos oficiais, cria uma base de conhecimento vetorial e permite que pesquisadores, economistas e estudantes façam perguntas em linguagem natural, obtendo respostas fundamentadas exclusivamente nos dados oficiais.

Principais Funcionalidades

Ingestão Automatizada: Download e processamento automático de relatórios históricos do BACEN.
Busca Semântica Avançada: Utiliza embeddings e re-ranking para encontrar trechos relevantes não apenas por palavras-chave, mas pelo significado da pergunta.
Rastrabilidade: Toda resposta gerada cita a fonte exata (documento e página), eliminando alucinações.
Interface Conversacional: Chatbot interativo disponível via web (Chainlit) ou terminal.

Instalação e Uso

Este projeto utiliza o gerenciador de pacotes uv para garantir reprodutibilidade e velocidade.

Pré-requisitos

Python 3.11+
uv instalado.
Chave de API da Groq (para o LLM).

1. Clonar o Repositório

git clone https://github.com/alexcamargos/lastro.ai.git
cd lastro.ai

2. Configurar o Ambiente

Crie um arquivo .env na raiz do projeto com suas credenciais:

# .env
GROQ_API_KEY="sua_chave_api_aqui"

3. Instalar Dependências

uv sync

4. Construir a Base de Conhecimento

Antes de perguntar, o sistema precisa "ler" os relatórios. O comando abaixo baixa e processa documentos do último ano:

uv run main.py process_batch 1

5. Executar a Aplicação

Inicie a interface web:

uv run main.py web

Ou faça perguntas diretas via terminal:

uv run main.py ask "Qual a projeção de inflação para 2025?"

Exemplo de Resposta Real:

"No Relatório de Inflação 2024/12 (Trecho 4), as projeções foram revisadas indicando uma inflação de 4,5% para 2025... A projeção mais recente reflete uma atualização condicional às trajetórias da taxa Selic e do câmbio." (O sistema cruza fontes diferentes, identifica a data mais recente e justifica a resposta)

Demonstração e Exemplos

1. Terminai (CLI)

A interface de linha de comando é ideal para integrações e perguntas rápidas.

# Pergunta
uv run main.py ask "Por que o COPOM decidiu manter a taxa Selic?"

# Resposta do Agente (Output Real)
"""
O COPOM decidiu manter a taxa Selic em 15,00% a.a. por três razões principais, conforme destacado nos relatórios:

1. **Convergência da inflação à meta**: A manutenção da Selic busca assegurar a convergência da inflação para o redor da meta de 3,00% ao longo do horizonte relevante. O Comitê avalia que uma política monetária contracionista por período prolongado é necessária para consolidar o processo de desinflação e reancorar as expectativas de inflação (Trechos 1, 2 e 4).

2. **Cenário de incertezas e desancoragem de expectativas**: O cenário atual é marcado por expectativas desancoradas, projeções de inflação elevadas, resiliência da atividade econômica e pressões no mercado de trabalho. Esses fatores exigem cautela na condução da política monetária, com manutenção de juros em patamar significativamente contracionista para mitigar riscos (Trechos 1, 2 e 4).

3. **Avaliação dos impactos acumulados**: O Comitê interrompeu temporariamente o ciclo de alta de juros para examinar os efeitos acumulados do ajuste anterior. A manutenção da Selic permite observar se o nível atual é suficiente para garantir a convergência da inflação à meta, mantendo flexibilidade para ajustes futuros (Trechos 1 e 4).

Além disso, o COPOM enfatiza que seguirá vigilante, podendo retomar ajustes na taxa se julgar necessário, mantendo o foco na estabilidade de preços e no equilíbrio entre desinflação e suavização das flutuações da atividade econômica (Trechos 1, 2 e 4).
"""

2. Interface Web (Chainlit)

Para uma experiência visual completa, a interface web oferece histórico de chat, visualização de fontes e thought process (cadeia de pensamento).

Acima: O sistema analisando um relatório de 80 páginas em segundos para responder sobre o 'Hiato do Produto'.

Stack Tecnológico

O projeto foi construído sobre um stack moderno de Python, priorizando performance e tipagem estática.

Linguagem: Python 3.12 (com Type Hints rigorosos).
Orquestração de LLM: LangChain para construção das cadeias de RAG.
Interface Web: Chainlit para uma experiência de chat rápida e reativa.
Banco Vetorial: FAISS (Facebook AI Similarity Search) para busca de alta performance.
CLI: Fire para criação automática de interfaces de linha de comando.
Gerenciamento de Dependências: uv (substituto moderno ao Pip/Poetry).

Decisões Arquiteturais e Técnicas

Como um projeto focado em Data Science e Engenharia de IA, cada componente foi escolhido para resolver um problema específico de escalabilidade ou precisão.

1. Retrieval-Augmented Generation (RAG)

Optou-se por uma arquitetura RAG em vez de fine-tuning.

Por quê? Relatórios do BACEN mudam trimestralmente. RAG permite atualizar o conhecimento do modelo instantaneamente apenas adicionando novos documentos ao índice, sem o custo e tempo de re-treinar o modelo. Além disso, RAG mitiga alucinações ao forçar o modelo a usar o contexto recuperado.

2. Modelo de LLM: Llama 3 / Mixtral (via Groq)

O sistema utiliza a API da Groq para inferência.

Por quê? A Groq oferece a menor latência de inferência do mercado (LPU), essencial para uma experiência de chat fluida. Os modelos Open Source (Llama 3 70B ou Mixtral 8x7B) demonstraram capacidade de raciocínio comparável ao GPT-4 para tarefas de sumarização e extração em português, com custo zero ou muito reduzido.

3. Embeddings e Re-Ranking (Dois Estágios)

A recuperação de informação é feita em duas etapas para maximizar a precisão (Hit Rate).

Estágio 1 (Recall): sentence-transformers/paraphrase-multilingual-MiniLM-L12-v2. Um modelo bi-encoder rápido que busca os 20 documentos topologicamente mais próximos.
Estágio 2 (Precision): cross-encoder/mmarco-mMiniLMv2-L12-H384-v1. Um modelo Cross-Encoder que re-avalia e pontua os documentos recuperados.
Por quê? Busca vetorial simples falha em nuances linguísticas. O Cross-Encoder atua como um "juiz" detalhista, garantindo que o contexto entregue ao LLM seja extremamente relevante, dobrando a precisão do sistema.

Estudo de Caso: Problema, Solução e Aprendizado

Problema

Profissionais que dependem de dados do Banco Central perdem horas lendo PDFs de 80 páginas em busca de parágrafos específicos sobre "metas de inflação" ou "cenário externo". A busca por palavras-chave (Ctrl+F) é falha pois o vocabulário técnico varia ("inflação" vs "IPCA" vs "nível de preços").

Solução

Desenvolvimento de um pipeline de ETL não estruturado que converte PDFs em vetores semânticos. O sistema não busca por palavras, mas por conceitos. Se o usuário pergunta sobre "custo de vida", o sistema recupera trechos sobre "IPCA", mesmo que a palavra "custo" não apareça, graças aos embeddings multilingues.

Aprendizado

Qualidade dos Dados > Modelo: A maior melhoria de performance não veio de trocar o LLM, mas de melhorar o "chunking" (segmentação) dos PDFs e limpar cabeçalhos/rodapés que poluíam a busca.
Avaliação Quantitativa: Implementar métricas como "Hit Rate" foi essencial para sair do "acho que melhorou" para "melhorou 40%". A engenharia de IA exige rigor científico tanto quanto engenharia de software tradicional.

Autor

Feito com ❤️ por Alexsander Lopes Camargos 👋 Entre em contato!

Licença

Este projeto está sob a licença MIT. Veja o arquivo LICENSE para mais detalhes.

Name		Name	Last commit message	Last commit date
Latest commit History 48 Commits
.chainlit		.chainlit
assets		assets
data		data
lastro_ai		lastro_ai
.gitignore		.gitignore
.python-version		.python-version
LICENSE		LICENSE
README.md		README.md
chainlit.md		chainlit.md
main.py		main.py
pyproject.toml		pyproject.toml
uv.lock		uv.lock

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Lastro.AI

Sobre o Projeto

Principais Funcionalidades

Instalação e Uso

Pré-requisitos

1. Clonar o Repositório

2. Configurar o Ambiente

3. Instalar Dependências

4. Construir a Base de Conhecimento

5. Executar a Aplicação

Demonstração e Exemplos

1. Terminai (CLI)

2. Interface Web (Chainlit)

Stack Tecnológico

Decisões Arquiteturais e Técnicas

1. Retrieval-Augmented Generation (RAG)

2. Modelo de LLM: Llama 3 / Mixtral (via Groq)

3. Embeddings e Re-Ranking (Dois Estágios)

Estudo de Caso: Problema, Solução e Aprendizado

Problema

Solução

Aprendizado

Autor

Licença

About

Uh oh!

Releases

Packages

Languages

License

alexcamargos/Lastro.AI

Folders and files

Latest commit

History

Repository files navigation

Lastro.AI

Sobre o Projeto

Principais Funcionalidades

Instalação e Uso

Pré-requisitos

1. Clonar o Repositório

2. Configurar o Ambiente

3. Instalar Dependências

4. Construir a Base de Conhecimento

5. Executar a Aplicação

Demonstração e Exemplos

1. Terminai (CLI)

2. Interface Web (Chainlit)

Stack Tecnológico

Decisões Arquiteturais e Técnicas

1. Retrieval-Augmented Generation (RAG)

2. Modelo de LLM: Llama 3 / Mixtral (via Groq)

3. Embeddings e Re-Ranking (Dois Estágios)

Estudo de Caso: Problema, Solução e Aprendizado

Problema

Solução

Aprendizado

Autor

Licença

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages