TL;DR (Resumo Rápido)

  • O que faz: Cria fluxos de trabalho inteligentes onde agentes de IA tomam decisões e executam ações reais (ler e-mails, salvar dados) localmente e de graça.
  • Principal Vantagem: Custo zero de API e privacidade absoluta (LGPD), já que todos os dados e modelos de IA rodam offline na sua própria máquina.
  • Acesso Direto: Instale o Ollama Local e o n8n no Docker seguindo os comandos práticos abaixo.

A era dos simples chatbots que apenas respondem perguntas está chegando ao fim. Em 2026, a grande tendência que está dominando as buscas é a IA Agêntica (ou Agentes de IA Autônomos). Diferente de um assistente passivo, um agente autônomo é capaz de planejar etapas, interagir com ferramentas externas (como bancos de dados e APIs), tomar decisões lógicas e executar fluxos de trabalho completos sem a necessidade de intervenção humana constante.

No entanto, criar esses agentes usando APIs pagas na nuvem (como OpenAI ou Anthropic) pode se tornar extremamente caro e expõe dados corporativos ou pessoais sensíveis a servidores de terceiros.

A solução definitiva e 100% gratuita para esse problema é a combinação do n8n (plataforma visual de automação) com o Ollama (servidor de modelos de linguagem local). Neste guia passo a passo, você aprenderá a configurar esse ecossistema do absoluto zero.


O que é a Stack n8n + Ollama?

Essa arquitetura se consolidou como o padrão ouro para desenvolvedores e empresas que buscam autonomia tecnológica. Ela é composta por duas ferramentas principais:

  • n8n: Uma ferramenta de automação avançada baseada em fluxos de trabalho visuais. A versão mais recente do n8n traz nós nativos de IA (Advanced AI) baseados no ecossistema LangChain. Isso permite construir agentes com memória persistente, encadeamento de raciocínio e ferramentas de ação de forma simples.
  • Ollama: Um servidor leve e otimizado que roda modelos de linguagem de código aberto (como Llama 3, Mistral, Qwen e Gemma) diretamente no processador ou na placa de vídeo (GPU) do seu computador. Ele gerencia os modelos e expõe uma API simples que responde em localhost.

Passo 1: Instalando e Configurando o Ollama Localmente

O Ollama simplifica o processo de rodar grandes modelos de linguagem (LLMs) localmente. Ele suporta aceleração por GPU de forma automática no Windows, macOS e Linux.

  1. Acesse o site oficial do Ollama e faça o download para o seu sistema operacional.
  2. Após a instalação, abra o terminal do seu sistema (Prompt de Comando ou PowerShell no Windows) e execute o comando abaixo para baixar e rodar o modelo Llama 3:
ollama run llama3
  1. O Ollama fará o download do modelo (aproximadamente 4.7 GB para a versão de 8 bilhões de parâmetros) e iniciará um chat interativo no próprio terminal.
  2. O servidor do Ollama ficará rodando em segundo plano no endereço http://localhost:11434. Você pode fechar o terminal do chat, mas mantenha o ícone do Ollama active na barra de tarefas.

Passo 2: Subindo o n8n via Docker

A maneira mais estável e rápida de rodar o n8n localmente com suporte completo a integrações locais é utilizando o Docker.

  1. Certifique-se de que o Docker Desktop está instalado e rodando em sua máquina.
  2. Abra o terminal e execute o seguinte comando para iniciar o contêiner do n8n:
docker run -it --rm --name n8n -p 5678:5678 -e N8N_ENFORCE_SETTINGS_FILE_PERMISSIONS=true n8nio/n8n

📝 Nota: Se você estiver utilizando o Docker no Windows/macOS e quiser que o contêiner do n8n se conecte ao Ollama que roda no host (sua máquina física), use o endereço http://host.docker.internal:11434 em vez de localhost nas configurações.

  1. Acesse http://localhost:5678 no seu navegador para abrir a interface do n8n, crie sua conta de administrador local e você estará pronto para criar seu primeiro fluxo.

Passo 3: Construindo o Agente Autônomo no n8n

Para demonstrar a força da IA Agêntica, vamos estruturar um agente que recebe instruções, decide quais ferramentas usar para resolver uma tarefa e entrega o resultado final.

Interface de fluxo do n8n com nó de agente de inteligência artificial conectado ao Ollama

1. Crie um Novo Workflow

No n8n, clique em Add Workflow. Adicione o nó principal chamado AI Agent. Esse nó centraliza o raciocínio do agente.

2. Conecte o Modelo de Linguagem (Ollama)

No campo correspondente ao modelo de chat no nó AI Agent, adicione o nó Ollama Chat Model.

  • Base URL: Insira http://host.docker.internal:11434 (se estiver no Docker) ou http://localhost:11434.
  • Model: Digite exatamente llama3 (ou outro modelo que você tenha baixado no Ollama).

3. Adicione Ferramentas (Tools) ao Agente

Agentes autônomos só conseguem interagir com o mundo real através de ferramentas. No nó do AI Agent, conecte ferramentas na seção Tools:

  • Calculator: Para permitir que a IA execute operações matemáticas complexas sem errar.
  • Wikipedia or Google Search Tool: Para permitir que a IA busque fatos recentes na internet caso o modelo local não saiba.
  • Custom HTTP Request Node: Para fazer chamadas de API personalizadas, como ler e-mails ou enviar mensagens.

4. Configure a Memória do Agente

Conecte o nó Window Buffer Memory na entrada de memória do agente. Isso garante que ele se lembre do contexto da conversa e das etapas anteriores que executou.


Exemplo de Fluxo: Triagem Automática de E-mails e Atualização de Faturas

Imagine o seguinte cenário automatizado rodando na sua máquina:

  1. Gatilho (Trigger): O n8n monitora sua caixa de entrada de e-mails a cada 5 minutos.
  2. Raciocínio (AI Agent): O e-mail recebido é enviado para o Llama 3 local via Ollama. O agente analisa o conteúdo e decide:
    • Se for uma cobrança: Ele usa uma ferramenta HTTP para extrair os dados da fatura e salvar em uma planilha local.
    • Se for uma dúvida de cliente: Ele rascunha uma resposta com base nas diretrizes da empresa salvas em um documento de texto local.
  3. Ação: O n8n envia a resposta para aprovação ou atualiza a planilha automaticamente.

💡 Dica: Se as faturas ou relatórios da sua empresa forem recebidos em arquivos PDF bagunçados ou fragmentados, você pode organizá-los e mesclá-los localmente antes do processamento usando o PDF Forge. Para garantir a segurança dos dados gerados nas planilhas, use o KeyForge para criar chaves de criptografia e senhas de acesso locais.


Comparativo: IA Local vs. APIs Pagas na Nuvem

CritérioAPIs Proprietárias (OpenAI / Claude)Stack Local (n8n + Ollama)
Custo por 1M de TokensDe US$ 5.00 a US$ 15.00R$ 0,00 (apenas energia do PC)
Privacidade dos DadosDados enviados para servidores externosAbsoluta (dados não saem da máquina)
Dependência de Internet100% dependente de conexão estávelRoda offline ou em rede local isolada
VelocidadeRápida (servidores de alta performance)Depende da GPU/Processador local

Conclusão: Domine a Automação Inteligente

Configurar agentes autônomos locais com n8n e Ollama permite que qualquer profissional ou empresa crie soluções de produtividade robustas sem ficar refém das assinaturas e mudanças repentinas de preços das Big Techs. Você ganha total controle sobre a segurança dos dados, conformidade com a LGPD e escala suas automações sem se preocupar com a conta de tokens no fim do mês.

Se você deseja se aprofundar na lógica de negócios automatizados por IA, entender como mapear processos operacionais e implementar automações práticas no seu dia a dia sem complicações, comece a ler o nosso e-book prático e interativo IA Prática 1.0.