Sou um Engenheiro de Infraestrutura e Observabilidade especializado em transformar operações de TI através da integração de Inteligência Artificial, Automação e Observabilidade em larga escalal. Atuo na GPS IT, onde tomo iniciativas técnicas que conectam o melhor da engenharia de software moderna com a gestão de infraestrutura crítica.
Minha missão é construir stacks de sistemas inteligentes, resilientes, seguros e auto-gerenciáveis que elevam a experiência operacional e reduzem drasticamente o tempo de resposta a incidentes. Acredito na convergência entre AIOps, DevOps e SecOps como o futuro da engenharia de confiabilidade e que já somos totalmente ineficientes como simples analistas, ainda lutando para não acreditar que esse trabalho se tornará inútil em curto prazo.
- LLM Integration: Desenvolvimento de sistemas autônomos com modelos de linguagem para triagem e resolução de incidentes
- AI-Assistant: Criador da IRIS, sistema em desnvolvimento para atendimento inteligente que integra agentes IA autônomos, automação e observabilidade
- Predictive Analytics: Implementação de análises preditivas para antecipar falhas antes que impactem usuários
- Vector Databases: Aplicação de similarity search e RAG (Retrieval-Augmented Generation) para knowledge bases inteligentes
- Stack Moderna: Prometheus, Signoz, Loki, Grafana, OpenTelemetry, Vector (VRL), TimescaleDB, ClickHouse
- Log Management: Processamento e análise de logs em escala com pipelines otimizados
- Metrics & Tracing: Instrumentação completa de aplicações e infraestrutura com correlação de eventos
- Real-time Analytics: Dashboards interativos e alertas contextuais para decisões data-driven
- Containerização: Orquestração avançada com Docker/K8s e design de arquiteturas cloud-native
- CI/CD Pipelines: Automação de deploy com integração contínua e entrega contínua
- Event-Driven Architecture: Implementação de sistemas reativos com Apache Kafka e message streaming
- GitOps: Versionamento e gerenciamento declarativo de infraestrutura
- Monitoring Proativo: Detecção de anomalias e ameaças em tempo real
- Compliance Automation: Implementação de controles de segurança automatizados
- Incident Response: Workflows automatizados para resposta rápida a incidentes de segurança
- API Security: Integração segura de serviços com autenticação robusta e rate limiting
Sistema inteligente de gestão de incidentes que revoluciona operações através de:
- Integração Plataformas para desenvlvimento de Agentes IA autônomo + Automação Low-Code N8N + Stack de Obervabilidade para processamento autônomo de alertas
- Pipeline completo: Observabilidade → IRIS → ITSM com criação automática de tickets
- Notificações multi-canal, Telegram, React e Email com templates HTML responsivos
- Memory system com Redis, Vector Database, RAG para contexto conversacional
- Redução de 65% no MTTR (Mean Time To Resolution)
Portal de documentação técnica moderna construído com:
- React + TypeScript com componentes reutilizáveis
- Design system consistente e acessível
- Deploy automatizado agnóstico a plataformas
- Documentação viva e colaborativa em breve
Arquitetura completa de NOC com:
- Event-driven workflows com Kafka para processamento em tempo real
- Stack de observability: Prometheus + Loki + Vector + OpenTelemetry
- Análise de custos: economia projetada de $462,200 USD/ano vs. soluções proprietárias
- Integração nativa de LLMs para automação inteligente
Implementação de stack de última geração:
- Vector com VRL para processamento e roteamento de logs
- ClickHouse para analytics de alta performance
- TimescaleDB otimizado para séries temporais
- Dashboards interativos com correlação de métricas, logs e traces
Constantemente explorando a fronteira entre IA e operações de TI:
- Machine Learning para Ops: Modelos preditivos para detecção de anomalias e forecasting
- LLM Operations: Fine-tuning e deployment de modelos de linguagem para contextos operacionais
- Agentic AI: Desenvolvimento de agentes autônomos para runbooks e auto-remediation
- GPU Infrastructure: Avaliando NVIDIA RTX 5090 para inferência de LLMs corporativos
- Vector Stores: Implementação de bases vetoriais para semantic search em documentação técnica
Aprofundando práticas modernas de engenharia:
- Platform Engineering: Construção de IDPs (Internal Developer Platforms)
- GitOps Avançado: Fluxo declarativo com ArgoCD e Flux
- Chaos Engineering: Implementação de resiliência através de testes de falha controlados
- FinOps: Otimização de custos em ambientes cloud e on-premise
- Infrastructure as Code: Ansible e automação completa de provisionamento
Integrando segurança em todos os níveis:
- SIEM Integration: Correlação de eventos de segurança com observability stacks
- Zero Trust Architecture: Implementação de princípios zero-trust em microserviços
- DevSecOps: Security-as-code e shift-left security
- Threat Intelligence: Integração de feeds de ameaças com sistemas de alertas
- Compliance Automation: CIS Benchmarks, LGPD e frameworks de compliance
Mantendo-me na vanguarda da inovação:
- WebAssembly (WASM): Explorando performance no edge computing
- Service Mesh: Istio e Linkerd para microservices observability
- eBPF: Monitoring de kernel para visibilidade profunda de sistemas
- Cloud-Native AI: Kubernetes operators para ML workloads
- Blockchain & DeFi: Aplicações práticas de tecnologias descentralizadas
Estou sempre aberto a discussões sobre arquitetura de sistemas, observabilidade, automação inteligente e como a IA está transformando as operações de TI.
- 📧 Email: [email protected]
- 🌐 Website: iris.gpsitservicos.com.br
- 📍 Localização:
"A verdadeira inovação em operações de TI não está apenas em adotar novas tecnologias, mas em criar sistemas que aprendem, se adaptam e evoluem continuamente - onde a inteligência artificial não substitui o humano, mas amplifica sua capacidade de tomar decisões estratégicas."
⭐️ Se você acredita no poder da automação inteligente e observabilidade de classe mundial, vamos construir juntos!