Comecei como sysadmin em 2010, quando "DevOps" ainda nem era uma palavra comum no Brasil. Hoje sou Principal Engineer de infra no Nubank, onde ajudo a manter sistemas que processam milhões de transações por dia.
São 14 anos na área, indo de servidores físicos com CentOS até Kubernetes em multi-cloud. E livros foram essenciais nessa jornada - principalmente porque infraestrutura muda MUITO, então você precisa estar sempre aprendendo.
O livro que me fez entender sistemas
The Phoenix Project do Gene Kim. Esse livro mudou minha vida profissional.
Eu tava presa naquela mentalidade antiga de "ops vs dev". Sabe aquela guerra clássica? Desenvolvimento joga código por cima do muro e ops se vira pra fazer funcionar?
Esse livro me fez entender que somos um time só. Ele conta a história de uma empresa em crise através de ficção - parece bobeira mas é MUITO bem feito. Você reconhece situações reais em cada página.
Depois dele, virei evangélica de DevOps. Comecei a estudar CI/CD, automation, infrastructure as code... Foi o ponto de virada.
SRE: a bíblia do Google
Site Reliability Engineering do Google. Obrigatório.
Quando eu li pela primeira vez, foi tipo "caramba, então TEM um jeito científico de fazer isso". O Google codificou tudo que eles fazem em infra/reliability num livro gigante e deram de graça pro mundo.
Error budgets, SLOs, SLIs, toil reduction... conceitos que mudaram como eu trabalho. Hoje no Nubank a gente usa muito desses princípios.
Uma dica: é denso. Não precisa ler tudo de uma vez. Lê os capítulos que fazem sentido pro seu momento.
Kubernetes: do zero ao hero
Kubernetes in Action é o melhor pra aprender K8s de verdade.
Eu tentei aprender Kubernetes várias vezes antes de ler esse livro. Sempre desistia porque parecia muito complexo. Pods, services, ingress, volumes... tudo junto era overwhelming.
Esse livro explica de forma progressiva. Você começa com conceitos simples e vai evoluindo. No final você entende não só COMO usar, mas QUANDO usar cada recurso.
Hoje eu gerencio clusters rodando centenas de aplicações. Esse livro foi a base.
Docker: containerização na prática
Docker Deep Dive do Nigel Poulton. Simples, direto, eficaz.
O Nigel tem um talento pra explicar coisas complexas de forma simples. Ele não fica só na superfície ("docker run isso, docker build aquilo") - ele explica networking, storage, security...
Se você quer passar de "uso Docker pra dev local" pra "rodo Docker em produção com confiança", esse é o livro.
Microservices: aprendendo com erros
Building Microservices do Sam Newman. Essential reading.
Microservices são sexy no papel, mas na prática são complicados. Esse livro é honesto sobre trade-offs.
Ele fala dos benefícios (escalabilidade independente, times autônomos), mas também das dores (complexidade operacional, distributed systems, observability).
Depois de ler, você consegue decidir se microservices fazem sentido pro SEU contexto. Spoiler: nem sempre fazem. E tá tudo bem.
Event-Driven: mudando paradigmas
Building Event-Driven Microservices me abriu a cabeça.
Quando você começa a pensar em eventos ao invés de requisições síncronas, um mundo novo se abre. Kafka, event sourcing, CQRS...
No Nubank a gente usa MUITO eventos. Milhões por segundo. Esse livro me deu a base teórica pra entender o porquê de cada decisão arquitetural.
Atenção: só vai fundo nisso se você realmente precisa de escala. Event-driven adiciona complexidade. Não é silver bullet.
Database Internals: entendendo o coração
Database Internals do Alex Petrov. Mindblowing.
Você sabe como um índice B-tree realmente funciona? Por que LSM-trees são diferentes? Como databases fazem replicação?
Esse livro explica TUDO. É técnico, denso, às vezes difícil. Mas depois de ler você nunca mais olha pra databases da mesma forma.
Tem um capítulo inteiro sobre distributed databases (Cassandra, MongoDB, etc) que é ouro puro.
System Design: preparando pra entrevistas (e pra vida)
System Design Interview - Volume 1 e 2.
"Mas Maria, isso não é só pra entrevistas?" - NÃO. É pra vida.
Esses livros te ensinam a pensar em escala. Como você desenharia o Twitter? E o Uber? E o YouTube?
Mesmo que você não esteja procurando emprego, os exercícios te fazem pensar em trade-offs, CAP theorem, sharding, caching... tudo que você USA NO DIA A DIA.
Meus 3 essenciais
Se você tem budget/tempo limitado, comece com:
- Site Reliability Engineering - fundamentos de reliability
- Kubernetes in Action - K8s é o presente e futuro
- Building Microservices - arquitetura moderna
Esses três te dão uma base sólida pra trabalhar com infra/cloud moderna.
Aprendendo na prática
Fora livros, minha dica de ouro: quebre as coisas.
Sobe um cluster K8s no kind/minikube. Deploy uma app. Mata um pod. Simula um node failure. Estourou o storage? Bom, agora você aprende sobre volumes.
Livros te dão teoria. Quebrar prod (ou staging, please) te dá cicatrizes. Você precisa dos dois.
Infraestrutura como código
Eu não recomendei nenhum livro específico de Terraform/Ansible/etc porque essas ferramentas mudam RÁPIDO. Documentação oficial é melhor.
Mas o conceito de IaC? Esse é atemporal. Leia sobre os princípios, não sobre a ferramenta.
O que estou lendo agora
Fundamentals of Software Architecture do Mark Richards. Sobre padrões arquiteturais que transcendem "micro vs monolith".
E quero reler The Phoenix Project - já passou tempo suficiente e sempre tem coisa nova pra tirar.
A real? Infra é uma área ingrata às vezes. Quando tudo funciona, ninguém lembra de você. Quando cai, TODO MUNDO te culpa.
Mas é uma das áreas mais desafiadoras e recompensadoras de tech. Você precisa entender networking, security, databases, distributed systems, observability... É tipo ser um generalista ultra especializado.
Livros te dão a base teórica. Prod te dá a humildade.
Aprenda ambos. 🚀






