Stack da gringa: as tecnologias que empresas americanas e europeias mais contratam em dados
Descubra quais ferramentas, linguagens e plataformas dominam o mercado internacional de dados e onde focar seus estudos para se tornar competitivo.
Stack da gringa: as tecnologias que empresas americanas e europeias mais contratam em dados
Existe um gap entre a stack que a maioria dos profissionais de dados usa no Brasil e a stack que empresas americanas e europeias exigem. Esse gap não é intransponível, mas ignorar ele é um dos motivos pelos quais profissionais tecnicamente competentes não passam nas triagens de vagas internacionais.
A boa notícia: o mercado internacional de dados converge para um conjunto relativamente previsível de ferramentas. Se você souber onde focar, consegue se tornar competitivo em meses, não anos.
O gap entre a stack brasileira e a stack internacional
No Brasil, o mercado de dados ainda é dominado por algumas combinações clássicas: SQL Server + SSIS + Power BI em empresas mais tradicionais, Python + PostgreSQL + Metabase em startups, e alguma variação de Spark em empresas maiores.
Não há nada de errado com essas ferramentas. O problema é que elas representam uma geração anterior da infraestrutura de dados. O mercado internacional já seguiu em frente.
Segundo o State of Data Engineering Report 2025 do dbt Labs, mais de 78% das empresas americanas com mais de 200 funcionários já migraram ou estão migrando para o que o mercado chama de Modern Data Stack, uma arquitetura cloud-native, modular e baseada em ferramentas especializadas.
Profissionais que dominam apenas ferramentas on-premise ou stacks monolíticas ficam em desvantagem imediata.
Cloud: a base de tudo
Nenhuma conversa sobre stack internacional começa sem cloud. A distribuição entre os três grandes provedores no mercado de dados:
- AWS: lidera em adoção geral. Redshift, Glue, S3, EMR e Athena são os serviços de dados mais usados. Cerca de 45% das vagas internacionais de dados mencionam AWS.
- GCP (Google Cloud): ganhou espaço nos últimos 3 anos, principalmente com BigQuery, Dataflow e Dataproc. Aparece em aproximadamente 30% das vagas, com presença forte em empresas de tecnologia e startups.
- Azure: mais comum em empresas enterprise e no setor financeiro europeu. Synapse Analytics, Data Factory e Azure Databricks são os serviços mais citados. Presente em cerca de 25% das vagas.
No Brasil, muitos profissionais de dados nunca trabalharam diretamente com cloud. Usam ferramentas locais ou acessam serviços cloud configurados por times de infra. No mercado internacional, espera-se que o profissional de dados saiba provisionar, configurar e operar recursos cloud diretamente.
O Modern Data Stack: as ferramentas que dominam
O conceito de Modern Data Stack (MDS) se consolidou como o padrão do mercado internacional. São ferramentas especializadas que se integram entre si, cada uma resolvendo uma parte específica do pipeline de dados.
Snowflake
O Snowflake se tornou o data warehouse mais desejado do mercado internacional. Presente em mais de 40% das vagas de Data Engineer nos EUA (dados do Burtch Works, 2025), ele é valorizado pela arquitetura de separação de compute e storage, facilidade de uso e performance.
Se você trabalha com dados e quer o mercado internacional, Snowflake não é opcional. É essencial.
Databricks
O Databricks ocupa uma posição única: é tanto um lakehouse quanto uma plataforma de data engineering e data science. Com a ascensão do conceito de lakehouse architecture, Databricks aparece em aproximadamente 35% das vagas internacionais de dados.
A plataforma é particularmente comum em empresas que lidam com grandes volumes de dados e precisam de processamento distribuído. Delta Lake, Unity Catalog e Databricks SQL aparecem cada vez mais nos job descriptions.
dbt (data build tool)
O dbt mudou a forma como transformações de dados são feitas. Em vez de ETL tradicional, o dbt segue o conceito de ELT (Extract, Load, Transform), onde as transformações acontecem diretamente no warehouse usando SQL.
Segundo a pesquisa do dbt Labs, mais de 30.000 empresas no mundo já usam dbt. Para vagas de Analytics Engineer, um dos cargos que mais crescem internacionalmente, dbt é praticamente obrigatório.
Apache Airflow
O Airflow continua sendo o orquestrador de pipelines mais popular do mercado. Alternativas como Dagster e Prefect estão crescendo, mas o Airflow ainda aparece em mais de 50% das vagas de Data Engineer que mencionam orquestração.
Saber escrever DAGs, configurar tasks, lidar com retries e monitorar pipelines no Airflow é uma skill que recrutadores internacionais esperam de qualquer Data Engineer mid-level ou acima.
Apache Spark
Para processamento de dados em larga escala, Spark continua imbatível. Seja via Databricks, EMR ou Dataproc, a capacidade de processar terabytes de dados com PySpark é um diferencial competitivo real.
O mercado internacional espera proficiência em PySpark, não apenas em Spark com Scala. A consolidação de Python como linguagem dominante em data engineering fez do PySpark a interface padrão.
Stack por role: o que cada cargo exige
As exigências de stack variam bastante entre os diferentes cargos de dados. Saber essas diferenças ajuda a focar seus estudos.
Data Engineer
O cargo mais demandado internacionalmente para brasileiros. A stack típica:
- Linguagens: Python (PySpark), SQL, bash
- Orquestração: Airflow, Dagster
- Processamento: Spark, Flink (menos comum mas crescendo)
- Warehouse/Lakehouse: Snowflake, Databricks, BigQuery, Redshift
- Transformação: dbt
- Infra: Docker, Kubernetes, Terraform (básico)
- Cloud: AWS ou GCP (pelo menos um, idealmente dois)
Analytics Engineer
Um cargo que quase não existe no Brasil, mas é um dos que mais crescem lá fora:
- Linguagens: SQL (avançado), Python (intermediário)
- Transformação: dbt (obrigatório)
- Warehouse: Snowflake ou BigQuery
- BI: Looker, Mode, Lightdash
- Versionamento: Git (com PR reviews e CI/CD para dbt)
Data Scientist
Para cientistas de dados, a stack internacional tende a ser mais diversa, mas alguns padrões aparecem com frequência:
- Linguagens: Python (scikit-learn, pandas, PyTorch/TensorFlow), R (menos comum que antes)
- Plataformas: Databricks, SageMaker, Vertex AI
- Experimentação: MLflow, Weights & Biases
- Deploy: Docker, APIs com FastAPI/Flask
- Feature stores: Feast, Tecton
O que os job descriptions realmente pedem
Analisar job descriptions reais é mais útil do que qualquer pesquisa de mercado. Nos últimos 12 meses, eu analisei centenas de vagas internacionais de dados. Alguns padrões:
"Experience with cloud-native data platforms" aparece em 9 de cada 10 vagas. Não basta saber SQL. Você precisa saber SQL dentro de um Snowflake, BigQuery ou Redshift.
"Infrastructure as Code" aparece em cerca de 40% das vagas de Data Engineer senior. Terraform é a ferramenta dominante, seguida de Pulumi.
"CI/CD for data pipelines" está se tornando padrão. Saber configurar GitHub Actions ou GitLab CI para testar e deployar pipelines não é mais diferencial, é expectativa.
"Data modeling" continua sendo cobrado com força. Kimball, Data Vault e modelos activity schema aparecem com frequência. O mercado internacional valoriza modelagem muito mais do que o brasileiro.
Certificações: quais valem a pena?
O mercado internacional de dados não é tão orientado a certificações quanto o de infraestrutura/DevOps. Mas algumas tem valor real:
- AWS Certified Data Engineer - Associate: a mais reconhecida para quem trabalha com AWS
- Databricks Certified Data Engineer Associate/Professional: relevante dado o crescimento do Databricks
- Google Cloud Professional Data Engineer: boa para quem foca em GCP
- dbt Analytics Engineering Certification: valorizada para roles de Analytics Engineer
- Snowflake SnowPro Core: boa porta de entrada para mostrar conhecimento em Snowflake
O que não vale tanto a pena: certificações de ferramentas on-premise, certificações de BI (a maioria dos recrutadores internacionais não liga tanto), e certificações genéricas de "big data" que não mostram proficiência prática.
Onde focar: uma abordagem prática
Com tantas ferramentas, a pergunta natural é: por onde começar?
A resposta depende do seu perfil atual, do cargo que você quer e do seu timeline. Mas alguns princípios se aplicam:
- Cloud first: se você não trabalha com cloud ainda, esse é o investimento de maior retorno. Escolha AWS ou GCP e vá fundo.
- SQL avançado: o mercado internacional exige SQL em um nível que a maioria dos profissionais brasileiros subestima. Window functions, CTEs recursivas, query optimization. Tudo isso é cobrado em entrevistas.
- Uma ferramenta de cada camada: um warehouse (Snowflake ou BigQuery), um orquestrador (Airflow), uma ferramenta de transformação (dbt). Isso te cobre para a maioria das vagas.
- Python para dados: não precisa ser um software engineer, mas precisa saber PySpark, pandas e scripting de automação.
A armadilha é tentar aprender tudo ao mesmo tempo. Melhor ter profundidade nas ferramentas certas, na ordem certa.
Na Dados na Gringa, ajudamos profissionais de dados brasileiros a identificar quais gaps de stack precisam fechar para se tornarem competitivos internacionalmente. Não existe fórmula genérica. O plano de estudo precisa ser personalizado para o seu perfil, o cargo que você busca e o mercado que você quer atingir.
Quer acelerar sua transição para a gringa?
Faça o diagnóstico gratuito e descubra seu nível de prontidão para o mercado internacional de dados.
Fazer diagnóstico gratuito