Skip to content
← Back to job listings

[JOB 29729] Engenheiro de Dados Senior (Databricks, PySpark e MongoDB)

CI&T · Brazil

Senior LevelQuick applyFull-time1 day ago

About The Role

Na CI&T , ajudamos grandes empresas a transformar o potencial da AI em impacto real nos negócios com AI Deployment, execução AI-native e tech-integrated business solutions.

Com 30 anos de experiência em transformação tecnológica, aceleramos inovação com expertise em agentic SDLC, application modernization, Data & AI, martech e business strategy.

Somos 8.000 CI&Ters em mais de 25 países, colaborando para construir soluções com impacto real. AI já faz parte da forma como trabalhamos, evoluímos e inovamos todos os dias.

Importante: se você reside na Região Metropolitana de Campinas, sua presença nos escritórios da cidade será obrigatória, conforme a política de frequencia vigente.

Estamos em busca de uma pessoa para atuar como Engenheiro(a) de Dados Sênior em um projeto focado em integração, processamento, modelagem e otimização de dados, com forte utilização de Databricks, PySpark e MongoDB.

O profissional deverá ter perfil hands-on, autonomia técnica, visão crítica e foco em produtividade, qualidade, performance e melhoria contínua. Atuará em squads ágeis, colaborando com equipes técnicas e de negócio para definição, refinamento, desenvolvimento e sustentação de soluções de dados escaláveis.

As principais tecnologias e competências envolvidas são

  • Databricks com PySpark
  • Spark e Python
  • MongoDB
  • Modelagem e manipulação de dados estruturados e semiestruturados
  • Construção e otimização de pipelines de dados
  • Integração entre fontes relacionais, não relacionais e ambientes analíticos
  • Boas práticas de engenharia, versionamento e qualidade de dados
  • Experiência com metodologias ágeis
  • Diferencial em uso de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado

O profissional deve possuir sólidos conhecimentos em engenharia de dados, lógica de programação, desenvolvimento de pipelines escaláveis, otimização de performance e boas práticas de desenvolvimento, além de colaborar com áreas de negócio e tecnologia para definição, revisão e implementação de regras e soluções de dados.

Responsabilidades

  • Desenvolver, otimizar e manter pipelines de dados utilizando Databricks, Spark e PySpark.
  • Atuar na integração, extração, transformação e carga de dados provenientes de bases MongoDB.
  • Trabalhar com dados estruturados, semiestruturados e documentos JSON, garantindo organização, qualidade e consistência das informações.
  • Desenvolver processos de ingestão, transformação e disponibilização de dados para consumo analítico e operacional.
  • Construir produtos de dados escaláveis, com foco em performance, confiabilidade e qualidade.
  • Garantir boas práticas de desenvolvimento, assegurando que as soluções de dados sigam padrões de qualidade, eficiência, escalabilidade e manutenibilidade.
  • Aplicar boas práticas de versionamento, testes, revisão de código e qualidade de dados.
  • Apoiar refinamentos técnicos e funcionais, garantindo clareza, viabilidade e aderência das histórias às necessidades do projeto.
  • Apoiar na construção de histórias de usuário bem definidas, facilitando o desenvolvimento pelos times de engenharia de dados.
  • Participar do desenho AS-IS e TO-BE, documentando processos atuais e futuros, identificando débitos técnicos, riscos e oportunidades de melhoria.
  • Desenvolver histórias refinadas e aprovadas, garantindo qualidade, eficiência e aderência aos padrões técnicos.
  • Colaborar com focais de dados, negócio e tecnologia para garantir que as soluções estejam alinhadas às necessidades do negócio e às melhores práticas de engenharia.
  • Propor melhorias contínuas nos processos, arquitetura, performance e produtividade do time.
  • Utilizar, quando aplicável, ferramentas de IA no desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado, visando ganho de produtividade e qualidade.

Qualificações Necessárias

Conhecimentos Técnicos

  • Forte experiência com Databricks e PySpark.
  • Sólido conhecimento em Spark, Python e lógica de programação.
  • Experiência com MongoDB, incluindo consultas, modelagem de documentos e manipulação de dados em formato JSON.
  • Experiência na construção de pipelines de dados escaláveis e performáticos.
  • Conhecimento em integração de dados entre MongoDB e ambientes analíticos.
  • Capacidade de trabalhar com dados estruturados, semiestruturados e não relacionais.
  • Domínio de boas práticas de engenharia de dados, versionamento, testes, revisão de código e qualidade de dados.
  • Experiência em otimização de performance de pipelines e processamento distribuído.
  • Experiência em squads ágeis e metodologias ágeis.
  • Capacidade de atuar na identificação de débitos técnicos, melhoria de processos e evolução de soluções existentes.
  • Diferencial: experiência com uso de IA aplicada ao desenvolvimento, como GitHub Copilot, prompt engineering e code review automatizado.

Qualidades Comportamentais

  • Proatividade para aumentar a capacidade de entrega do time.
  • Perfil hands-on, com autonomia para conduzir atividades técnicas.
  • Capacidade analítica para interpretar bases de dados, regras de negócio e propor soluções.
  • Habilidade de resolução de problemas, identificando causas, riscos e alternativas.
  • Perfil consultivo, trazendo ideias, soluções e melhorias para o projeto, sem aguardar apenas direcionamentos.
  • Visão 360º, entendendo o projeto como um todo e avaliando impactos técnicos e de negócio das soluções propostas.
  • Comunicação assertiva, com clareza, confiança e respeito.
  • Visão crítica, foco em produtividade e melhoria contínua.
  • Capacidade de colaboração com times técnicos, áreas de negócio e stakeholders.

This listing was posted by a verified recruiter at CI&T. Report this listing