Partager cette offre d’emploi
Postuler »

Alternant Data Engineer H/F

Description de l'entreprise

Sogeti Application Testing & Sécurité

Sogeti France (filiale du groupe Capgemini) est une entreprise de services du numérique.

Nous accompagnons la transformation des entreprises dans 4 domaines : Digital, Testing, Sécurité et Infrastructure.

Aujourd’hui notre entreprise figure parmi les 15 meilleurs employeurs du secteur high-tech en France.

Description de la mission

Intégré(e) au sein d’une équipe projet pour l’un de nos clients grands comptes du secteur tertiaire (banques, transports, secteur public, assurances, télécommunications etc.), vous intervenez sur plusieurs phases du projet : la conception, le développement et la qualification.

Au sein d’une équipe, votre mission portera sur plusieurs facettes/stacks de compétences :

  • Usage des langages suivants : Java, Python, Scala
  • Développement sur une des distributions Big Data majeures du marché : HortonWorks (HDP/HDF), MAPR, Cloudera.
  • Conception de pipeline d’ingestion de données sur des frameworks de calcul distribués (Spark, Akka, Flink, etc.) temps réel (Kafka, Storm, Spark Streaming).
  • Choix de la persistence des données à adopter selon les use cases à traiter (HDFS, Hive, Hbase, MongoDB, Cassandra, ElasticSearch, Neo4j etc.).
  • Appréhension d’un environnement BI type datawarehouse d’entreprise (modélisation relationnelle, stockage RDBMS, SQL Fluent)
  • Consommation des données véhiculées et transformées dans ce type d’architecture avec des outils éditeurs (Tableau, Qlik, Spotfire, Dataiku) ou des outils Opensource (Kibana, D3 JS, Zeppelin, Graffana, Rshiny, Jupyter)
  • Intervention sur des environnements containérisés (Docker, Kubernetes, Mesos, etc.)

Usage de stacks d'outils d'aide au développement collaboratif et à l'intégration continue (JIRA, Bitbucket, Confluence, Bamboo, Github, GitLab, Jenkins, Ansible, etc.)

Profil

Vous êtes passionné par les données et la technologie, diplômé d'une grande école d'ingénieur, spécialisé en informatique. Vous connaissez et utilisez les technologies de référence en terme de :

Programmation :

Connaissances impératives en programmation objet (Java, Scala, Python, Ruby, C++ ou autre) et en structures de données

Notions de parallélisation

Bases de données :

Solides connaissances en bases de données relationnelles et langage de requêtes SQL Architecture d’un SGBD

Connaissance NoSQL, « Cassandra »

Environnement Big Data / Distribué :

Spark, Hortonworks, Cloudera, Kafka, Docker, WorkingExperience on cloud, AWS, Google Cloud, Microsoft Azure…

Algorithmique et structures de données

Analyse d’algorithmes : estimation et optimisation de complexité en temps et espace, notation asymptotique, structures de données

Méthodes de conception et d’optimisation d’algorithmes : récursivité, diviser pour régner, force brute…

Ref:  554241
Posté le:  29 nov. 2021
Niveau d'expérience:  Jeune diplômé
Type de contrat:  Alternance
Région: 

Toulouse, N, FR

Département:  Data

Postuler »