Remote
وصف الوظيفة
Rejoignez tether, une scale‑up innovante spécialisée dans les technologies d’intelligence artificielle de prochaine génération. En tant que **AI Research Engineer – Pre‑training**, vous intégrerez l’équipe « Modèles IA », un groupe d’experts passionnés par la conception, l’optimisation et le déploiement de modèles de langage à grande échelle. Vous travaillerez à distance depuis n’importe où, tout en collaborant étroitement avec nos bureaux de Dublin et nos partenaires technologiques mondiaux.
### Vos missions principales
- **Conception d’architectures novatrices** : imaginer, prototyper et implémenter des modèles LLM (Large Language Models) et multimodaux (texte, image, audio) adaptés à des tailles variées, du petit modèle de recherche aux modèles de plusieurs dizaines de milliards de paramètres.
- **Optimisation du pré‑entraînement** : développer des pipelines d’entraînement ultra‑efficaces, réduire le temps de convergence et le coût énergétique grâce à des techniques d’**mixed‑precision**, de **gradient checkpointing**, de **pipeline parallelism** et d’**ZeRO‑optimisation**.
- **Curation et gestion de données** : sélectionner, nettoyer et enrichir des jeux de données massifs (terabytes) en veillant à la diversité, la qualité et la conformité éthique. Mettre en place des processus d’**augmentation de données** et de **filtrage automatisé**.
- **Détection et résolution de goulets d’étranglement** : analyser les performances des clusters GPU NVIDIA (A100, H100), identifier les limites de bande passante, de mémoire et de communication inter‑node, puis proposer des améliorations matérielles ou logicielles.
- **Déploiement sur infrastructure distribuée** : orchestrer des entraînements sur des fermes de milliers de GPU via des frameworks tels que **DeepSpeed**, **Megatron‑LM** ou **Horovod**, en assurant la scalabilité et la résilience du système.
- **Collaboration inter‑disciplinaire** : travailler main‑dans‑la‑main avec les équipes data‑science, produit, recherche fondamentale et ingénierie MLOps pour transformer les prototypes en solutions commercialisables.
### Profil recherché
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience démontrée sur la recherche et le développement de modèles LLM ou multimodaux.
- Maîtrise avancée de **Python**, **PyTorch**/**TensorFlow**, **CUDA**, et des bibliothèques de parallélisation (DeepSpeed, Megatron‑LM).
- Expertise avérée en **optimisation de pré‑entraînement**, gestion de données massives et systèmes distribués à grande échelle.
- Expérience avec les GPU NVIDIA (A100, H100) et les environnements de cloud hybride (AWS, Azure, GCP).
- Capacité à publier des travaux scientifiques dans des conférences de référence (NeurIPS, ICML, ICLR) est un plus.
- Esprit d’équipe, curiosité scientifique et forte orientation résultats.
### Ce que nous offrons
- **Contrat CDI** à temps plein, 100 % télétravail avec un budget annuel dédié à l’équipement de bureau à domicile.
- Rémunération compétitive + **bonus annuel** basé sur les performances du projet.
- Programme de **formation continue** (conférences, cours en ligne, certifications) et **temps dédié à la recherche**.
- Accès à une infrastructure de pointe : clusters GPU de plusieurs milliers de cartes, licences logicielles premium.
- Environnement de travail inclusif, dynamique et orienté innovation, avec des équipes réparties dans le monde entier.
- **Assurance santé**, **plan d’épargne retraite**, **tickets restaurant** et **programme de bien‑être**.
Vous êtes prêt(e) à repousser les limites de l’IA et à façonner le futur des modèles de langage ? Postulez dès maintenant et rejoignez l’aventure tether !