Remote
Descripcion del puesto
Rejoignez Tether, une scale‑up technologique en pleine expansion, reconnue pour ses solutions d’intelligence artificielle de pointe appliquées aux secteurs de la finance, de la santé et du divertissement. En tant qu’Ingénieur Recherche IA spécialisé dans le pré‑entraînement, vous intégrerez l’équipe Modèles d’IA, une petite équipe d’experts passionnés par les architectures de modèles massifs et les systèmes multi‑modaux. Vous serez au cœur de la conception, de l’optimisation et du déploiement de modèles de grande envergure, depuis la phase de collecte et de curation de données jusqu’à l’exécution de pré‑entraînements sur des clusters de plusieurs milliers de GPU NVIDIA.
**Missions principales**
- Concevoir et implémenter des architectures innovantes (transformers, diffusion, modèles hybrides texte‑image‑audio) capables de s’adapter à des volumes de données massifs.
- Optimiser les pipelines de pré‑entraînement : parallélisation, gestion de la mémoire, réduction du temps de formation et amélioration de l’efficacité énergétique.
- Piloter la curation, le nettoyage et l’annotation de jeux de données multi‑modaux, en veillant à la conformité éthique et à la diversité des sources.
- Mettre en place des stratégies de « curriculum learning », de fine‑tuning et de transfert de connaissances afin de maximiser la performance sur les tâches en aval.
- Identifier et résoudre les goulets d’étranglement (I/O, communication inter‑GPU, scalabilité) grâce à des outils de profiling avancés.
- Collaborer étroitement avec les équipes de recherche appliquée, d’ingénierie logicielle et de produit pour transformer les prototypes en solutions commercialisables.
- Publier des résultats dans des conférences de référence (NeurIPS, ICML, CVPR) et contribuer à la communauté open‑source (bibliothèques PyTorch, TensorFlow, DeepSpeed).
**Profil recherché**
- Diplôme d’ingénieur, Master ou PhD en informatique, IA, mathématiques appliquées ou domaine équivalent.
- Minimum 5 ans d’expérience professionnelle en recherche ou ingénierie IA, avec un historique de projets de pré‑entraînement de modèles >1B paramètres.
- Maîtrise des frameworks PyTorch/TensorFlow, des bibliothèques de parallélisation (DeepSpeed, Megatron‑LM, Horovod) et des environnements de calcul distribué (Kubernetes, Slurm).
- Solides compétences en programmation Python et C++, ainsi qu’en optimisation CUDA.
- Connaissance approfondie des techniques de traitement du langage naturel, de vision par ordinateur et d’audio, ainsi que des approches multi‑modales.
- Capacité à analyser des performances à grande échelle, à proposer des améliorations concrètes et à documenter les résultats.
- Esprit d’équipe, curiosité scientifique et aisance à communiquer des concepts complexes à des interlocuteurs non‑techniques.
**Ce que nous offrons**
- Contrat CDI à temps plein, 100 % télétravail avec un budget annuel dédié à l’équipement de bureau et à la connexion internet.
- Accès à une infrastructure de calcul de pointe (clusters GPU NVIDIA A100, stockage haute‑performance).
- Programme de formation continue (conférences, cours en ligne, certifications) et budget de recherche personnel.
- Participation aux bénéfices de l’entreprise et options d’actions.
- Environnement de travail flexible, culture d’innovation et forte autonomie.
- Vacances généreuses, assurance santé internationale et soutien au bien‑être.
Intéressé(e) par un challenge technique d’envergure et désireux(se) d’impacter l’avenir de l’IA ? Postulez dès maintenant et rejoignez une équipe qui repousse les limites du possible.