Responsable des opérations - Grappes de calcul

À propos de Mila

Fondé par le professeur Yoshua Bengio de l’Université de Montréal, Mila rassemble des chercheurs spécialisés en intelligence artificielle et plus précisément en apprentissage automatique, apprentissage profond et apprentissage par renforcement. Reconnu mondialement pour ses importantes contributions au domaine de l’apprentissage profond, Mila s’est particulièrement distingué dans la modélisation du langage, la traduction automatique, la reconnaissance d’objets et les modèles génératifs. Depuis 2017, Mila est le fruit d’une collaboration entre l’Université de Montréal et l’Université McGill, en lien étroit avec Polytechnique Montréal et HEC Montréal.

Mila s’est donné pour mission d’être un pôle mondial d’avancées scientifiques qui inspire l’innovation et l’essor de l’intelligence artificielle (IA) au bénéfice de tous.

Pour en connaitre davantage, veuillez consulter https://mila.quebec/

Le rôle

Mila est à la recherche d'un.e responsable des opérations des grappes de calcul hautement expérimenté.e pour gérer nos infrastructures de calcul;. Cette personne sera responsable de la planification stratégique, de la conception, de la mise en œuvre et de l'exploitation des grappes de calcul haute performance (CHP/IA) et des centres de données. Le candidat retenu jouera un rôle central en garantissant que nos chercheurs et étudiants ont accès à des ressources informatiques de pointe pour repousser les limites de l'IA.

Responsabilités

  • Gestion des grappes HPC : Superviser l'architecture, le déploiement, la maintenance et l'optimisation des grappes HPC, en assurant une haute disponibilité, performance et évolutivité.
  • Opérations et fiabilité : Établir et appliquer les meilleures pratiques pour les opérations d'infrastructure, la surveillance, le dépannage et la réponse aux incidents afin de maintenir un environnement hautement fiable.
  • Gestion budgétaire : Gérer les budgets de l'infrastructure.
  • Gestion des fournisseurs: Trouver et prendre contacts avec des fournisseurs, négocier les contrats et les ententes de services
  • Sécurité et conformité : Assurer la sécurité et la conformité de tous les composants de l'infrastructure, en mettant en œuvre des mesures de sécurité robustes et des protocoles de protection des données.
  • Collaboration : Travailler en étroite collaboration avec les chercheurs, les professeurs et les autres départements pour comprendre leurs besoins informatiques et fournir des solutions adaptées.
  • Innovation : Se tenir au courant des dernières avancées en matière d'infrastructure informatique et de matériel d'IA, en proposant et en mettant en œuvre des solutions innovantes pour améliorer les capacités de Mila.

Qualifications

  • Baccalauréat ou maîtrise en informatique, en ingénierie ou dans un domaine connexe.
  • 10+ ans d'expérience en infrastructure informatique, dont au moins 5 ans dans un rôle de leadership en gestion d'environnements informatiques complexes.
  • Expertise approfondie en architecture, conception et opérations de grappes HPC, y compris une expérience avec les ordonnanceurs (par exemple, Slurm), les interconnexions haute vitesse (par exemple, InfiniBand) et les systèmes de fichiers parallèles (par exemple, Lustre, BeeGFS).
  • Expérience avérée en gestion de centres de données, d'infrastructure réseau et de solutions de stockage.
  • Solide compréhension des technologies de virtualisation (par exemple, Proxmox, Docker, Podman).
  • Expérience avec l'infrastructure as code (par exemple, Ansible, Terraform) et les outils d'automatisation.
  • Excellentes compétences en leadership, en communication et en relations interpersonnelles, avec la capacité d'articuler des concepts techniques complexes à des publics techniques et non techniques.
  • Capacité démontrée à gérer des projets, à prioriser les tâches et à travailler efficacement dans un environnement de recherche rapide.
  • Une passion pour contribuer à la recherche de pointe en IA et un engagement envers la mission de Mila.
  • Être bilingue, en français et en anglais, en raison des interactions que vous aurez dans le cadre de votre emploi avec certains de nos partenaires, parties prenantes, ou membres de notre communauté académique anglophones.

Compétences souhaitables

  • Expérience avec le calcul accéléré par GPU et les frameworks d'apprentissage profond.
  • Connaissance des environnements de calcul de recherche et des défis spécifiques rencontrés par les chercheurs en IA.
  • Familiarité avec les technologies open-source et les contributions communautaires.

De bonnes raisons pour travailler à Mila

  • L’occasion de contribuer à une mission unique avec un impact important;
  • Un programme d’assurance collective complet (maladie, dentaire, invalidité, vie, assurance voyage et garanties complémentaires);
  • Un programme d’aide aux employés et à la famille;
  • Un accès à un service de télémédecine;
  • Une politique de congés annuels offrant une base de 20 jours de vacances dès l’embauche;
  • Un régime d’épargne retraite avec contribution de l’employeur minimale de 4%;
  • Une généreuse enveloppe flexible vous permettant de personnaliser vos avantages sociaux en fonction de ce qui contribue à votre bien-être. Vous pouvez sélectionner et combiner les options qui correspondent à vos besoins parmi les crédits style de vie, une assurance bonifiée, des journées de vacances supplémentaires et une contribution enrichie au régime de retraite;
  • Un horaire flexible, un horaire d’été et une possibilité de télétravail;
  • Un milieu de travail au cœur de la Petite Italie, dans le quartier branché Mile-Ex, à proximité des transports en commun;
  • Une équipe d’experts de leur domaine, des gens passionnés et passionnants;
  • Une ambiance de travail collaborative et inclusive.

Nous voulons vous connaître

À Mila, la diversité nous tient à cœur. Nous valorisons un environnement de travail équitable, ouvert et respectueux des différences. Nous encourageons toute personne souhaitant œuvrer dans un écosystème en progression continue et stimulée à contribuer à l’application et la définition d’une culture saine et inclusive, à postuler.

Veuillez noter que seules les personnes sélectionnées seront contactées.

https://mila.quebec/fr/protection-de-la-vie-privee

Appliquer sur ce poste


Offres d'emploi similaires

Développeur Java

Chef de file mondial en transformation numérique, Techso est une société en pleine croissance proposant des services-conseil dans trois créneaux d’expertise : la gestion de l’infrastructure technologique (TI), le développement spécifique...

Développeur Fullstack .NET

Chef de file mondial en transformation numérique, Techso est une société en pleine croissance proposant des services-conseil dans trois créneaux d’expertise : la gestion de l’infrastructure technologique (TI), le développement spécifique...

Développeur backend - big data

Une équipe du CHU Sainte-Justine    Composé de plus de 200 chercheurs reconnus, le Centre hospitalier universitaire Sainte-Justine est le plus grand centre mère-enfant au Canada et l’un des plus importants en Amérique. Au service des enfants...

PROGRAMMEUR(EUSE) CNC

FAB 3R, nous sommes une équipe passionnée par l'innovation, la qualité et la sécurité. Chaque projet est pour nous une opportunité de grandir ensemble et de repousser nos limites. Forts d'une solide réputation dans l'industrie, nous offrons...

Opérateur en conception numérique 3D - Secteur dentaire

Notre client, le Laboratoire dentaire de la Mauricie, entreprise spécialisée dans la conception et fabrication de prothèses dentaires fixes et amovibles depuis 1986, est actuellement à la recherche de leur futur opérateur en conception numérique...

Technicien(ne) en automatisation

Preverco est à la recherche d'un(e) Technicien(ne) en automatisation de jour à temps plein pour sa division de Saint-Augustin-de-Desmaures. Si tu aimes collaborer au sein d’une équipe multidisciplinaire où l’esprit d’équipe, la communication et...