
Dans notre projet de benchmark LLM appliqué aux RH, nous avons évalué cinq modèles de langage sur un cas d’usage clé : l’onboarding d’un nouveau collaborateur dans l’entreprise fictive NoroTech Services.
Les modèles étudiés (en version ~12–14B paramètres) :
- Gemma 3 12B (Google – États‑Unis)
- Phi‑4 14B (Microsoft – États‑Unis)
- Mistral 3 14B (Mistral AI – France)
- Qwen 3 14B (Alibaba – Chine)
- DeepSeek‑R1 14B (DeepSeek – Chine)
L’objectif : voir lequel joue le mieux le rôle d’assistant IA RH capable d’expliquer un parcours d’intégration de façon structurée, rassurante et alignée sur les règles RH internes.
Cas d’usage 6 : l’onboarding chez NoroTech, étape par étape
Le cas d’usage 6 simule les questions typiques d’un nouveau collaborateur qui arrive chez NoroTech :
- « Je commence chez NoroTech dans 2 semaines, comment va se passer mon onboarding ? »
- « Qui va m’accueillir le premier jour ? »
- « Est-ce que je vais recevoir un livret d’accueil ? »
- « Qu’est-ce qui est prévu pendant mon premier mois ? »
Les réponses attendues doivent respecter le document RH de référence :
« Process Onboarding – Salariés France v4 », qui structure l’intégration en 3 grandes étapes :
- Avant l’arrivée : création des accès, préparation du matériel, planification.
- Jour J : accueil par le manager et les RH, remise du livret d’accueil, présentation des outils.
- 1er mois : parcours de formations obligatoires (via MyHR > Formations) et point de suivi manager + RH.
Comment nous avons évalué les LLM
Pour ce cas d’usage, nous avons évalué chaque modèle sur trois dimensions principales :
- Respect du process en 3 étapes
- Capacité à restituer clairement : avant l’arrivée / jour J / premier mois.
- Précision opérationnelle & conformité RH
- Mention du document « Process Onboarding – Salariés France v4 ».
- Références à MyHR (Onboarding, Formations) et aux bons interlocuteurs : manager, équipe RH.
- Ton & pédagogie
- Style rassurant, structuré (listes, étapes), orienté “conseils pratiques pour le collaborateur”.
Résultats comparés : qui fait le meilleur accueil ?
Tableau synthétique du cas d’usage Onboarding
| Modèle LLM (éditeur) | Pays | Structuration temporelle | Alignement avec le process RH | Ton & pédagogie côté collaborateur | Note globale* |
|---|---|---|---|---|---|
| Mistral 3 14B (Mistral AI) | France | 3 étapes très clairement explicitées (avant / jour J / 1er mois) | Référence systématique à MyHR et au document « Process Onboarding – Salariés France v4 » | Ton très rassurant, concret, avec actions claires | 5/5 |
| Qwen 3 14B (Alibaba) | Chine | 3 étapes nettes et synthétiques | Renvoi précis à MyHR (Onboarding, Formations) et aux bons contacts RH | Style efficace et structuré, légèrement plus “sec” | 4,5/5 |
| DeepSeek‑R1 14B (DeepSeek) | Chine | 3 étapes bien reprises + gros focus sur le 1er mois | Contenu conforme, enrichi (check-ins, team‑building, feedback, etc.) | Très pédagogique mais verbeux, avec un petit artefact de texte | 4/5 |
| Gemma 3 12B (Google) | États‑Unis | 3 étapes claires sous forme de listes | Respect du process et renvoi au document de référence MyHR | Ton simple et accessible, quelques références techniques visibles | 4/5 |
| Phi‑4 14B (Microsoft) | États‑Unis | 3 étapes bien identifiées pour l’onboarding global | Alignement global correct, mais une réponse sur le livret d’accueil reste implicite | Ton pro et rassurant mais moins centré sur chaque question précise | 3,5/5 |
*Notes basées sur : structuration en 3 temps, conformité aux règles RH, clarté pour le collaborateur, qualité rédactionnelle (lisibilité, absence d’artefacts).
Cette synthèse est construite à partir des réponses détaillées du fichier de benchmark du cas 6.
Zoom par modèle
Mistral 3 14B (Mistral AI – France)
Mistral 3 ressort comme référence sur ce cas d’usage.
- Restitue parfaitement les 3 étapes : avant l’arrivée (préparation des accès & matériel, envoi d’un planning), jour J (accueil manager + RH, tour des locaux), premier mois (formations via MyHR > Formations, point de suivi).
- Répond précisément aux 4 questions, notamment sur qui accueille le collaborateur et sur la remise du livret d’accueil.
- Ton très structuré : listes claires, actions concrètes, rappel du canal (MyHR, manager, RH).
👉 En pratique RH : excellent candidat pour un assistant onboarding “clé en main” : peu de réécriture nécessaire, très conforme au process interne.
Qwen 3 14B (Alibaba – Chine)
Qwen 3 propose des réponses très propres et alignées, avec un style un peu plus “sec” mais très opérationnel.
- Suit strictement la logique Avant l’arrivée / Jour J / 1er mois, en citant explicitement le document « Process Onboarding – Salariés France v4 ».
- Renvoie systématiquement vers MyHR, avec des chemins comme MyHR > Onboarding ou MyHR > Formations pour approfondir.
- Répond bien aux questions sur le livret d’accueil (contenu, remise, canal).
👉 En pratique RH : idéal si l’on cherche un assistant IA efficace, factuel et très conforme aux procédures, quitte à enrichir légèrement le ton en sur‑couche.
DeepSeek‑R1 14B (DeepSeek – Chine)
DeepSeek‑R1 se distingue par des réponses riches et très détaillées, notamment sur le premier mois.
- Reprend correctement les 3 temps de l’onboarding et renvoie au document de process.
- Pour la question “Qu’est-ce qui est prévu pendant mon premier mois ?”, le modèle décrit un parcours complet : formations, check-ins réguliers avec le manager, accès aux outils, activités d’intégration, feedback, ressources documentaires.
- Petit bémol : une phrase contient un artefact (“vous苏迎 by your manager and the RH team”) dans la réponse sur l’accueil du premier jour, ce qui dégrade un peu l’expérience utilisateur.
👉 En pratique RH : excellent pour un chatbot qui doit beaucoup détailler l’expérience d’onboarding ; à encadrer avec une couche UX qui raccourcit certaines réponses et corrige les artefacts éventuels.
Gemma 3 12B (Google – États‑Unis)
Gemma 3 propose des réponses très lisibles et globalement bien alignées.
- Structure systématiquement la réponse en trois étapes (préparation, jour J, premier mois) avec listes à puces claires.
- Confirme la remise du livret d’accueil le jour J par le manager et un membre de l’équipe RH, conforme au process.
- Renvoie au document « Process Onboarding – Salariés France v4 » et à MyHR pour les détails.
- On voit parfois passer des références internes du type
[2.6], qui trahissent la présence de notes de bas de page dans le contexte – pas dramatique, mais un peu “technique” pour un collaborateur final.
👉 En pratique RH : très bon compromis simplicité / conformité, à peine retoucher pour nettoyer les références techniques.
Phi‑4 14B (Microsoft – États‑Unis)
Phi‑4 tient bien la logique globale, mais reste un peu en retrait sur la finesse des réponses.
- Pour la vision d’ensemble, il décrit correctement les trois grandes étapes (préparation, jour J, 1er mois) avec mention du livret d’accueil et des formations.
- Sur le détail des questions, certaines réponses se concentrent surtout sur le premier mois (formations + point de suivi), et la question spécifique du “livret d’accueil” est moins explicitement traitée : la réponse prête davantage le flanc à l’interprétation qu’à la confirmation claire que “oui, vous le recevrez”.
- Ton sérieux, professionnel, mais un peu générique par rapport aux autres modèles.
👉 En pratique RH : bon socle, mais à encadrer par des règles de post‑édition pour s’assurer que chaque question est traitée de manière explicite (notamment sur les livrables comme le livret d’accueil).
Ce que cela signifie pour un projet d’IA RH Onboarding
De ce cas d’usage 6, on peut tirer plusieurs enseignements pour un projet comme le vôtre :
- La structuration temporelle est clé
- Les meilleurs modèles sont ceux qui “racontent” l’onboarding dans l’ordre du vécu collaborateur (avant / jour J / 1er mois) et non comme un bloc d’informations.
- Le respect du référentiel RH fait la différence
- Le fait de citer explicitement le document « Process Onboarding – Salariés France v4 » et d’orienter vers MyHR renforce la confiance et limite les risques d’incohérence.
- Le choix du modèle dépend aussi du ton que vous voulez donner à votre assistant
- Mistral 3 & Qwen 3 : parfaits si vous voulez un assistant onboarding structuré et très conforme.
- DeepSeek‑R1 : intéressant si vous cherchez un compagnon très pédagogique et détaillé.
- Gemma 3 & Phi‑4 : bons candidats si vous prévoyez une post‑édition ou une orchestration multi‑modèles.
