Unbias, comme son nom l’indique (l’anglais "unbiased" signifie "impartial"), s’est construit pour tordre les stéréotypes et biais dans les modèles d’IA, notamment les LLM, les grands modèles de langues tels ChatGPT, Gemini, Claude ou BERT. "Ce sont des modèles probabilistes, explique Daphné Marnat, cofondatrice et présidente de la deeptech basée à Sophia Antipolis, formée à la philologie. Et le plus probable n’est pas forcément le plus vrai ou le plus juste, c’est ce qu’ils vont retrouver le plus souvent dans leur corpus d’apprentissage. Ils vont ainsi véhiculer et amplifier ces stéréotypes."
L’ingénieur est un homme, blanc, de 30 ans
Préjugés liés au sexe, à l’âge, à l’origine sociale ou géographique, les exemples sont légion. "Il s’agit notamment des représentations implicites associées le plus fréquemment à un homme, comme le leadership ou la violence, ce qui peut être très discriminant aussi pour les hommes. Pour les femmes, ça va plutôt être le soin. Tant que vous utilisez un Mid Journey ou un Chat GPT, vous pouvez voir que c‘est un petit peu biaisé, stéréotypé et vous pouvez redresser le problème. Mais quand ça ne se voit pas, c’est plus problématique. Par exemple, pour faire du matching de profils de candidats avec des offres d’emploi, quand le modèle a bien appris qu’un ingénieur était plutôt un homme blanc de 30 ans, parce que statistiquement il y a plus d’hommes d’une certaine origine sociale et économique, il va croire que c’est la bonne réponse et va pousser dans ce sens."
La preuve par l’exemple début 2024 avec l’équivalent de France Travail en Autriche, premier pays en Europe à avoir mis en place un agent conversationnel fondé sur l’IA générative afin de mieux orienter les demandeurs d’emploi. Mais dans la pratique, les biais sexistes poussaient les hommes vers l’informatique et les femmes, à CV identique, vers les métiers d’infirmière ou de psychologue, jamais vers la tech.
Avec l’IA ACt, l’Europe s’en mêle
La lutte contre ces biais mobilise 70 % de la R & D de Unbias mais seulement 20 % de son activité. Du moins à ce jour car Daphné Marnat, féministe engagée, compte sur l’IA Act pour qu’un certain équilibre soit établi. Entré progressivement en application depuis l’été 2024, le règlement européen sur l’intelligence artificielle vise à encadrer le développement, la mise sur le marché et l’utilisation de systèmes d’IA pouvant poser des risques pour la santé, la sécurité ou les droits fondamentaux. Ainsi, les entreprises doivent notamment sensibiliser et former leurs équipes à la question des biais et discriminations. Autant de nouveaux sujets qui devraient créer un relais de croissance pour la start-up, sous doute à partir de 2026.
Réduire les coûts de calcul
Mais aujourd’hui, la priorité des entreprises consommatrices d’intelligence artificielle n’est pas tant de la rendre inclusive que de la rendre frugale. Car ces grands modèles sont préformés sur d’immenses quantités de données. "Nous avons toujours dit que les gros modèles de langue allaient marcher mais que notre planète ne peut pas se permettre ce type de développement. L’important pour nous est surtout l’impact. Nous avons donc très tôt travaillé à réduire le coût des calculs, pour avoir moins de consommation énergétique, moins de consommation de carbone. Et c’est un vrai verrou commercial parce que, sauf si vous êtes Google, cela coûte trop cher pour beaucoup. C’est d’ailleurs ce qui nous a rendus indépendants, Unbias vit de cela." La start-up de 5 collaborateurs affiche un chiffre d’affaires "autour du million d’euros".
De 9 milliards à 750 millions de paramètres
La deeptech azuréenne, soutenue par Nvidia, a notamment réussi à développer une solution, CrystaALS, permettant de compresser de 85 % un grand modèle de langue, comme EuroLLM (modèle de langage européen conforme aux exigences de l’Union entraîné sur les 24 langues officielles de l’UE et 11 autres langues stratégiques). "Nous l’avons entraîné sur Jean Zay, le supercalculateur de GENCI (le Grand Équipement National de Calcul Intensif, NDLR), précise Daphné Marnat. Ce modèle est ainsi passé de 9 milliards de paramètres à 750 millions, soit de 4 à 5 millions d’euros à 350 000 euros."
Des arguments qui séduisent toutes sortes de clients, des start-up aux grands groupes qui se soucient par ailleurs de leur éventuelle vulnérabilité. "Plus vous les faites petits, plus vous pouvez mettre ces modèles sur vos serveurs, et devenez moins exposé aux attaques."