Kyutai lance Moshi, une IA vocale accessible au public

Le laboratoire de recherche Kyutai a présenté ce jeudi 3 juillet à Paris sa dernière innovation : Moshi, une intelligence artificielle (IA) dotée de capacités vocales avancées. Cette annonce marque une étape importante dans le développement d'IA conversationnelles accessibles au grand public.

Kyutai lance Moshi, une IA vocale accessible au public
Kyutai lance Moshi (Photo by Michal Czyz)

Un développement rapide et une accessibilité inédite

Développé en seulement six mois par une équipe de huit personnes, Moshi se distingue par son accessibilité. Dès aujourd'hui, le public peut interagir avec ce prototype expérimental via le site web de Kyutai, une première mondiale pour une IA vocale générative.

Lors de la présentation, à laquelle assistaient chercheurs, développeurs, entrepreneurs, investisseurs et journalistes, les participants ont pu tester directement les capacités de Moshi, démontrant ainsi son potentiel d'interaction naturelle.

Des applications variées et prometteuses

Moshi offre de nouvelles perspectives dans l'interaction homme-machine. Ses créateurs ont illustré ses capacités à travers des scénarios d'utilisation variés, notamment comme coach ou compagnon virtuel, ainsi que sa créativité dans l'incarnation de personnages lors de jeux de rôle.

La technologie de synthèse vocale de Moshi se démarque par sa capacité à générer des voix expressives et à simuler des interactions entre plusieurs voix, ouvrant ainsi de nouvelles possibilités dans le domaine de la communication digitale.

Une approche axée sur la confidentialité et l'ouverture

Kyutai souligne que Moshi peut fonctionner localement sur un appareil non connecté, garantissant ainsi la confidentialité des utilisateurs. Cette caractéristique répond aux préoccupations croissantes concernant la protection des données personnelles dans le domaine de l'IA.

Dans un geste sans précédent pour une technologie de cette nature, Kyutai annonce son intention de partager librement le code et les paramètres des modèles de Moshi. Cette démarche vise à stimuler la recherche et le développement dans le domaine de l'IA vocale.

Un modèle ouvert à l'amélioration

Kyutai reconnaît les limitations actuelles de Moshi en termes de base de connaissances et de factualité, inhérentes à un modèle léger. Cependant, l'entreprise encourage la communauté scientifique et les développeurs à exploiter et à améliorer ces aspects, tout en tirant parti des capacités d'interaction vocale avancées de Moshi.

Kyutai : un acteur émergent dans la recherche en IA

Fondé en novembre 2023 par le Groupe iliad, CMA CGM et Schmidt Sciences, Kyutai est un laboratoire à but non lucratif dédié à la recherche ouverte en IA. L'équipe, composée initialement de six scientifiques de renom ayant travaillé dans des laboratoires de grandes entreprises technologiques américaines, continue de s'agrandir et prévoit de lancer ses premières thèses de doctorat à la fin de l'année.

Avec le lancement de Moshi, Kyutai affirme sa volonté de contribuer à l'avancement de la recherche en IA et au développement de l'écosystème dans son ensemble, en mettant l'accent sur l'accessibilité et l'ouverture de ses innovations.