Otter.AI crée une IA pour converser activement avec les participants d’une réunion

Le service de transcription par intelligence artificielle Otter.ai a lancé une fonction de chat par IA permettant d’interagir avec plusieurs participants à une réunion en temps réel. (Crédit : A.De Santis/Unsplash)

Otter.ai, éditeur d’une solution de transcription, a annoncé le lancement d’AI Chat, un outil de réunion alimenté par l’IA, capable de fournir une assistance en temps réel sous forme de questions-réponses et de générer du contenu spécifique à la réunion. AI Chat agit comme un participant, en répondant aux questions, en travaillant avec les participants et en générant du contenu basé sur les données fournies pendant les discussions. Les utilisateurs peuvent s’envoyer des messages les uns aux autres et au chat via cette fonction.

Selon une étude récente menée par Otter.AI, plus de 70 % des professionnels utilisent déjà une forme d’IA dans leur travail et plus de 86 % pensent que leur travail sera très différent d’ici un an, car les outils d’IA vont révolutionner la façon dont les équipes travaillent et collaborent. L’étude a porté sur 1 500 employés de bureau basés aux États-Unis et au Royaume-Uni, issus de différents secteurs d’activité.

Face aux LLM, Otter.ai choisit des données internes

Les technologies d’IA génératives qui ont fait les gros titres récemment se présentent sous la forme de grands modèles de langage (LLM), tels que ChatGPT, alimentés par des données publiques ou issues d’Internet. Ils ne disposent donc pas, la plupart du temps, des connaissances internes d’une entreprise, comme l’a déclaré Sam Liang, cofondateur et CEO d’Otter.ai. Les LLM permettent à une personne et une seule d’interagir avec un modèle d’IA. Une dynamique différente de celle des réunions, dans lesquelles plusieurs personnes parlent les unes avec les autres. « C’est pourquoi nous avons conçu un autre modèle de chat, à plusieurs interlocuteurs, faisant de l’IA un des participants à la réunion et l’impliquant dans la conversation », a-t-il déclaré.

AI Chat a trois fonctions principales : donner des réponses, faciliter la collaboration et générer du contenu. Alors que presque tous les éditeurs d’applications bureautiques ont lancé depuis le début de l’année des résumés générés par IA, d’Otter se distingue par sa capacité à résumer et répondre à des questions en temps réel, en interaction avec ce qui se dit dans une réunion, plutôt que de fournir un résumé a posteriori. Les participants interrogent ainsi l’IA sur des points de discussion ou des décisions prises durant la réunion – sur un projet ou un événement spécifique, par exemple. AI Chat sera en mesure de fournir des réponses. Le contexte disponible dans la transcription automatisée,

Un outil complémentaire en réunion

En outre, au cours d’une réunion, les participants peuvent communiquer par écrit entre eux et avec AI Chat pour demander des éclaircissements sur des points particuliers, sans interrompre la réunion pour poser des questions à haute voix. Une fois les réunions terminées, l’outil peut générer des actions, des résumés, des courriels de suivi, des articles de blog et d’autres contenus dont les participants pourraient avoir besoin après la réunion. « AI Chat connaît les données relatives aux réunions de l’utilisateur, ce qui lui permet d’offrir un service plus personnalisé aux utilisateurs », indique Sam Liang. Selon Otter, l’IA de la plateforme retranscrit plus d’un million de mots parlés par minute, fournissant ainsi un ensemble imposant de données pour le développement de ce que Sam Liang appelle les « grands modèles de langage parlé ».

Il rappelle qu’Otter exploite des millions d’heures de conversations parlées. Un modèle plus difficile à développer que les LLM traditionnels, car les données conversationnelles parlées présentent de nombreuses différences avec les documents écrits. « Les documents écrits sont généralement plus formels et ont une structure particulière », a-t-il déclaré. « Au contraire, la communication verbale est dynamique et implique de multiples interlocuteurs… L’intonation et l’émotion font une grande différence. Un même mot dit d’une manière différente n’aura pas le même sens ». Otter a bel et bien adopté le « Large Spoken Language Model », mais ne l’utilisera pas exclusivement pour autant. L’éditeur devrait néanmoins avancer rapidement dans le développement de son LSLM, car il dispose déjà d’un ensemble important de réunions retranscrites, facilement disponibles à des fins d’entraînement de l’IA. « Un avantage considérable », ajoute-t-il.

Une combinaison de ses propres systèmes et d’API externes

Otter AI a développé ses capacités de transcription et de résumé en interne et il utilise une combinaison de ses propres systèmes et de certaines API externes pour la construction de son modèle de langage parlé étendu. Le CEO insiste aussi sur les strictes politiques de sécurité et de confidentialité qui garantissent que l’utilisateur reste propriétaire de ses informations et qu’elles ne soient pas utilisées à des fins d’entraînement de l’IA que si l’utilisateur y consent expressément.

En outre, toutes les data traitées par Otter AI Chat sont stockées chez Otter et ne sont utilisées par aucun des fournisseurs d’API tiers. AI Chat commencera à être déployé pour les utilisateurs à partir d’aujourd’hui, et tous les utilisateurs devraient avoir accès à la fonctionnalité dans les sept jours suivants. AI Chat est disponible et accessibles par tous les utilisateurs, quelle que soit leur formule d’abonnement pour un nombre illimité de questions par réunion. À l’exception de ceux qui ont un accès gratuit, qui seront limités à cinq.