Article mis à jour le 15 mars 2021.

Reconnaissance vocale Google, YouTube, Iphone, Microsoft Teams et retranscription automatique de la parole pour les PV de CSE : quels outils et solutions ?

Plusieurs logiciels sont capables de réaliser la retranscription automatique d’un fichier audio en texte (speech to text, online speech recognition (OSR)). Des solutions gratuites et payantes sont disponibles. Nous verrons quelle est l’option la plus fiable afin de rédiger un PV de CSE.

Dragon, le leader de la reconnaissance vocale

Dragon est un outil de reconnaissance vocale ayant pour objectif d’améliorer la productivité de ses utilisateurs. Le logiciel se décline en plusieurs versions :

  • Dragon Home qui est destiné à un usage domestique
  • Dragon Professional qui vise les professionnels

Fonctionnant grâce à la technologie Deep Learning, Dragon Naturally Speaking retranscrit les textes dictés par ses utilisateurs. Il s’adapte aux différentes variations de l’intonation de la voix, et peut également s’utiliser dans des environnements professionnels bruyants. Le logiciel à de nombreuses fonctionnalités pouvant par exemple aider à l’envoi de mail ou la rédaction de documents. Grâce à ses commandes vocales, les utilisateurs peuvent ouvrir des pages sur leur navigateur web ou gérer des logiciels sur leur ordinateur. En outre, Dragon est également capable d’analyser le contenu d’un fichier audio (musique, podcast, son issu d’un film) pour le retranscrire directement en texte.

Même s’il est efficace pour la retranscription, la relecture reste impérative pour éviter les fautes d’orthographe ou les doubles sens. Si vous comptez l’utiliser pour retranscrire une réunion du comité social et économique, il faudra veiller à relire puis réécrire attentivement votre texte. Enfin, le logiciel reste très onéreux dans sa version professionnelle (environ 700 euros).

Microsoft Word

La version en ligne de Word possède 2 fonctionnalités pouvant aider à la retranscription de vos PV de CSE. Son objectif est de permettre la rédaction rapide de documents grâce à la reconnaissance vocale.

  • L’option « Dicter », en haut à droite de l’écran, enregistre le son autour de votre ordinateur, téléphone portable ou tablette, puis le retranscrit au fur et à mesure au sein d’un fichier Word. Les utilisateurs ont la possibilité de rédiger simultanément à leur enregistrement audio.
  • Depuis 2020, une nouvelle fonctionnalité d’Office permet de convertir un fichier audio au sein de Word. L’option est uniquement disponible dans la version en ligne et pour les utilisateurs premium qui sont abonnés à Microsoft 365. Pour l’utiliser, il suffit de sélectionner l’option « Transcrire » et d’y insérer un fichier audio au format MP3, MP4, WAV ou M4A. Le fichier ne doit pas dépasser les 200 Mo. Word convertit ensuite l’audio en texte, tout en prenant soin de faire une séparation entre les différents interlocuteurs.

Si ces deux fonctionnalités s’avèrent intéressantes de prime abord, elles restent pour l’heure encore trop imparfaites. Les fautes d’orthographe, erreurs de compréhension ou d’imprécisions dans la transcription sont encore trop nombreuses pour produire des textes de qualité. Autre point négatif, la fonction « Transcrire » n’est utilisable que 5 heures par mois.

Smart Report (par Axys Consultants)

Smart Report est une solution destinée aux entreprises. Elle a été créée par la société Axys Consultants. Son objectif ? Effectuer des synthèses automatiques de réunions à l’aide d’une intelligence artificielle et faire gagner du temps aux professionnels.

Pour créer des comptes rendus de réunion, Smart Report s’appuie sur des composants logiciels :

  • Un relevé d’informations, de décisions et d’action (RIDA)
  • Une analyse sentimentale qui est capable de déterminer l’état d’esprit des interlocuteurs

L’intelligence artificielle du logiciel s’appuie sur un corpus spécialisé par rapport aux domaines professionnels des entreprises. Le programme peut s’adapter à tous les types de situations : réunion où les interlocuteurs s’expriment à l’aide de micros, visioconférence, enregistrement audio, etc.

Quel est son fonctionnement ?

Le logiciel retranscrit automatiquement en texte l’intégralité de la réunion. Il est capable de trier les informations superficielles (hors sujet, apartés, plaisanteries, etc.) grâce à des mots-clés.

Lorsque la réunion est terminée, l’entreprise reçoit 3 fichiers :

  • Un relevé d’informations décisions actions
  • La transcription intégrale des échanges de la réunion
  • Un résumé écrit de la réunion

La Solution Smart Report propose une application qui a l’avantage d’être spécialisée pour les entreprises. Néanmoins, les entreprises devront faire totalement confiance à l’IA et au système qui ont été mis au point par Axys Consultants. Enfin, cette solution n’est pas totalement automatisée. À l’issue du processus de retranscription, le travail de relecture d’un rédacteur sera essentiel.

Google Docs

Google Docs possède un logiciel de reconnaissance vocale qui permet de retranscrire l’audio en texte. Le logiciel capte le son du micro de l’utilisateur et le retranscrit en temps réel au sein de son document. L’intelligence artificielle de Google est capable de reconnaître plusieurs langues. L’outil vous permet également d’utiliser des commandes vocales pour effectuer de nombreuses actions : surligner du texte, changer la police, créer un tableau, etc.

Malheureusement, Google Docs n’est pas assez précis pour retranscrire les discussions qui auront lieu au cours d’une réunion professionnelle. Son utilisation nécessitera un long travail de correction.

Happy Scribe

Happy Scribe est une solution qui est basée sur l’intelligence artificielle et la reconnaissance vocale. Le logiciel peut retranscrire différents types de contenu audio et peut interpréter plus de 100 langues et accents. Ses créateurs affirment que le logiciel permet à ses utilisateurs de gagner du temps.

Grâce au machine learning, Happy Scribe est en constante amélioration. Le logiciel propose plusieurs fonctionnalités originales. Un outil signale les moments de l’enregistrement où la retranscription est susceptible d’être imprécise. De plus, il dispose également d’options favorisant le travail collaboratif.

Simple d’accès, Happy Scribe propose un prix qui peut sembler attractif (12 euros/heure). Les résultats de la retranscription sont encore trop aléatoires et dépendent de la qualité d’enregistrement ou du débit des interlocuteurs. Ainsi, il ne sera pas possible de l’utiliser pour créer une synthèse de réunion sans effectuer un long travail de correction.

YouTube

Il est possible d’utiliser YouTube pour retranscrire gratuitement ses fichiers audio en version écrite. L’opération s’avère fastidieuse, car elle vous oblige à convertir un fichier audio en fichier vidéo. Une fois votre fichier téléchargé sur YouTube, la transcription de l’audio s’effectue instantanément et apparaît à la manière de sous-titres. S’ils peuvent être parfois surprenants par leur précision, les résultats offerts par la retranscription audio automatique de YouTube sont encore trop imprécis. La reconnaissance vocale peine parfois à différencier certaines syllabes ( par exemple : et/est) qui peuvent notamment être la source de contresens importants. Cette méthode est donc destinée à un usage personnel. Elle est à bannir dans le cadre d’un usage professionnel comme la rédaction d’un Procès-Verbal d’un colloque ou d’une réunion.

Est-ce possible de réaliser un PV de réunion grâce à la retranscription automatique ?

Il existe différents types de solutions de transcription automatique : payantes, gratuites, logiciels ou applications fonctionnant à l’aide d’une intelligence artificielle ou du deep learning, etc. Les résultats obtenus sont très variables et manquent encore parfois de fiabilité.

Actuellement, ces méthodes de retranscription automatique de la parole ne vous permettront donc pas de rédiger un PV de A à Z. Une relecture attentive est donc aujourd’hui toujours indispensable, afin de s’assurer de la bonne compréhension de vos Procès-Verbaux.

Et si vous faisiez appel à des rédacteurs professionnels ?

La rédaction d’un PV, synthèse ou d’un compte rendu de réunion nécessite de respecter des règles précises, qui ne peuvent pas être acquises par une intelligence artificielle ou une application.

En faisant appel à des rédacteurs, vous éviterez de perdre de longues heures à apprendre le fonctionnement d’un logiciel de retranscription audio.

Habitués à manier les mots, les scribes de Yabuko s’occupent de traitement de la rédaction de vos réunions professionnelles. Contrairement à un logiciel automatique, les membres de notre équipe pourront notamment détecter l’ironie, les hors sujets, ou bien encore transcrire des réunions en plusieurs langues.

Vous souhaitez en savoir plus ? Consultez notre offre de rédaction de PV CSE ou demandez-nous un devis, Yabuko vous répondra au plus vite !

Pour plus d’informations, écrivez-nous à contact [at] yabuko.fr.

FAQ

Peut-on créer compte rendu de réunion avec un logiciel de retranscription automatique de la parole ?

Les logiciels présents sur le marché ne permettent pas encore de créer un document sans « intervention » humaine. Une relecture sera forcément nécessaire.

Quelles sont les solutions de retranscription automatique gratuites ? Sont-elles fiables ?

Google Docs et YouTube permettent de retranscrire un audio en texte gratuitement. Les résultats de ses applications sont aléatoires et peuvent parfois être imprécis.

J’aimerais retranscrire un fichier audio avec Word, est-ce gratuit ?

La fonction « Transcrire » est disponible dans la version en ligne d’Office. Un abonnement à Office 365 est nécessaire afin d’utiliser cette option.