transcription d'une réunion sur un logiciel

Logiciel de transcription : heureusement que ça existe !

Par

Les ruptures de médias sont la pédale de frein des processus commerciaux optimisés. Particulièrement chronophage : la transcription de la parole. Heureusement, les logiciels de transcription deviennent de plus en plus précis grâce à l’intelligence artificielle.

Transcrire manuellement – personne ne souhaite le faire

Dans le quotidien professionnel des journalistes, il existe diverses choses dont personne n’a envie, mais contre lesquelles les nouveaux venus sont tout de même mis en garde. Seul le pire des maux n’est pas mentionné en petits caractères : la transcription d’interviews.

La règle générale est la suivante : une heure d’interview nécessite quatre heures de travail manuel pour être transcrite du format audio au format texte. Une demi-journée de travail, juste pour pouvoir citer sans erreurs ce qui a été dit et le relire en cas de doute.

Plus le sujet est complexe et plus les connaissances de la personne interviewée sont approfondies, plus le travail prend du temps. Ainsi, quatre heures peuvent rapidement se transformer en six heures.

Une navigation compliquée

Ce n’est pas seulement le temps. C’est ce recul toujours agaçant sur la ligne du temps pour réentendre ce qui a été dit. Et pour les longs fichiers audio, un retour arrière manuel de 30 secondes est à peu près aussi précis que d’essayer de marquer magazine sur une pièce de monnaie avec un marqueur.

Les journalistes les plus envieux ont toujours été ceux qui pouvaient simplement faire basculer six heures d’interview à « taper » sur le bureau du secrétariat.

Un temps de travail divisé par deux avec la simple reconnaissance vocale

Les premières solutions de logiciels de transcription ont tout de même permis de diviser presque par deux le temps de travail. Le logiciel s’entrainait à apprendre la voix du locuteur. Écouter l’interview par petites bouchées. Faire une pause. Répétition de la phrase. Écouter la conversation. Faire une pause. Répéter, etc. Ensuite, le logiciel analysait et transcrivait le nouveau fichier auto créé avec une seule voix de locuteur.

De telles solutions ont tout à fait leur raison d’être dans les professions médicales, par exemple. En effet, lors de la saisie orale d’un résultat, il n’y a qu’une seule voix et elle parle lentement et distinctement.

Bien entendu, cela ne fonctionne que si le logiciel a appris à connaître la voix au préalable. Pour cela, il faut prononcer des textes de la longueur de l’Ancien Testament. En cas de doute, l’urologue doit ajouter manuellement le vocabulaire technique, par exemple la prostatectomie (ablation de la prostate). Il est possible de louer du matériel de transcription sur des plateformes en ligne.

deux femmes discute devant un logiciel de transcription

L’intelligence artificielle améliore les logiciels de transcription

L’intelligence artificielle met un peu le turbo dans les logiciels de transcription. Les répétitions et la reconnaissance d’une seule voix appartiennent au passé. Il suffit de télécharger des fichiers audio et même vidéo, d’indiquer le nombre de locuteurs et l’IA fait le reste.

En quelques minutes et avec des taux de précision étonnamment bons. Les applications professionnelles atteignent des taux légèrement inférieurs à 100 %. Des timecodes insérés permettent de vérifier facilement le texte exporté dans le format souhaité. Celui-ci peut (et doit) toujours être relu dans le domaine professionnel, mais cela ne prend qu’une fraction du temps nécessaire aux résultats des logiciels de transcription traditionnels.

Lire aussi : Les voitures de fonction de demain

Évaluation de la vitesse d’élocution et de l’accentuation

Cela est particulièrement pertinent pour les applications scientifiques dans le domaine de la linguistique, lorsque l’évaluation des fichiers audio ne porte pas uniquement sur le contenu, mais aussi sur la vitesse d’élocution, les pauses et l’accentuation.

Dans la recherche sur le dialecte, les logiciels de transcription permettent même de produire des textes phonétiques afin de documenter et d’analyser la manière dont un Belge et un Ch’Ti, par exemple, communiquent entre eux. En comparaison, une transcription journalistique traditionnelle est une tâche plutôt gérable.

Laisser un commentaire

Votre adresse email ne sera pas publiée.

Vous pourriez aussi aimer