fbpx

Microsoft propose la transcription en direct dans Teams

28/05/2022 in Teams



Microsoft propose la transcription en direct dans Teams

Microsoft propose la transcription en direct dans Teams

Quand vous avez besoin d’une trace écrite de ce que les gens ont dit

Depuis mars 2021 la fonctionnalité de transcription est désormais disponible. La mise à disposition de la transcription complète le travail de création d’un récapitulatif de réunion. C’est ainsi que cela met en évidence les informations importantes partagées lors des appels et s’ajoute à une série d’améliorations récentes dans Teams.

La transcription est disponible pour les plans Office/Microsoft 365 E3 et E5 et Microsoft 365 Business Standard et Premium. Actuellement, la transcription fonctionne pour les réunions personnelles. Elle n’est pas disponible pour les réunions de canal, les réunions Meet Now ou les appels 1:1. La transcription des réunions est uniquement disponible dans le client de bureau Teams.

Mise à jour : selon la notification du centre de messages MC260564 (7 juin), Microsoft met la transcription à la disposition de ces UGS supplémentaires afin de rendre le contenu des réunions Teams plus accessible aux personnes souffrant de problèmes auditifs :

  • Office 365 E1
  • Office 365 A1
  • Microsoft 365 Business Basic
  • Office 365/Microsoft 365 A3
  • Office 365/Microsoft 365 A5
  • Microsoft 365 F1
  • Office 365/Microsoft 365 F3

La transcription des réunions (sous-titres automatiques) est une fonctionnalité de Stream. Le stockage des enregistrements de réunion a été transféré vers OneDrive for Business. Donc la possibilité de générer des transcriptions a été perdue. Cette lacune n’existe plus, ce qui est un soulagement. Car par défaut OneDrive stocke tous les nouveaux enregistrements de réunions Teams.

Changement dans le plan

Un changement notable depuis la première publication de Microsoft (MC220987) est que l’enregistrement n’est plus combiné à la transcription. Deux options distinctes apparaissent dans le menu de la réunion Teams (figure 1). Vous pouvez lancer un enregistrement sans générer de transcription ou lancer la transcription sans enregistrer une réunion. Des avis distincts sont utilisés pour informer les participants à la réunion lorsque l’enregistrement et la transcription sont actifs.

Figure 1: Separate options for recording and transcribing Teams meetings

Contrôle de la politique de transcription

Pour pouvoir transcrire une réunion, le paramètre AllowTranscription doit être actif dans la stratégie de réunion Teams. Seul PoweShell peut modifier le paramètre AllowTranscription. Pour vérifier les paramètres de la politique globale (par défaut), exécutez le cmdlet Get-CsTeamsMeetingPolicy (inclus dans le module PowerShell Teams) :

Get-CsTeamsMeetingPolicy -Identity Global | ft identity, AllowTranscription, AllowCloudRecording
 
Identity                    AllowTranscription AllowCloudRecording
--------                    ------------------ -------------------
Global                      False              True

Pour mettre à jour la politique, exécutez le cmdlet Set-CsTeamsMeetingPolicy :

Set-CsTeamsMeetingPolicy -Identity Global -AllowTranscription $True

Capturer la parole pendant les réunions

La transcription est la génération d’un enregistrement par l’IA de la conversation pendant une réunion. Le traitement se fait presque en temps réel pour afficher le texte pendant les réunions. Et pour rendre la transcription complète disponible peu après la fin de la réunion.

Microsoft propose la transcription
Figure 2: Transcribed text displayed during a Teams meeting

Utilisation de l’IA

Dans son billet de blog, Microsoft indique que « Fournir une transcription en direct avec une grande précision, une latence minimale et une rentabilité à l’échelle de l’entreprise a été l’un des défis les plus difficiles du secteur. Au cours des deux dernières années, nous avons fait des progrès considérables pour résoudre ce problème et avons considérablement amélioré nos modèles de précision en utilisant le contexte de la réunion en temps réel et une IA de pointe. »

Microsoft note également qu’un modèle d’IA se crée pour chaque réunion afin de prendre en compte le sujet de la réunion, les participants et les pièces jointes pour améliorer la précision de la reconnaissance du texte, notamment en ce qui concerne le jargon. Microsoft précise que les modèles utilisés pour la transcription des réunions sont supprimés une fois la réunion terminée et ne sont pas utilisés pour améliorer leur IA.

Il ne fait aucun doute que la capture et la transcription des conversations au cours d’une réunion constituent une tâche de calcul d’une difficulté déconcertante. Les défis informatiques deviendront encore plus difficiles à mesure que Microsoft étendra la couverture à d’autres langues que l’anglais américain. C’est actuellement la seule langue couverte.

Je ne sais pas comment Teams détecte l’anglais américain, car il ne semble avoir aucune difficulté à interpréter mon accent irlandais. Il est peut-être plus juste de dire que la transcription fonctionne lorsque les gens parlent un anglais transatlantique de type américain et qu’elle ne fonctionnera pas si quelqu’un se met à parler français, allemand, italien ou une autre langue.

Limites

Un coup d’œil à la transcription présentée à la figure 2 montre à quel point il peut être difficile de capturer une transcription précise. Si la réunion est pleine de voix différentes, vous verrez des bizarreries dans la transcription. La suppression du bruit dans le client de bureau Teams semble aider, car j’ai noté de meilleurs résultats lorsque les gens utilisent le client de bureau plutôt que le navigateur ou les clients mobiles.

Utilisation des transcriptions de réunion

Lorsqu’une réunion se termine, la transcription de la réunion est disponible presque immédiatement. Ouvrez la réunion dans l’application de calendrier Teams et la transcription est disponible dans le récapitulatif de la réunion ou via l’onglet Enregistrements et transcriptions. La figure 3 montre un exemple de transcription d’une réunion qui s’est déroulée en trois parties, une pour chaque segment. Dans ce cas, l’organisateur de la réunion est en train de réviser la transcription, l’option de suppression est donc disponible. Les autres participants peuvent voir et descendre les transcriptions, mais ils ne peuvent pas supprimer une transcription.

Microsoft propose la transcription
Figure 3: Viewing a transcript of a Teams meeting

Les transcriptions sont téléchargeables au format Video Text Track (VTT) ou Microsoft Word (docx). Les fichiers VTT sont des fichiers au format texte où les contributions individuelles sont notées avec un horodatage détaillé. Par exemple :

00:03:02.870 --> 00:03:05.570
<v Sean Landy>So now we get its goal.</v>

Le format Word est plus lisible car moins structuré et plus précieux parce que la transcription est plus facile à éditer. Dans les deux cas, le contenu correspond exactement à ce qui s’affiche pendant la réunion. La disponibilité des fichiers téléchargés permet d’éditer les erreurs évidentes et d’ajouter le contenu manquant avant de publier le compte rendu officiel d’une réunion.

Les utilisateurs invités n’ont pas accès à l’application de calendrier Teams, ils ne peuvent donc pas accéder à la transcription une fois la réunion terminée.

Vie privée

Le défaut de la transcription est d’utiliser l’attribution au locuteur. En d’autres termes, lorsque les personnes parlent, leurs noms identifie leurs contribution dans la transcription. Les utilisateurs peuvent masquer leur identité pour les transcriptions et les sous-titres en direct dans la section Sous-titres et transcriptions des paramètres du client (Figure 4).

Microsoft propose la transcription
Figure 4: Setting the privacy option for speaker attribution in Teams transcripts and live captions

Lorsqu’un utilisateur choisit de ne pas s’identifier dans les transcriptions, Teams insère l’attribution générique « Speaker » avec un numéro, de sorte que la transcription contient du texte pour « Speaker 1 », « Speaker 2 », etc.

Aussi, la mise en cache signifie que l’activation de l’option d’autorisation / refus de l’identification dans les transcriptions est différé.

Transcriptions et conformité

Microsoft indique : « Les fichiers de transcription Teams live sont stockés dans le compte Exchange Online de l’organisateur de la réunion et seuls l’organisateur et l’administrateur du tenant ont les autorisations nécessaires pour les supprimer ». Dans ce cas, voyons où sont stockées les informations relatives à la transcription. Après quoi, j’ai utilisé PowerShell pour détecter les mises à jour récentes des dossiers de ma boîte Exchange Online. Puis l’utilitaire MFCMAPI pour examiner les éléments de ces dossiers. Ça montre que Teams stocke les éléments de transcription dans le dossier ApplicationDataRoot/93c8660e-1330-4e40-8fda-fd27f9eafe10/MeetingTranscriptCollection. Lui-même se situe dans le dossier NonIPMRoot (partie cachée) de la boîte aux lettres. Chaque élément fait référence à une transcription. Si nous examinons les propriétés stockées pour la transcription, nous trouvons du contenu JSON (Figure 5).

Microsoft propose la transcription
Figure 5: A Teams transcript item stored in an Exchange Online mailbox viewed through MFCMAPI

Puis en collant le JSON dans une variable PowerShell, nous pouvons voir ce qu’il contient :

$json | convertfrom-json
 
TranscriptJsonBlob@is.Large         : True
TranscriptJsonBlob@stream           : True
TranscriptJsonBlob@type             : Edm.String
TranscriptMetadataJsonBlob@is.Large : True
TranscriptMetadataJsonBlob@stream   : True
TranscriptMetadataJsonBlob@type     : Edm.String
TranscriptWordBag@is.Queryable      : False
TranscriptWordBag                   :
TranscriptWordBag@type              : Edm.String
ThreadId@is.Queryable               : True
ThreadId                            : 19:meeting_NWY0ZDMwZGMtZWVjYi00ZDFmLTlhYmMtNWYzOWU2NGVlY2Jh@thread.v2
ThreadId@type                       : Edm.String
MessageId@is.Queryable              : True
MessageId                           : 0
MessageId@type                      : Edm.String
#type.ThreadId                      : String
#type.MessageId                     : String

Il n’y a pas de texte de transcription. À la place, nous avons le lien du fil de la réunion. Ce qui nous amène au magasin de données Teams dans Azure. Quelques recherches supplémentaires ont permis de trouver une deuxième propriété appelée TranscriptJsonBlob. C’est là que le texte de la transcription se stocke.

Si les boîtes aux lettres Exchange Online stockaient du texte de transcription, les transcriptions seraient indexable et découvrables. Et c’est exactement ce qui se produira lorsque Microsoft fournira la mise à jour documentée pour rendre possible la recherche dans les transcriptions.

Une nouvelle fonctionnalité prometteuse

Dans l’ensemble, il y a beaucoup de choses à apprécier dans la transcription des réunions. Certaines personnes obtiennent de meilleurs résultats que d’autres. Mais l’expérience guidera les gens vers l’utilisation de meilleures configurations lorsque la transcription est importante. Les transcriptions automatisées peuvent être imparfaites et inclure des interprétations intéressantes mais incorrectes de la conversation. Cependant, faire générer une transcription par Teams est beaucoup moins coûteux que de le faire par un transcripteur professionnel. En définitive, le résultat est un bon point de départ pour un enregistrement final. Les erreurs sont facilement décelables en éditant la transcription. Et en mettant cette version à la disposition des participants.

Teamstranscription

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée.