Press release

Bertin IT présente MediaSpeech v6, sa toute dernière solution de transcription Parole-Texte multilingue

0
Sponsorisé par Businesswire

Bertin IT (Groupe CNIM) annonce la disponibilité de la nouvelle version de
MediaSpeech®, sa solution de transcription vocale multilingue

qui permet, en convertissant les pistes audio en transcriptions texte
interrogeables, d’indexer, rechercher et analyser des sources audio et
vidéo, ainsi que des télécommunications. MediaSpeech® se décline
aussi à présent en version « live » sur des flux audio en temps réel

et ouvre la voie à de nouvelles applications de communications
interactives et augmentées.

Ce communiqué de presse contient des éléments multimédias. Voir le communiqué complet ici :
https://www.businesswire.com/news/home/20190605005385/fr/

Bertin IT introduces MediaSpeech v6, its latest multilingual speech recognition solution (Photo: Bus ...

Bertin IT introduces MediaSpeech v6, its latest multilingual speech recognition solution (Photo: Business Wire)

Grâce aux réseaux de neurones profonds (ou deep learning)
aujourd’hui très présents dans les systèmes d’Intelligence Artificielle,
MediaSpeech® s’appuie sur une modélisation extrêmement fine de l’espace
acoustique, robuste face aux variabilités des locuteurs et des
conditions sonores, et offre ainsi une transcription encore plus précise
et plus rapide.

La solution permet :

  • la transcription parole-texte avec chaque mot transcrit à la
    milliseconde
    et doté d’un score de confiance de
    reconnaissance,
  • la détection automatique de la langue parlée (LID),
  • la segmentation automatique des tours de parole et des locuteurs
    avec reconnaissance de leur genre,
  • l’identification du locuteur via une base biométrique,
  • l’adaptation automatique ou semi-automatique des vocabulaires et des
    domaines,

et ce, pour 17 langues.

MediaSpeech® possède plusieurs déclinaisons : déployé sur site
ou en mode SaaS
, hébergé dans le cloud privé de Bertin IT, MediaSpeech®
Factory permet de traiter de gros volumes de fichiers avec des
performances garanties
 ; une toute nouvelle déclinaison MediaSpeech®
Live est capable de transcrire au fil de l’eau un flux audio ce qui rend
possible des applications temps réel innovantes
— voice chatbot,
« call-bot », téléconseiller augmenté (le concept de téléconseiller
augmenté consiste à assister le conseiller pendant l’appel, ce qui
permet de fluidifer et améliorer la qualité du dialogue.)…

Parmi les principales améliorations apportées par la nouvelle version de
MediaSpeech® :

  • La déclinaison MediaSpeech® Live pour le traitement des flux
    audio en temps réel
  • de nouveaux modèles neuronaux rendant la transcription deux à trois
    fois plus rapide et toujours plus précise
  • Le passage en « full » neuronal de tous les modules de traitement
    de parole
     : la détection de parole (VAD), la segmentation en
    locuteurs (Diarization), pour encore plus de précision
  • La facilitation du process d’installation, le renforcement de
    la sécurité et de nouvelles interfaces de supervision
  • Un module d’identification de la langue (LID) entièrement neuronal,
    présentant une précision accrue, même sur des portions relativement
    courtes de parole

La
version 6 de MediaSpeech®
est d’ores et déjà installée chez
plusieurs clients de Bertin IT, et notamment dans une grande banque
française de financement et d’investissement. La déclinaison MediaSpeech
Live vient également d’être livrée à un autre grand groupe bancaire pour
assister ses centres de contact téléphonique. D’autres contrats sont
attendus très prochainement pour cette nouvelle version de Mediaspeech®.