La startup de transcription vocale basée sur l’IA Verbit obtient 250 millions de dollars | VentureBeat

Écoutez les DSI, les CTO et d’autres cadres supérieurs et dirigeants sur les stratégies de données et d’IA lors du Sommet sur l’avenir du travail du 12 janvier 2022. Apprendre encore plus

Verbit, une startup développant une plate-forme de transcription basée sur l’IA, a annoncé aujourd’hui avoir obtenu 250 millions de dollars, portant son capital total levé à 550 millions de dollars. Le cycle – une série E, composé d’un investissement principal de 150 millions de dollars et de 100 millions de dollars de transactions secondaires – a été mené par Third Point Ventures avec la participation de Sapphire Ventures, More Capital, Disruptive AI, Vertex Growth, 40North, Samsung Next et TCP. .

Avec le nouveau capital, Verbit, qui est maintenant évalué à 2 milliards de dollars, prévoit d’augmenter ses effectifs tout en soutenant la recherche et le développement de produits ainsi que les efforts d’acquisition de clients. Au-delà de cela, le PDG Tom Livne a déclaré que Verbit poursuivrait d’autres fusions et acquisitions et « apporterait une valeur accrue » à ses clients médias, éducation, entreprises, juridiques et gouvernementaux.

Pendant la pandémie, les entreprises ont intensifié leur adoption des technologies vocales, y compris la transcription, alors que la vidéoconférence à distance est devenue la norme. Dans une enquête de Speechmatics, un peu plus des deux tiers des entreprises ont déclaré avoir désormais une stratégie de technologie vocale. Alors qu’ils ont cité l’exactitude et la confidentialité comme préoccupations, 60% sans stratégie ont déclaré qu’ils en envisageraient une d’ici cinq ans, ce qui pourrait porter le marché de la reconnaissance vocale et vocale à 22 milliards de dollars d’ici 2022.

Livne a cofondé Verbit, une société new-yorkaise, avec Eric Shellef et Kobi Ben Tzvi en 2017. Shellef dirigeait auparavant la reconnaissance vocale au sein du groupe Wearables d’Intel, tandis que Tzvi a cofondé et servi en tant que directeur technique de la startup de reconnaissance faciale Foresight Solutions. Quant à Livne, qui est également membre du conseil d’administration de Verbit, il a été l’un des premiers investisseurs dans la plate-forme de contre-drone Convexum, qui a été acquise par NSO Group en 2020 pour 60 millions de dollars.

Transcription basée sur l’IA

Les services de transcription vocale et de sous-titrage de Verbit ne sont pas nouveaux : des acteurs bien établis comme Nuance, Cisco, Otter, Voicera, Microsoft, Amazon et Google proposent des produits concurrents depuis des années, notamment des plateformes d’entreprise comme Microsoft 365. Mais la parole adaptative de Verbit La technologie de reconnaissance peut générer des transcriptions qui, selon elle, atteignent une précision supérieure à celle de ses rivaux.

Les utilisateurs de Verbit téléchargent de l’audio ou de la vidéo sur un tableau de bord pour un traitement alimenté par l’IA. Ensuite, une équipe édite et examine le matériel, en tenant compte des notes et des directives fournies par le client.

Les transcriptions terminées de Verbit peuvent être exportées vers des services tels que Blackboard, Vimeo, YouTube, Canvas et Brightcove. Une interface Web affiche la progression des travaux et permet aux utilisateurs de modifier et de partager des fichiers ou de définir les autorisations d’accès pour chacun, ainsi que d’ajouter des commentaires en ligne, de demander des révisions ou de consulter des rapports d’utilisation.

« La technologie d’IA interne de Verbit détecte les termes spécifiques au domaine, filtre les bruits de fond et les échos, et transcrit les locuteurs quel que soit l’accent pour générer… des transcriptions et des légendes à partir de vidéos et d’audio en direct et enregistrés. Les données acoustiques, linguistiques et contextuelles sont… vérifiées par nos transcripteurs, qui [incorporate] notes fournies par le client, directives, conditions spécifiques à l’industrie et exigences », a déclaré Livne à VentureBeat par e-mail. « En indexant le contenu vidéo pour les recherches sur le Web, Verbit [can help] les entreprises améliorent leur référencement et augmentent le trafic de leur site. [In addition, the platform can] fournir une traduction audiovisuelle pour aider les entreprises mondiales avec des traductions et pour atteindre un public international avec leurs produits et leurs offres.

L’expérience du transcripteur

Comme ses concurrents, Verbit s’appuie sur une armée de crowdworkers pour transcrire les fichiers. Les quelque 35 000 pigistes et 600 sous-titreurs professionnels de l’entreprise sont payés de l’une des deux manières suivantes, par minute audio ou par mot. Bien que Verbit n’affiche pas les tarifs sur son site Web, une source de transcription paie 0,30 $ par minute audio. Il y a deux ans, le service de transcription Rev a fait face à un contrecoup massif lorsqu’il a réduit les tarifs minimum pour ses transcripteurs de 0,45 $ à 0,30 $ par mot transcrit.

Dans certains cas, le salaire peut descendre en dessous de 0,30 $ sur Verbit, selon les avis des employés sur Indeed. L’entreprise aurait commencé à payer aussi peu que 0,24 $ la minute audio l’année dernière pour un travail standard.

Les plateformes de transcription n’ont pas non plus toujours la technologie en place pour empêcher les crowdworkers de voir du contenu dérangeant. Dans un article de The Verge, les crowdworkers de Rev ont déclaré qu’ils avaient été exposés à du matériel graphique ou troublant à plusieurs reprises sans avertissement, y compris des enregistrements policiers violents, des descriptions de maltraitance d’enfants et des vidéos médicales graphiques.

Un porte-parole a déclaré à VentureBeat par e-mail : « Actuellement, nous employons un mélange de transcripteurs et de sous-titreurs à temps plein, ainsi que des pigistes payés à la minute audio. Nous avons établi un système de classement basé sur l’efficacité et la précision pour inciter et récompenser les pigistes avec une rémunération plus élevée en échange de la fourniture constante de transcriptions de haute qualité… Les transcripteurs de l’entreprise disposent d’un système d’assistance – chat et forum – qui transmet constamment les commentaires à la direction de Verbit et il dispose d’un programme de bonus pour assurer une rémunération appropriée à ses plus performants.

Le porte-parole a poursuivi : « En plus d’un salaire compétitif et d’opportunités d’avancement, notre personnel de transcripteurs et de sous-titreurs à temps plein est éligible pour recevoir des prestations de soins de santé… Notre communauté de transcripteurs suit un système de classement basé sur l’ancienneté et le nombre d’heures travaillées, permettant aux pigistes de gagnez des promotions à des postes tels que rédacteur en chef, réviseur et superviseur.

Au sujet du contenu graphique, le porte-parole a déclaré : « Verbit n’assume aucune activité liée au contenu violent ou graphique. Par exemple, une société de divertissement pour adultes a récemment demandé nos services, mais nous avons choisi de ne pas les accepter en tant que client.

Année de croissance

La plate-forme de Verbit a séduit une base solide de plus de 2 000 clients, renforcée par son acquisition du fournisseur de sous-titrage VITAC plus tôt cette année. Ces derniers mois, Verbit a conclu des contrats avec des établissements d’enseignement comme Harvard et Stanford, qui ont des normes d’hébergement plus strictes que les organisations d’autres secteurs.

Les technologies de sous-titrage automatique sur YouTube, Microsoft Teams, Google Meet et les plates-formes similaires ne sont pas soumises aux normes d’hébergement décrites dans l’Americans with Disabilities Act. En revanche, le sous-titrage doit satisfaire à certains critères d’exactitude afin de répondre aux directives fédérales. Une enquête récente menée par Verbit a révélé que seulement 14% des écoles fournissaient des sous-titres par défaut, tandis qu’environ 10% ont déclaré qu’elles ne sous-titraient les leçons que lorsqu’un élève le demandait.

Verbit dit également qu’il continuera d’explorer des secteurs verticaux dans les secteurs de l’assurance, de la finance, des médias et de la médecine. L’entreprise – qui compte actuellement 470 employés, un nombre qui devrait atteindre 750 d’ici 2023 – a récemment lancé un service de transcription humaine en boucle pour les médias et a signé un accord avec l’institut à but non lucratif Speech to Text pour investir dans sténographie et transcription judiciaire.

«Avec une croissance des revenus six fois supérieure à celle d’un an et près de 100 millions de dollars de revenus récurrents annuels, Verbit continue de se développer dans de nouveaux secteurs verticaux à un rythme d’hyper-croissance. Le passage au travail à distance et à la numérisation accélérée au milieu de la pandémie a été un catalyseur majeur … et a encore stimulé la croissance rapide de Verbit », a ajouté Livne. « À l’ère numérique d’aujourd’hui où le contenu audio et vidéo est une évidence, et souvent la principale méthode de transmission d’informations, ces outils d’IA sont cruciaux pour garantir que les individus et les organisations de toutes tailles et formes puissent interagir avec leur public et leurs parties prenantes de manière plus efficace et effectivement. »

Livne avait précédemment déclaré que Verbit prévoyait de déposer un premier appel public à l’épargne en 2022.

VentureBeat

La mission de VentureBeat est d’être une place publique numérique permettant aux décideurs techniques d’acquérir des connaissances sur la technologie transformatrice et d’effectuer des transactions.

Notre site fournit des informations essentielles sur les technologies et les stratégies de données pour vous guider dans la gestion de vos organisations. Nous vous invitons à devenir membre de notre communauté, pour accéder à :

  • des informations à jour sur les sujets qui vous intéressent
  • nos newsletters
  • contenu de leader d’opinion fermé et accès à prix réduit à nos événements prisés, tels que Transformer 2021: Apprendre encore plus
  • fonctionnalités de mise en réseau, et plus

Devenir membre

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *