Les VCs préviennent: injecter des millions dans une startup IA? Vous voulez dire, injecter des millions dans Azure, AWS ou ...

Malgré tout le battage médiatique autour de l’intelligence artificielle, les startups branchées basées sur la technologie auraient des marges inférieures à celles des sociétés de SaaS (Software-as-a-service), un aimant financier.

« Pour l’anecdote, nous avons observé une tendance étonnamment cohérente dans les données financières des sociétés d’IA, avec des marges brutes souvent de l’ordre de 50 à 60% – bien en dessous des 60 à 80%. [and above] référence pour des entreprises SaaS comparables », ont déclaré cette semaine Martin Casado et Matt Bornstein, capital-risqueurs du vénérable partenariat Andreessen Horowitz de la Silicon Valley.

Et ne vous laissez pas berner en pensant que les débutants basés sur l’apprentissage automatique suivent le modèle Saas-y build-once-run-for-Everyone: ils ressemblent plus à des fournisseurs de services traditionnels en ce sens qu’ils déploieront probablement des déploiements personnalisés, a expliqué la paire. . «Les maintenir peut parfois ressembler davantage à une entreprise de services – nécessitant des coûts de travail et de saisie spécifiques au client, au-delà des fonctions de support et de réussite classiques.»

Les coûts exorbitants du temps de calcul dans le cloud pour l’apprentissage automatique et l’effort humain minutieux nécessaire pour nettoyer les données nécessaires à la formation des systèmes d’IA sont également des gouffres financiers majeurs.

« Nous avons entendu des sociétés d’IA nous dire que les opérations cloud peuvent être plus complexes et plus coûteuses que les approches traditionnelles, en particulier parce qu’il n’y a pas de bons outils pour faire évoluer les modèles d’IA à l’échelle mondiale », a déclaré le duo. « En conséquence, certaines sociétés d’IA doivent transférer régulièrement des modèles formés à travers les régions du cloud – augmentant ainsi les coûts d’entrée et de sortie – pour améliorer la fiabilité, la latence et la conformité. »

Pour en savoir plus à ce sujet, regardez simplement la recherche, où les meilleurs modèles de pointe sont construits. Les meilleurs laboratoires d’IA de Google, Facebook, DeepMind, Microsoft et OpenAI préparent souvent des centaines de GPU ou de modules TPU pour parcourir des tas de données pour former des réseaux neuronaux géants et complexes qui peuvent jouer à des jeux vidéo ou générer du texte.

Si vous n’êtes pas un hyperscaler, ou des amis proches avec un, les factures de nuages alléchantes peuvent atteindre des dizaines et des centaines de milliers de dollars, ou même déborder sur des millions de dollars – ce que la plupart des startups ne peuvent pas se permettre.

Avant que ces modèles puissent même être enseignés et déployés, cependant, une quantité importante de travail doit être consacrée à la conservation de l’ensemble de données de formation. Ces données, qu’il s’agisse d’une série d’images, de clips audio ou de pages de texte, doivent être étiquetées et nettoyées, généralement, par des humains.

Veuillez vérifier vos données: un ensemble de données sur les voitures autonomes n’a pas réussi à étiqueter des centaines de piétons, des milliers de véhicules

Par exemple, les flux vidéo des caméras cartographiant les routes pour les voitures autonomes doivent être analysés. Des boîtes de délimitation doivent être dessinées autour de chaque panneau routier, piéton, cycliste et autres véhicules, pour apprendre aux machines à reconnaître les objets. Les assistants à commande vocale sont souvent soutenus par de petites armées de transcripteurs humains écoutant des extraits d’algorithmes de conversations privées qui n’ont pas pu comprendre, réintroduisant la formulation correcte dans les réseaux de neurones pour les améliorer. N’oubliez pas: les systèmes alimentés par des données de formation de faible qualité ont de mauvaises performances.

Le travail humain requis pour nettoyer les données de formation peut être sous-traité à des tiers, mais ces services entraînent rapidement des coûts, même si vous payez mal les gens et rencontrez des problèmes de confidentialité. Les logiciels d’IA doivent être régulièrement recyclés pour s’adapter à la nature dynamique des données, et des algorithmes écrits et modifiés pour des charges de travail spécifiques des clients ou des applications.

Même après que le modèle – qu’il s’agisse d’un robot pilote ou d’un système de reconnaissance faciale – a été formé, le faire fonctionner peut également être coûteux s’il est particulièrement compliqué. L’étape d’inférence, sans parler de la formation, peut nécessiter une compression des nombres non triviale, nécessitant des ressources importantes et du silicium spécialisé dans le cloud ou aux bords du réseau, ou des compromis dans les appareils intégrés.

«Ensemble, ces forces contribuent aux 25% ou plus des revenus que les entreprises d’IA dépensent souvent pour les ressources cloud. Dans les cas extrêmes, les startups s’attaquant à des tâches particulièrement complexes ont en fait trouvé le traitement manuel des données moins cher que l’exécution d’un modèle formé », ont déclaré les VC d’Andreessen Horowitz.

« Pour résumer: la plupart des systèmes d’IA ne sont pas vraiment des logiciels au sens traditionnel du terme. Et les entreprises d’IA, par conséquent, ne ressemblent pas exactement aux entreprises de logiciels. Ils impliquent un soutien humain continu et des coûts variables matériels. Souvent, ils ne s’adaptent pas aussi facilement que nous le souhaiterions. Et une forte défensibilité – cruciale pour le modèle de logiciel «construire une fois / vendre plusieurs fois» – ne semble pas venir gratuitement. « ®

Sponsorisé:
Exploiter la valeur des données

Les VCs préviennent: injecter des millions dans une startup IA? Vous voulez dire, injecter des millions dans Azure, AWS ou …

Veuillez vérifier vos données: un ensemble de données sur les voitures autonomes n’a pas réussi à étiqueter des centaines de piétons, des milliers de véhicules

À lire aussi

Laisser un commentaire