Le modèle PNL révolutionnaire GPT-3 s’apprête à redéfinir l’IA et la prochaine génération de startups

Les fondateurs de startups alimentés par l’IA du monde entier exploitent le modèle PNL révolutionnaire GPT-3 pour leur … [+] entreprises.

AFP via Getty Images

La communauté mondiale de l’intelligence artificielle (IA) s’est ébranlée avec enthousiasme dans ses chaises de bureau à domicile en prévision de l’une des rares arrivées positives et programmées à l’avance de l’année dernière lors d’une journée de juin par ailleurs sombre, dominée par les gros titres apocalyptiques si typiques de 2020. Logiciel Les ingénieurs et les chercheurs des pôles d’IA de la Silicon Valley, de Londres, de Tel Aviv et de Pékin ont suivi avec admiration lorsque la dernière et la plus puissante génération d’un modèle très attendu de traitement du langage naturel (PNL) a été publiée par OpenAI, un laboratoire de recherche de premier plan sur l’IA basé sur San Francisco.

Parmi les adeptes enthousiastes, bien que cachés à Edmonton, en Alberta, il y avait l’ingénieur logiciel et scientifique Jasmine Wang, elle-même une ancienne chercheuse à OpenAI. Résistant à la tempête de coronavirus dans son Canada natal, Wang s’est assise à son bureau dans sa maison familiale pendant deux jours juste après la sortie du modèle pour jouer avec – quelque chose qui allait inspirer des idées qui se transformeraient plus tard en plusieurs startups.

Elle n’était pas seule. D’innombrables sont les applications commerciales que ce modèle PNL nommé GPT-3, qui utilise l’apprentissage en profondeur pour produire du texte de type humain, peut alimenter – et beaucoup l’ont compris. Mais, alors que GPT-3 a un grand potentiel de valeur générative, il est sur le point de remodeler fondamentalement la dynamique du monde de l’IA et le paysage concurrentiel dans l’espace des startups Software-as-a-Service (SaaS) en raison de son propre modèle commercial. .

D’une part, GPT-3 brise le moule des anciens modèles d’IA, qui étaient traditionnellement open source, ce qui a donné aux développeurs une vue intérieure sur le fonctionnement du modèle et leur a permis d’y ajouter. Désormais avec GPT-3, OpenAI fournit le modèle prêt à l’emploi en tant que produit commercial sous la forme d’une interface «texte entrant, texte sortant». En tant que tel, GPT-3 réinitialise les règles du jeu de modèle d’IA car il ne donne pas son code mais offre simplement une interface de programmation d’application (API) facile à utiliser sur une base commerciale, permettant aux développeurs de puiser dans le GPT- 3 puissance sans donner un pic dans son fonctionnement interne.

Il s’agit d’un mouvement révolutionnaire non seulement parce qu’il monétise la recherche sur l’IA, mais parce que, pour toutes les startups et entreprises établies qui cherchent à utiliser GPT-3, cela crée une dépendance unique à un modèle fermé. Cela place OpenAI dans une position de force, en particulier en ce qui concerne la tarification (tout potentiel ajusté à la hausse) pour l’accès au modèle. Les fondateurs et les dirigeants d’entreprises construites autour de GPT-3 devront maintenir l’accès à GPT-3, ou ils pourraient voir la base même de leur entreprise s’évanouir, diminuant leur pouvoir de négociation vis-à-vis d’OpenAI.

En réalité, cependant, le modèle commercial GPT-3 n’est que l’une des multiples approches, et les actions d’autres puissances de l’IA contribueront à l’évolution continue de l’espace de l’IA. Prenez les balises technologiques telles que Google, qui peuvent s’interroger sur les incitations économiques à entrer dans cet espace sur une base commerciale. Son modèle NLP BERT alimente, entre autres, les solutions de saisie semi-automatique et de composition intelligente de Google. BERT a été open-source en 2019, bien que ses pondérations – les paramètres par excellence dans un modèle PNL – n’aient pas été publiées. Ce modèle permet aux développeurs d’utiliser le code source de BERT mais les oblige à continuer à entraîner leurs propres données pour arriver à leurs propres poids. Reste à savoir si le modèle Google de publication de code mais pas de poids, le modèle d’API commerciale GPT-3 ou encore un autre paradigme d’exploitation pour les modèles d’IA prévaudra. Dans tous les cas, ce champ restera soumis à des mouvements dynamiques.

Outre la dépendance des startups à GPT-3 et l’exposition à la volatilité potentielle résultant de l’interaction dynamique de GPT-3 et d’autres schémas de monétisation de modèles d’IA, le nouveau modèle commercial de GPT-3 est également un changement de paradigme en faveur des développeurs car ils ne sont plus doivent former leurs propres modèles. Cela libère du temps et des ressources pour une réflexion plus innovante plutôt que de simplement construire, nourrir et affiner des modèles. permettant à une base d’utilisateurs beaucoup plus large de tirer parti de l’IA. Dans l’esprit de démocratisation de l’IA et conformément à sa mission de faire en sorte que l’IA profite à toute l’humanité, OpenAI rend ainsi l’IA largement accessible, mais au détriment de la transparence.

L’espace de plus en plus dense de la communication alimentée par l’IA, comme administré par des robots ou … [+] les chatbots, peuvent être alimentés par le modèle de langage à usage général GPT-3.

alliance dpa / photo via Getty Images

Tout cela est sur le point de changer fondamentalement la dynamique non seulement dans l’espace de l’IA, mais aussi dans le monde des startups SaaS, car cela permet à une nouvelle classe de «développeurs citoyens». Tout le monde ayant un accès facile à l’IA, la principale préoccupation – outre l’utilisation sûre et responsable de l’IA et l’amélioration des systèmes d’IA pour devenir plus positifs pour l’homme – devient la défensibilité d’une idée d’entreprise basée sur l’IA. Les obstacles à la création d’idées commerciales SaaS et à la production de produits basés sur l’IA sont abaissés, ce qui est sur le point de créer un espace de démarrage d’IA plus compétitif. À l’avenir, la défensibilité et les performances commerciales supérieures peuvent ne pas provenir de l’IA sous-jacente elle-même mais de la conception du produit, des capacités de marketing ou simplement de l’exécution.

«Il existe d’innombrables façons dont GPT-3 peut être utilisé pour les entreprises. C’est comme un partenaire de conversation qui en sait plus que vous. Vous pouvez lui poser n’importe quelle question en anglais et cela vous donnera une réponse étonnamment précise – mieux qu’un humain ne le pourrait. Les cas d’utilisation sont infinis », déclare Wang, passionné d’IA et fondateur récurrent des startups alimentées par GPT-3, décrivant GPT-3 et son potentiel pour les entreprises.

Lorsque Wang était elle-même chez OpenAI, elle a travaillé sur la sortie du modèle prédécesseur de GPT-3 dans la série GPT-n, bien nommé GPT-2. Construit sur 1,5 milliard de paramètres, il était considéré à la pointe de la technologie lors de son lancement en 2019. Son plus jeune frère a maintenant 175 milliards de paramètres – plus de cent fois plus que GPT-2 et 10 fois plus que le plus grand précédent. modèle, Turing NLG de Microsoft (un fait qui a peut-être inspiré Microsoft à conclure un partenariat exclusif avec OpenAI pour obtenir une licence de la technologie GPT-3 – y compris le code source – pour leur propre usage).

Des startups construites sur GPT-3 ont vu le jour depuis son lancement en juin 2020, bien qu’il soit toujours en mode bêta privé et donc disponible uniquement pour un public limité. Les propres initiatives B2B SaaS de Wang, notamment Copysmith et companyinabox.ai, en sont deux exemples parmi tant d’autres. Dans les deux cas, une entreprise entrerait quelques mots-clés sur ses produits ou services, et des copies d’annonces, des descriptions de produits et du texte marketing ou des pages de destination à consonance shakespearienne respectivement sont générées en quelques secondes, grâce à GPT-3.

«Les startups peuvent utiliser GPT-3 de deux manières. Vous pouvez soit vendre la sortie directe du modèle de langage, soit créer un produit en plus », explique Wang, récipiendaire d’une bourse Thiel, instituée par l’icône de la technologie Peter Thiel pour promouvoir les jeunes fondateurs de startups à fort potentiel. Outre les propres startups de Wang, un exemple de la première approche est sudowrite.com, qui propose des pièces d’écriture créative basées sur une invite d’écriture. Des exemples de ce dernier sont debuild.co, qui permet aux utilisateurs de créer une page Web à partir d’une description verbale du résultat souhaité, et des chatbots étrangement humains, tels que replica.ai.

Bien que les gagnants de cette nouvelle génération de startups n’aient pas encore émergé, la plus grande question est de savoir comment le paysage des modèles de PNL et d’IA évoluera, et quelle priorité GPT-3 pourrait avoir établi pour l’avenir plus large de l’IA et des entreprises. On peut s’attendre à davantage de mouvements et de dynamiques changeantes au cours de ces prochaines années formatrices de l’espace de l’IA.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *