Pièges courants que les startups du Deep Learning ne reconnaissent pas

Aujourd’hui, les applications importantes de l’IA sont reconnues dans le monde pour résoudre des problèmes complexes. L’IA et sa branche, le deep learning ont considérablement contribué à travers le secteur avec la traduction automatique, le traitement du langage naturel et la vision par ordinateur. Et au cours des dernières années, nous avons assisté à une poussée des startups d’apprentissage en profondeur, mais comme toutes les autres basées sur des logiciels, ces startups rencontrent des pièges, mais ces erreurs leur sont un peu uniques.

Ne pas investir suffisamment dans les données et les processeurs puissants

Les principales raisons du succès de toute startup en apprentissage profond sont les données et le calcul. Les GPU réduisent le temps nécessaire aux calculs, ils réduisent les semaines de temps de calcul en quelques heures et puis il y a les TPU qui prennent encore moins de temps.

La réduction du temps nécessaire à la formation des modèles est une marque importante pour toute entreprise ou startup, et c’est pourquoi il devient impératif d’investir intelligemment dans les GPU. On peut acheter leurs propres GPU ou tirer parti des services Web d’Amazon ou des services Google Cloud.

Un autre aspect essentiel en matière d’apprentissage en profondeur est les données. Les chances sont que le démarrage de l’apprentissage en profondeur pourrait ne pas réussir du tout si l’on ne se concentre pas sur les données. Il y a quelques erreurs courantes que les startups doivent éviter en ce qui concerne les données:

Ignorer complètement certaines des données non traitées et collecter des données inutiles peut avoir un impact négatif sur l’efficacité des modèles.

Manque de données: peut-être, pour éviter certaines erreurs, on peut entraîner le modèle sur moins de données, mais cela crée aussi des problèmes. On ne peut pas former un modèle sur 5-6 photos d’une race de chien coréen Jindo pour le différencier dans une meute de loups.

Beaucoup de données: Mais, la formation du modèle sur trop de photos de chiens pourrait éventuellement conduire le modèle à identifier le renard comme une race de chien. Il faut donc garder l’équilibre entre le biais et la variance.

Un bon exemple est un biais dans les systèmes d’IA, un problème où même les entreprises de premier ordre ne parviennent pas à fournir de la clarté en raison de la quantité de données utilisées; Biais de reconnaissance de l’Amazonie.

Qualité des données: autant de données que l’on donne au système, il faut aussi garder à l’esprit la qualité des données. Regardez ce qui s’est passé avec Watson d’IBM, avec autant de battage médiatique produit autour de lui donnant des conseils précis sur le traitement du cancer, à la fin quand il a été examiné, il s’est avéré qu’il donnait des conseils erronés.

De tels mésaventures lorsqu’il s’agit de résoudre des problèmes généraux représentent un gros risque et il faut faire attention à la qualité des données. La raison pour laquelle le résultat était erroné était qu’ils avaient formé le modèle sur un petit nombre de patients cancéreux hypothétiques et non sur les vrais.

Ne pas tenir compte des frais de cloud

La plupart des applications d’IA ressemblent à des logiciels ordinaires, mais le centre de toute application d’IA est un modèle de données qualifié.

Les modèles effectuent de nombreuses tâches complexes comme la transcription de la parole, la génération d’un langage naturel et un travail similaire au logiciel en tant que service (SaaS). Plus l’application logicielle est volumineuse et les tâches plus complexes qu’elle effectue, plus la facture qu’elle génère est élevée. Ainsi, on peut présumer du nombre de factures que l’IA pourrait générer.

En ce qui concerne les démarrages de logiciels, auparavant, le coût de fonctionnement du logiciel sur les ordinateurs de bureau ou les serveurs devait être payé par l’acheteur. Dans le marché dominant actuel du SaaS, les startups logicielles doivent investir beaucoup moins qu’auparavant, car le coût a été repoussé au fournisseur et la plupart des éditeurs de logiciels paient AWS ou Azure chaque mois pour les services qu’ils utilisent.

Le système d’IA génère de nombreuses factures, même avec une simple formation, un recyclage et une évaluation du modèle. En outre, la charge ainsi que les coûts augmentent lors de l’utilisation des types de données d’images, audio et vidéo en raison de la nécessité d’un calcul haute performance.

Les opérations cloud pour faire évoluer les modèles d’IA à l’échelle mondiale ne sont pas les mêmes dans toutes les régions. Par conséquent, les startups d’apprentissage profond ou d’apprentissage automatique essaient toujours de transférer les modèles formés à travers les régions du cloud qui génèrent des coûts d’entrée et de sortie élevés pour améliorer la fiabilité et la latence.

Nettoyage coûteux des données

Nous savons tous que la formation du modèle une fois ne suffit pas pour obtenir un résultat de pointe, il faut le recycler pour des résultats plus précis.

La formation du modèle de nos jours pour obtenir les résultats les plus récents implique beaucoup de nettoyage manuel et d’étiquetage de grands ensembles de données. Et le processus de nettoyage et d’étiquetage manuel est coûteux et constitue l’un des plus grands obstacles auxquels les startups d’apprentissage en profondeur doivent faire face.

Un autre domaine où une intervention humaine est nécessaire est celui où beaucoup de raisonnement cognitif est requis, le meilleur exemple étant les voitures autonomes.

Bien que le temps passe, les systèmes d’IA évoluent vers une automatisation complète, ce qui réduira considérablement les coûts. Cependant, ces applications d’automatisation basées sur l’IA nécessitent encore une intervention humaine pour les années à venir. Même s’il y a une automatisation complète, il n’est pas clair dans quelle mesure la marge de coût et d’efficacité s’améliorera, il s’agit donc de savoir s’il faut investir dans des processus comme l’apprentissage par dérive et l’apprentissage actif pour améliorer la capacité.

Non seulement coûteuse, l’intervention humaine entrave parfois la créativité du système, mais ils peuvent également le faire en sélectionnant ce qui est essentiel pour un algorithme à traiter ou en n’utilisant pas l’apprentissage en profondeur pour un problème qu’il peut facilement résoudre. Souvent, l’apprentissage en profondeur est perçu comme excessif pour de nombreux problèmes.

Les coûts engendrés par l’intervention humaine et le cloud sont interdépendants. La réduction de l’un signifie une augmentation de l’autre. En outre, les startups ne sont pas les seules à souffrir du problème du nettoyage des données, les géants des médias sociaux comme Facebook ont encore du mal à garder le contenu haineux et le contenu à motivation politique hors de leurs plates-formes, même s’ils utilisent des technologies de pointe pratiques d’apprentissage.

Les cas Edge

De nombreuses startups d’apprentissage en profondeur ou startups de l’IA souffrent de cas marginaux. Les utilisateurs d’applications ou de services basés sur l’IA peuvent et vont entrer n’importe quoi dans une application d’intelligence artificielle en pensant qu’elle s’occupe du reste. Les utilisateurs pensent parfois que l’IA a de super capacités pour traiter toutes les données qui ont été insérées; ceux qui traitent les répercussions sont l’équipe d’apprentissage en profondeur de l’entreprise ou de la startup.

Ce qui se passe dans les cas marginaux, c’est que les utilisateurs finissent par fournir des quantités d’entrée énormes et différentes. Chaque entrée client génère ensuite des données qui sont nouvelles pour le système et quelque chose qu’il n’a jamais vu auparavant. Ensuite, les startups doivent exécuter une collecte de données dédiée et un réglage fin du modèle pour chacun des engagements clients, ce qui pourrait réduire les cas marginaux mais entraîner de nombreux coûts jusqu’à ce que la précision du modèle atteigne un certain niveau. De telles situations entravent finalement l’évolutivité du système d’IA.

Embaucher les bonnes personnes

Des outils tels que Keras, PyTorch et Tensorflow ont rendu l’apprentissage en profondeur plus accessible, et il est devenu relativement facile de faire en sorte que l’apprentissage en profondeur fonctionne, mais, pour quelque chose de révolutionnaire, plus de familiarité, de calcul élevé et des connaissances approfondies sont nécessaires.

Il faut veiller à ce que leur équipe d’apprentissage en profondeur puisse créer quelque chose au-delà des simples tâches de copier-coller. Plutôt que de se concentrer sur l’embauche de docteurs, ils devraient s’efforcer de comprendre le personnel qui va travailler pour vous.

Pensées de clôture

Bien que la mise en place d’une boutique d’apprentissage en profondeur soit une tâche difficile, certains des leaders de l’industrie recommandent de se concentrer et de choisir le domaine problématique et d’essayer de réduire la complexité des données. Avec la croissance massive du marché de l’IA et l’augmentation attendue de 9,5 milliards de dollars en 2018 à 118,6 milliards de dollars en 2025, pour éviter certains écueils, trouver un problème de niche et choisir de ne pas travailler sur des problèmes plus larges comme les suggestions de texte générales pour éviter les obstacles habituels.

Vous avez aimé cette histoire? Rejoignez notre groupe Telegram. Et faites partie d’une communauté engageante.

Donnez vos commentaires ci-dessous

commentaires