Démarrage de drones pour voler des palettes sans pilotes – IEEE Spectrum

L’une des forces motrices des premières recherches sur la 6G est que ces types d’applications nécessiteront des exigences de latence, de fiabilité et de bande passante extrêmes, encore plus que ne peuvent être satisfaites les améliorations stupéfiantes de la 5G par rapport à la 4G. Malheureusement, cela a abouti à une vision 6G qui est simplement « plus il y a de bits par seconde, plus il y a de bande passante et plus il y a de stations de base, mieux c’est ». En d’autres termes, l’industrie du sans fil envisage une 6G qui est une évolution de la 5G — des réseaux sans fil qui sont X ordres de grandeur meilleurs ou plus rapides ou plus fiables.

Le consensus actuel est que la 6G ne sera qu’une évolution incrémentielle de la 5G. Cette focalisation singulière signifie que deux autres niveaux de communication ont été ignorés.

L’approche n’est ni évolutive ni durable, que vous l’envisagiez en termes d’empreinte énergétique ou de déploiement de réseau et de coûts opérationnels. Malgré de multiples initiatives 6G dans le monde, le consensus actuel est que, dans l’état actuel des choses, la 6G ne sera qu’une évolution incrémentielle de la 5G.

Cela ne veut pas dire que la 6G n’inclura que les technologies déjà vues dans la 5G. La recherche sur les ondes térahertz, par exemple, pourrait ouvrir de nouvelles bandes de spectre utilisables. Le RAN ouvert pourrait rendre plus faisable le mélange et l’appariement des composants radio de différents fournisseurs, permettant aux opérateurs de réseau de créer des réseaux sans fil personnalisés hautement spécialisés. La détection et la communication intégrées, comme leur nom l’indique, permettraient de recycler les signaux sans fil en les utilisant aux deux fins (détection et communication) à la fois. Les surfaces intelligentes reconfigurables sont des surfaces manipulables qui peuvent améliorer les performances des signaux transmis en contrôlant l’impact des signaux réfléchis sur la surface, afin de fournir de meilleures capacités de détection et de réduire les interférences. L’intelligence artificielle native et l’apprentissage automatique permettraient aux radios de s’adapter à la volée aux conditions changeantes de l’environnement ou de la transmission. En outre, la 6G inclura probablement de nouvelles exigences en matière de confidentialité du réseau, de fiabilité, de résilience, de durabilité, etc.

Bien que ce soient tous des domaines de recherche intéressants et passionnants, ces technologies de communication – en fait, tous nos systèmes de communication aujourd’hui – sont encore fondamentalement enracinés dans ce que Claude Shannon appelait en 1948 le « problème technique » ou « problème de niveau A », dans son œuvre phare, Une théorie mathématique de la communication. Le niveau A stipule que la communication est le processus consistant à reproduire en un point soit exactement soit approximativement un message sélectionné en un autre point – en d’autres termes, les bits d’information au point A le font, dans le même ordre et correctement, au point B. Le la sémantique et la signification contextuelle des données sont ignorées, et tout ce qui compte est de savoir comment reproduire de plus en plus de bits d’information avec plus de précision au point B. En d’autres termes, cela conduit aux exigences extrêmes que nous voyons aujourd’hui : plus de bande passante, plus de stations de base, etc.

L’accent mis sur le problème technique a, contrairement à la mise en garde de Shannon, signifié que deux niveaux supplémentaires de communication ont été ignorés. Ce sont le problème sémantique (niveau B) et le problème d’efficacité (niveau C). Le problème sémantique concerne la précision avec laquelle les symboles transmis véhiculent le sens d’une chaîne de bits. Comparez cela au problème technique (niveau A), dans lequel l’information est dépourvue de tout contexte ou sens, mais au lieu de cela, ce qui est important, c’est de la reproduire aussi fidèlement que possible. Le problème de l’efficacité concerne la façon dont effectivement le sens inféré du destinataire correspond au sens voulu qui a été transmis. Contrairement au niveau A, les niveaux B et C font passer la communication d’une tâche de reconstruction de bits (c’est-à-dire de s’assurer que la sortie est égale à l’entrée) à un processus d’induction de « changements de comportement » parmi les appareils et les réseaux pour accomplir une tâche ou un objectif.

L’utilisation de technologies sémantiques permettrait à un appareil d’inférer des données manquantes sur la base d’indices contextuels.

Envisagez la vidéoconférence, quelque chose avec laquelle beaucoup d’entre nous sont devenus plus familiers pendant la pandémie. Dans un schéma de communication de niveau A, la vidéoconférence est réalisée en envoyant de grandes quantités de données entre les personnes en communication. Les images vidéo brutes et l’audio doivent également être codés à la source et décodés à la destination, avec des techniques de correction d’erreurs en attente pour corriger toute erreur dans la transmission.

L’inclusion de technologies de niveau B ressemblerait à quelque chose comme chaque participant à un appel vidéo prédisant et restituant localement toute partie manquante des données vidéo en cas de problème ou de problème de réseau. Actuellement, nous allouons des quantités importantes de temps, d’énergie et de ressources de calcul pour assurer une fiabilité de transmission très élevée. Mais au lieu de cela, la machine de chaque participant – qu’il s’agisse d’un ordinateur portable, d’un téléphone ou de quelque chose d’autre – « remplirait les blancs » en déduisant ce qui manquait en fonction de ce qui était arrivé. À un niveau plus profond, les machines seraient capables de reconstruire des données avec la même signification que ce qui a été envoyé, même si ce n’est pas la même au niveau bit par bit ou pixel par pixel. Les techniques d’apprentissage automatique pour ce faire existent déjà, bien qu’elles soient encore relativement nouvelles : deux exemples sont les auto-encodeurs variationnels et les réseaux accusatoires génératifs. Ce dernier en particulier a attiré l’attention ces dernières années en raison de sa capacité à développer des images deepfake.

L’utilisation de technologies sémantiques de niveau B, telles que la possibilité pour un appareil de déduire des données vidéo manquantes sur la base d’indices contextuels, réduirait également la bande passante, les débits de données et la consommation d’énergie nécessaires à la transmission des données, sans sacrifier la fiabilité. C’est le niveau C, dont vous vous souviendrez qu’il s’agit du problème d’efficacité. Vous pouvez imaginer transmettre des informations plus efficacement en envoyant un synopsis et des informations bibliographiques au lieu d’un livre entier. Dans une telle analogie, les informations transmises nécessitent moins de bande passante et de consommation d’énergie. Et la visioconférence n’est qu’un exemple. Parce que nous parlons d’une approche différente des communications, plutôt que de développer de nouvelles technologies, nous pouvons appliquer ces idées à tout type de communication.

À l’Université d’Oulu en Finlande, où je suis professeur et responsable du groupe Connectivité intelligente et réseaux/systèmes, nous travaillons sur une nouvelle vision de la recherche appelée VisionX. Notre objectif global, vers lequel nous avons commencé à travailler en 2020, est double. Premièrement, nous voulons rechercher comment mieux découvrir les concepts d’ordre supérieur – ou les représentations sémantiques – des données. Deuxièmement, nous voulons être en mesure de distiller cette compréhension et ces connaissances dans des appareils, des stations de base et des machines pour résoudre diverses tâches de raisonnement, y compris, mais sans s’y limiter, la communication, la planification des mouvements et le contrôle.

Pour déverrouiller une nouvelle génération de sans fil, nous devons nous éloigner des machines qui apprennent de la correspondance de modèles et nous orienter vers la capacité de comprendre et de raisonner sur les données et la manière dont ces données sont générées.

Si nous comprenons mieux les représentations sémantiques, nous pourrions créer des dispositifs et des technologies de communication capables de « raisonner », dans une certaine mesure, sur les informations qu’ils envoient et reçoivent. Plutôt que de diffuser aveuglément des données dans les deux sens et d’apprendre des modèles statistiques des données sans aucune capacité à comprendre Quel est envoyé – les technologies seraient capables de déduire des connaissances manquantes ou incorrectes et d’agir en conséquence. Ces capacités de raisonnement permettraient aux appareils et aux réseaux d’être plus autonomes, robustes, résilients et durables. Ils seraient capables de s’adapter et de généraliser en permanence à travers différentes tâches, environnements et types de communication.

Une autre partie importante de notre travail chez VisionX consiste à développer de nouveaux protocoles de communication à partir de données, par opposition aux règles élaborées à la main par 3GPP, l’organisme de normalisation derrière les normes cellulaires aujourd’hui. Une telle approche permettrait d’adapter les protocoles à des parties spécifiques des réseaux de communication, leur permettant d’être plus efficaces et flexibles.

En bref, nous allons au-delà des types d’apprentissage automatique qui dominent aujourd’hui – ceux qui apprennent de simples corrélations statistiques à partir de données (ce que nous appelons l’apprentissage automatique « système 1 », pour emprunter un concept du livre influent du psychologue Daniel Kahneman, Pensée, rapide et lente, sur la cognition humaine). Nous développons des méthodes de communication sémantique qui intègrent l’apprentissage machine « système 2 » qui sont capables de raisonnement. Surtout, ce serait également une base entièrement différente pour la construction de la 6G que l’approche actuelle de la 5G+ qui est déjà en cours.

Cela dit, il reste encore beaucoup de grands défis à relever pour faire de VisionX une réalité. L’un des défis est de savoir comment et dans quelles conditions la communication coopérative entre les agents – un terme fourre-tout englobant les stations de base cellulaires, les personnes utilisant des téléphones portables et des ordinateurs portables, des drones, etc. – émerge pour résoudre une tâche commune ? Nous devons également être en mesure de mesurer une communication et une signalisation efficaces d’une manière ou d’une autre, afin de pouvoir quantifier si les agents agissent en fonction des informations reçues plutôt que de les ignorer en faveur de leurs propres informations locales tout en prenant des décisions.

Sur le plan de l’apprentissage automatique, nous devons nous éloigner des machines qui apprennent à partir des corrélations dans les données – en d’autres termes, la correspondance de modèles – et vers la capacité de comprendre et de raisonner sur les données et la façon dont ces données sont générées. Les machines doivent également être capables de communiquer leurs compréhensions et leurs raisonnements entre elles pour construire avec succès de nouveaux protocoles de communication à partir des données.

De plus, pour résoudre le problème de niveau C (efficacité), nous devons nous assurer que ce type de communication sémantique est plus durable et efficace que les communications de niveau A. Alors que les communications sémantiques dépensent moins d’énergie pour envoyer des bits – car moins de bits doivent être envoyés et moins de corrections d’erreurs sont nécessaires – il y a toujours des coûts de calcul encourus par l’apprentissage automatique. En termes de durabilité et d’efficacité des ressources, bien que d’un ordre de grandeur plus efficace que la communication Shannon en termes de transmission de moins de bits, la communication sémantique peut entraîner des coûts de calcul qui doivent être caractérisés. Nos résultats préliminaires ont montré comment une communication sémantique peut émerger entre deux agents ayant un contexte partagé, en raisonnant l’un avec l’autre. Nous nous sommes spécifiquement inspirés des deux modes de cognition chez les humains décrits par Kahneman. Dans le premier mode (communication sémantique du système 1), un agent extrait tous les concepts d’un ensemble de données pour les communiquer à l’autre agent. Dans le second mode (communication sémantique du système 2), un agent ne communique que le nombre de concepts le plus minimal et le plus efficace au second, qui utilise ensuite son propre raisonnement pour déduire ce qui est communiqué. Nous avons constaté que l’approche du système 2 entraînait une communication plus efficace et fiable par rapport au système 1. Cependant, cette recherche ne représente qu’une fraction de la recherche que nous devons encore faire.

Si nous cherchons véritablement à débloquer une nouvelle génération de sans fil qui serait radicalement différente des précédentes, nous devons revenir aux fondamentaux au lieu de poursuivre des avancées progressives. La 6G ne sera peut-être pas commercialisée avant 2030, mais le gros du travail se passe maintenant. VisionX est une occasion de revenir aux racines de la communication et de repartir à zéro, plutôt que de poursuivre des avancées finalement non durables et non évolutives de la même chose.

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *