Des intelligences artificielles qui apprennent grâce à des données
Aujourd’hui, nous allons parler des intelligences artificielles, ou « IA » en abrégé. Les IA sont des programmes informatiques très puissants qui peuvent apprendre à partir de données. Par exemple, pour entraîner une IA à reconnaître des images de chats, on lui montre des milliers d’images de chats. L’IA va ensuite analyser ces images pour trouver des motifs et des caractéristiques communes à tous les chats, afin de pouvoir reconnaître un chat quand elle en verra un.
Google possède une immense base de données pour les IA
Google est une entreprise qui possède beaucoup d’IA très avancées. Pour les entraîner, Google dispose d’une immense base de données contenant des milliards de pages web. Ça représente l’équivalent de plusieurs milliers de bibliothèques !
Des contenus problématiques dans la base de données de Google
Récemment, une enquête menée par le journal américain « Washington Post » a découvert que la base de données de Google contenait des contenus problématiques. Plus précisément, ils ont trouvé des contenus violents, racistes, sexistes, antisémites et conspirationnistes. Ce sont des contenus qui ne devraient pas être associés à des IA intelligentes.
Les IA peuvent reprendre ces contenus problématiques
Mais pourquoi est-ce un problème, me demanderez-vous ? Et bien, c’est simple : les IA peuvent apprendre des contenus qu’on leur montre. Si Google utilise des pages web contenant des propos racistes pour entraîner ses IA, les IA peuvent ensuite utiliser ces mêmes propos dans leurs propres réponses. Par exemple, un chatbot (un programme conversationnel) qui a été entraîné avec des données problématiques pourrait répondre à une personne en utilisant des termes racistes sans même s’en rendre compte.
En conclusion
Les technologies de l’IA sont très prometteuses, mais nous devons faire attention à ce que nous leur apprenons. Les contenus problématiques doivent être éliminés des bases de données utilisées par les IA, pour que ces dernières ne reproduisent pas ces mêmes problèmes dans leur propre fonctionnement. En attendant, nous pouvons tous être vigilants face aux propos qui nous sont présentés sur le web.