Comment protéger ses données personelles de l’intelligence artificielle?

le mardi 30 janvier 2024

Les intelligences artificielles (IA) telles que ChatGPT d’OpenAI ont besoin d’une quantité phénoménale de données pour s’entraîner et s’améliorer. Ceci soulève des questions quant à la protection de nos données personnelles. Quel est le rapport entre la collecte de « big data » et l’IA? Quels sont les trucs que l’on peut appliquer pour se protéger?

L’intelligence artificielle bouleverse littéralement nos vies depuis peu, alors qu’elle s’immisce de plus en plus dans nos vies.

Les innovations générées par l’IA ont le potentiel de nous aider dans une foule de discipline, que ce soit en science, en médecine, en éducation et bien plus.

Seulement, pour que ces diverses technologies d’intelligences artificielles sur le marché puissent s’améliorer et devenir de plus en plus efficaces, elles ont besoin d’énormément de données.

Des données qui peuvent s’avérer être nos données personnelles, et ce, sans même qu’on ne s’en rende compte.

Il existe heureusement des trucs que l’on peut appliquer pour réduire le nombre de données collectées à notre insu ou bien il existe des logiciels comme Incogni pour nous aider à faire le ménage.

Quel est le lien entre l’intelligence artificielle et les données personnelles?

OpenAI a propulsé la popularité de l’intelligence artificielle avec son robot conversationnel ChatGPT.

Seulement, il y a beaucoup d’autres compagnies qui travaillent à perfectionner leur propre intelligence artificielle. Certaines ont pour aspirations de détrôner ChatGPT, d’autres veulent devenir des références dans leurs domaines d’expertise précises.

Toujours est-il que toutes ces intelligences artificielles ont besoin d’être entraînées pour pouvoir s’améliorer.

Prenons la reconnaissance d’image par exemple. L’IA a besoin de se faire dire à quoi ressemble une banane. Seulement, elle a besoin de se le faire répéter à de nombreuses reprises selon différents angles ou couleur de la pelure.

C’est un exemple anodin, mais n’empêche que l’IA a besoin de se faire indiquer des milliers, voir des millions de fois, à quoi ressemble chaque objet pour son développement et être en mesure ensuite de bien les reconnaître.

Que ce soit pour la reconnaissance d’image, la reconnaissance vocale, la reconnaissance de l’écrit, la génération de contenus ou pour toutes autres tâches, et bien elles ont besoin de quantité massive de données.

Ces données, les compagnies vont les puiser sur internet ou en faisant affaire avec des courtiers de données (data broker).

Il s’agit de compagnies qui collectent massivement des données personnelles pour les revendre à de tierces parties.

Ça peut autant être à des entreprises pour de la publicité ciblée ou bien des compagnies d’intelligence artificielle désireuse d’avoir des données d’entraînement.

Comment l’IA traite les données?

La collecte massive de données personnelles par les entreprises d’IA permet à leurs technologies d’offrir de meilleurs résultats. À travers leur base de données gigantesque, elles peuvent réaliser des innovations qui peuvent nous venir en aide dans nos vies personnelles et professionnelles.

Le contrecoup cependant c’est que ça représente sans conteste un risque pour nos données, nos renseignements personnels et donc notre vie privée.

On doit placer une confiance aveugle en ces compagnies d’intelligence artificielle pour qu’ils prennent bien soin de nos données.

Or, quand on voit les politiques d’utilisation de certaines compagnies et le manque de transparence d’autres, on n’est pas nécessairement rassuré.

C’est sans compter que comme elles gardent toutes ces données, il y a évidemment des risques de fuites. Fuites qui peuvent se déverser sur le dark web par exemple où nous pourrions être la proie de cybercriminelles.

On pourrait être la cible de tentatives d’hameçonnage, de harponnage, de « whaling« , de fraudes et même d’un vol d’identité.

L’idée n’est absolument pas loufoque alors que des fraudeurs pourraient très bien utiliser notre voix notamment. C’est sans compter la technique de l’hypertrucage (deepfake) en utilisant notre visage.

On commence de plus en plus à voir ce type de fraudes et c’est une tendance qui n’ira malheureusement pas à la baise.

Quoi faire pour protéger ses données de l’IA?

Les préoccupations sont nombreuses concernant nos données personnelles, mais le mot d’ordre demeure le même qu’avant l’avènement de l’intelligence artificielle. C’est-à-dire qu’on doit bien réfléchir à ce qu’on partage sur internet, mais aussi à ces fameuses IA!

Forcément, si on fournit une panoplie de rapports liés à notre travail à ChatGPT pour qu’ils nous produisent des résumés de ceux-ci, bien on cède ces données à ChatGPT…

Oui on obtient un gain d’efficacité alors qu’on passe bien moins de temps à lire ces rapports, mais à quel prix le fait-on?

C’est un exemple parmi tant d’autres simplement pour rappeler que tout ce qu’on partage à une IA est gardé par cette IA.

Ensuite, on le disait précédemment, les IA s’entraînent à l’aide de données. Des données collectées sur internet.

Encore là, on doit réfléchir à la pertinence de tout ce qu’on y publie. Si on diffuse plusieurs vidéos de nous sur les réseaux sociaux, il ne faut pas s’étonner qu’on augmente les chances que notre voix et notre visage soient utilisés pour entraîner une IA. Le tout pourrait ensuite se tourner contre nous via une fraude de deepfake.

Est-ce dire qu’on ne doit plus rien publier? Pas forcément.

Seulement il reste la question des collecteurs de données. Eux aussi collectent des données qu’ils peuvent revendre aux compagnies d’IA.

Qu’est-ce qu’on peut faire contre eux?

Si on publie moins de contenu, on leur en donne moins forcément, mais il reste qu’on peut aussi utiliser des solutions comme Incogni pour aider à supprimer ce qu’ils collectent.

Incogni est un service en ligne produit par la compagnie de cybersécurité NordVPN.

Il va un peu agir comme un cabinet d’avocats. Il va cogner à la porte de toutes ces entreprises agrégatrices de données et leur exigeant de supprimer nos informations.

En se créant un compte, on mandate Incogni à faire effacer nos données personnelles auprès de multiples firmes de courtage de données.

Faire ça soi-même est possible, mais c’est une tâche titanesque, puisqu’on ne sait pas qui a nos données ni nos recours juridiques. Surtout quand les compagnies ne sont pas basées au Canada!

Après la création de notre compte sur Incogni, ce dernier envoie des requêtes. Nous l’avons essayé et c’est littéralement 86 demandes qui ont été envoyées après la création de notre compte!

On peut rapidement voir à qui les requêtes ont été envoyées, quels types de données ces entreprises ont entre leur main, puis le statut de la requête.

Ça demeure une solution super facile à utiliser et qui ne coûte pas très cher à environ 6$ par mois.

En savoir plus

 
Cette chronique contient des liens d’affiliations. Apprenez-en plus.