Archives de tags : Datasets

Décryptages du gf2i : Comment protéger ses données face aux utilisations des datasets des IA ? Analyse et parades face aux nouvelles techniques de piratage.

(Page)

Jeudi 25 avril 2024, le gf2i accueillait Jean-Frédéric FARNY, Directeur Général de la société ADAY pour son 8e Décryptage sur le thème « Comment protéger ses données face aux utilisations des datasets des IA ? Analyse et parades face aux nouvelles techniques de piratage ». Après avoir rappelé le contexte d’accélération récente de l’IA et des perspectives qu’elle offre, Jean-Frédéric FARNY a souligné que les Large Language Models (LLM) à la base des services d’IA générative (SIAG) ont un appétit sans fin de données de qualité. Certains modèles se forment à partir de données commercialisées à des fins d’entraînement, tandis que d’autres se nourrissent des données librement accessibles sur Internet. Ces pratiques interrogent quant à la qualité des données collectées et, surtout, sur le respect du droit d’auteur et des droits voisins, l’impact étant particulièrement important pour les médias. Distributeur de contenus numériques depuis 4 décennies, ADAY a procédé à une cartographie de l’origine des données qui alimentent les principales plateformes d’IA. ADAY encourage l’adoption d’une démarche collective pour la mise en place d’un consortium permettant le déploiement, d’une part, d’un système d’authentification des contenus et, d’autre part, de technologies permettant aux éditeurs de contrôler, en véritables acteurs de marché, l’accès à… Voir l’article