À quoi correspond le scraping de données sur LinkedIn ? Est-ce une pratique légale ? Quelles sont les conditions pour qu’une extraction de contenu comportant des données sur internet soit légale ?
Certains sites et réseaux sociaux ont la capacité de collecter massivement les données personnelles de leurs utilisateurs. Ces données, qui ont une grande valeur marchande, peuvent faire l’objet de récupération par d’autres entreprises, ce qui est source de nombreux contentieux.
Toutes ces questions qui font l’actualité du droit du numérique doivent être finement envisagées afin d’éviter tout comportement illicite et de lourdes sanctions.
Maître Yoram Kouhana, avocat spécialisé en droit du numérique et en droit de la propriété intellectuelle, décrypte pour vous la question du web scraping sur LinkedIn.
Qu’est-ce que le scraping ?
Le scraping ou le « web scraping » est une pratique qui consiste à extraire le contenu de sites Internet ou de plateforme en ligne, par le biais de logiciels ou de script, de manière à collecter automatiquement les données présentes sur le site.
Cette pratique, qui est de plus en plus répandue, a donné lieu à de nombreuses affaires récentes en raison de conditions illicites d’utilisation. En effet, certaines entreprises ont tenté de récupérer les données personnelles collectées massivement par des sites Internet tels que le réseau social professionnel LinkedIn, sans obtenir le consentement de l’éditeur du site, ni de l’hébergeur des données ou des personnes physiques concernées derrière ces données.
Le web scraping est donc une pratique qui mérite d’être connue et encadrée afin de rester conforme aux exigences législatives et réglementaires en la matière.
Qu’est-ce qui est autorisé en matière de web scraping ?
L’article L.342-3 du Code de la propriété intellectuelle traite de la question de l’extraction de contenu sur les bases de données et détermine les limites de ce qui est autorisé et interdit en ce qui concerne le web scraping.
En substance, cet article énonce que, lorsqu’une base de données est mise à la disposition du public par son titulaire, sont autorisées :
- L’extraction ou la réutilisation d’une partie non substantielle, appréciée de façon qualitative ou quantitative, du contenu de la base, par la personne qui y a licitement accès. En d’autres termes, le titulaire de la base de données, ou du site web donnant accès à son annuaire de données, peut délimiter dans ses conditions générales dans quelle mesure l’extraction ou la réutilisation d’une faible partie de son contenu est autorisée. Il ne s’agit donc pas de laisser une liberté complète à l’extraction et à la réutilisation de l’ensemble des données collectées, mais seulement à une éventuelle faible partie du contenu.
- Lorsque l’extraction est mise en œuvre à des fins privées, et donc non commerciales, elle peut être autorisée dans une mesure qualitativement ou quantitativement substantielle, c’est-à-dire dans une mesure plus importante que s’agissant de la première option, à condition que les dispositions législatives et réglementaires en matière de droits d’auteurs et de droits voisins sur les œuvres ou les éléments incorporés dans la base, soient respectés.
- L’extraction et la réutilisation d’une partie substantielle, appréciée de façon qualitative ou quantitative, à des fins exclusives d’illustration dans le cadre de l’enseignement et de la recherche et pour un public composé d’élèves, d’étudiants, d’enseignants ou de chercheurs directement concernés. Ainsi, ce cas de figure étant limité à des fins pédagogiques, il est totalement exclu de faire usage des données extraites à titre commercial par exemple.
Attention donc aux termes et conditions contenus dans les conditions générales d’utilisation (CGU) des sites Internet et des plateformes en ligne dont vous êtes l’internaute ou l’utilisateur. En effet, chaque site Internet a la possibilité d’adapter ces dispositions à sa propre situation afin de permettre une meilleure protection de ses intérêts.
A titre d’exemple, LinkedIn interdit la réutilisation des données que le site contient à des fins commerciales. Les CGU de LinkedIn disposent que :
« Vous vous engagez à ne pas développer, prendre en charge ou utiliser des logiciels, des dispositifs, des scripts, des robots ou tout autre moyen ou processus (notamment des robots d’indexation, des modules d’extension de navigateur et compléments, ou toute autre technologie) visant à effectuer du web scraping des Services ou à copier par ailleurs des profils et d’autres données des Services ».
Dans ce type d’hypothèse, l’extraction et la réutilisation des données sur un site comme celui de LinkedIn vous expose à des sanctions.
Quelles sont les sanctions en cas de web scraping illicite ?
La Commission Nationale de l’Informatique et des Libertés (CNIL) est l’autorité administrative chargée de faire appliquer les dispositions liées à la protection des données personnelles, notamment celles contenues dans les fichiers et traitements informatiques. Il est important de savoir que la CNIL a un pouvoir de contrôle et de sanction.
Cette autorité a eu l’occasion de se prononcer sur des pratiques de web scraping litigieuses et a prononcé de nombreuses et lourdes sanctions financières. Au début de l’année 2021, la CNIL a condamné la société Nestor, entreprise dédiée à la vente et à la livraison de repas sur les lieux de travail, à une amende de 20 000 euros pour pratiques illicites de web scraping.
La CNIL a considéré que la société Nestor avait construit sa base de prospects en ayant recours à la pratique de web scraping à partir de données accessibles sur le réseau social professionnel LinkedIn. Parmi les infractions retenues par la CNIL à l’encontre de Nestor, il lui était notamment reproché d’avoir pratiqué la sollicitation commerciale de prospects identifiés via LinkedIn sans recueillir de consentement, que ce soit de la part des utilisateurs ou du réseau social.
Ainsi, en l’absence de tout consentement des personnes physiques concernées, la CNIL a conclu à une violation des dispositions du règlement général sur la protection des données (RGPD). De plus, les messages envoyés aux prospects étaient sans lien avec leur activité professionnelle et leur présence sur le site LinkedIn.
Outre les risques de sanctions prononcées par la CNIL, toute personne ou entreprise qui procéderait à une extraction et à une réutilisation de données contenues sur un site web s’expose à des poursuites judiciaires de la part de ce dernier, aussi bien sur le fondement de l’article L.342-3 du Code de la propriété intellectuelle que sur le fondement de la concurrence déloyale sur la base de l’article 1240 du Code civil. En effet, l’utilisation illicite des données légitimement collectées par une entreprise tierce lui cause un préjudice dont l’indemnisation peut être demandée devant les tribunaux.
L’importance de se faire accompagner par un avocat spécialisé
Si votre entreprise a été victime d’une extraction et d’une utilisation illicite de données légalement collectées par vos soins, il convient de prendre toutes les mesures nécessaires pour protéger vos droits et ceux des personnes physiques dont les données ont été collectées.
En pareille hypothèse, il est vivement conseillé de faire appel à un avocat expérimenté et spécialisé en droit du numérique afin d’éviter les écueils et encadrer sa documentation juridique.