À quoi correspond le scraping de données sur Linkedin ? Est-ce légal ? Quelles sont les conditions pour qu’une extraction de contenu contenant des données sur internet soit légale ?
Alors que certains sites et réseaux sociaux ont une capacité à collecter massivement les données personnelles de leurs utilisateurs, la récupération de ces données par d’autres entreprises fait l’objet de nombreux contentieux. Toutes ces questions qui font l’actualité du droit du numérique doivent être finement envisagées afin d’éviter tout comportement illicite et s’exposer à de lourdes sanctions.
Me Yoram Kouhana, avocat spécialisé en droit du numérique et en droit de la propriété intellectuelle décrypte pour vous la question du web scraping sur Linkedin.
Qu’est ce que le scraping ?
Le scraping ou le “web scraping” est une pratique qui consiste à extraire le contenu de sites web ou de plateforme en ligne, par le biais de logiciels ou de script, de manière à collecter automatiquement les données présentes sur le site.
Cette pratique est de plus en plus répandue et a donné lieu à de nombreuses affaires ces dernières années causées par des activités illégales de web scraping. Certaines entreprises ont ainsi tenté de profiter des données personnelles collectées par des sites web tels que le réseau social professionnel Linkedin, sans obtenir le consentement du titulaire des données, ni des personnes concernées.
Le web scraping est donc une pratique qui mérite d’être connue et encadrée afin de rester conforme aux exigences législatives et réglementaires en la matière.
Qu’est ce qui est autorisé en matière de web scraping ?
L'article L.342-3 du Code de la propriété intellectuelle traite de la question de l’extraction de contenu sur les bases de données. Cet article détermine les limites de ce qui est autorisé et interdit en ce qui concerne le web scraping.
En substance, l’article du code de la propriété intellectuelle énonce que lorsqu’une base de données est mise à la disposition du public par son titulaire, les pratiques suivantes sont autorisées :
- L'extraction ou la réutilisation d'une partie non substantielle appréciée de façon qualitative ou quantitative, du contenu de la base, par la personne qui y a licitement accès. En d’autres termes, le titulaire de la base de données, ou du site web donnant accès à son annuaire de données, peut délimiter dans ses conditions générales dans quelle mesure l’extraction ou la réutilisation d’une faible partie de son contenu est autorisée. Il ne s’agit donc pas de laisser une liberté complète à l’extraction et à la réutilisation de l’ensemble des données collectées mais seulement à une éventuelle faible partie du contenu.
- Lorsque l’extraction est mise en oeuvre à des fins privées, et donc non commerciales, elle peut être autorisée dans une mesure qualitativement ou quantitativement substantielle, c’est à dire dans une mesure plus importante que s’agissant de la première option, à condition que les dispositions législatives et réglementaires en matière de droits d’auteurs et de droits voisins sur les oeuvres ou les éléments incorporés dans la base, soient respectés.
- L’extraction et la réutilisation d’une partie substantielle, appréciée de façon qualitative ou quantitative, à des fins exclusives d’illustration dans le cadre de l’enseignement et de la recherche et pour un public composé d’élèves, d’étudiants, d’enseignants ou de chercheurs directement concernés. Ainsi, ce cas de figure étant limité à des fins pédagogiques, il est totalement exclu de faire usage des données extraites à titre commercial par exemple.
Attention donc aux termes et conditions contenus dans les conditions générales d’utilisation (CGU) des sites et des plateformes dont le contenu vous intéresse. En effet, chaque site web a la possibilité d’adapter ces dispositions à sa propre situation afin de permettre une meilleure protection de ses intérêts.
À titre d’exemple, Linkedin interdit la réutilisation des données que le site contient à des fins commerciales. Les CGU de Linkedin disposent que :
« Vous vous engagez à ne pas développer, prendre en charge ou utiliser des logiciels, des dispositifs, des scripts, des robots ou tout autre moyen ou processus (notamment des robots d’indexation, des modules d’extension de navigateur et compléments, ou toute autre technologie) visant à effectuer du web scraping des Services ou à copier par ailleurs des profils et d’autres données des Services ».
Dans ce type d’hypothèse, l’extraction et la réutilisation des données sur un site comme celui de Linkedin vous expose à des sanctions.
Quelles sont les sanctions en cas de web scraping illicite ?
La CNIL, Commission Nationale de l'Informatique et des Libertés, est l’autorité administrative chargée de faire appliquer les dispositions liées à la protection des données personnelles notamment contenues dans les fichiers et traitements informatiques. Il est important de savoir que la CNIL a un pouvoir de contrôle et de sanction.
Cette autorité a eu l’occasion de se prononcer sur des pratiques de web scraping litigieuses et a prononcé de nombreuses et lourdes sanctions financières au cours de l’année 2020. Plus récemment, au début de l’année 2021, la CNIL a condamné la société Nestor, entreprise dédiée à la vente et à la livraison de repas sur les lieux de travail, à payer une amende de 20 000 euros pour pratiques illicites de web scraping.
La CNIL a considéré que la société Nestor avait construit sa base de prospects en ayant recours à la pratique de web scraping à partir de données accessibles sur le réseau social professionnel Linkedin. L’une des infractions retenues par la CNIL était d’avoir pratiqué la sollicitation commerciale de prospects identifiés via Linkedin alors qu’aucun consentement n’avait été obtenu, ni de la part des utilisateurs, ni de la part du réseau social.
Ainsi, la CNIL a considéré que les dispositions en matière de RGPD (règlement général sur la protection des données), n’étaient pas respectées puisqu’aucune mesure permettant le recueil du consentement des personnes intéressées n’avait été employée. De plus, les messages envoyés aux prospects étaient sans lien avec leur activité professionnelle et leur présence sur le site Linkedin.
Outre les risques de sanctions prononcées par la CNIL, toute personne ou entreprise qui procéderait à une extraction et à une réutilisation de données contenues sur un site web s’expose à des poursuites judiciaires de la part de ce dernier, aussi bien sur le fondement de l’article L.342-3 du Code de la propriété intellectuelle que sur le fondement de la concurrence déloyale. En effet, l’utilisation illicite des données légitimement collectées par une entreprise tierce lui cause un préjudice dont l’indemnisation peut être demandée devant les tribunaux.
L’importance de se faire accompagner par un avocat spécialisé
Si votre entreprise a été victime d’une extraction et d’une utilisation illicite de données légalement collectées par vos soins, il convient de prendre toutes les mesures nécessaires pour protéger vos droits et ceux des personnes dont les données ont été collectées.
Ainsi, dans ce type de situations, il est vivement conseillé de faire appel à un avocat expérimenté et spécialisé en droit du numérique afin d’éviter les écueils et encadrer sa documentation juridique.
Une question ? Laissez votre commentaire