185 connectés     5 775 missions IT     30 109 CV récents
se connecter | s'inscrire
Tous les Forums Le café de Freelance-info




Scraping est-il légale ?


Scraping est-il légale ?

   Page 1 de 1
31/07/20 à 16:28
Amazigh21
Freelance
discret
Inscrit le 19 Juin 2019
Messages: 24
Bonjour,

Je suis entrain de dev un petit outil pour qu'il récupère quelques contenus sur des sites.

Donc je le demande est ce que c'est légale de faire ça ?

Il existe bien des comparateurs de prix des vols, hébergement...
Donc je me dis que, non, ce n'est pas illégale .

Mais j'aimerais bien avoir votre expértise.


Merci pour votre réponse.

Voir le profil de l'utilisateur    
01/08/20 à 04:23
hmg
Conseiller entreprise
avatar
Grand Maître
Inscrit le 09 Jan 2005
Messages: 25358
Bonjour,

Tout dépend.

Du côté documents récupérés :
- ils sont en libre accès ?
- ils sont libres de droits ?
- ils datent de quand ?
- ils sont dans quel pays ?
- leur auteur est identifié ?
- possible de demander autorisation selon usage ?
...

Du côté usage :
- les sources seront citées ?
- usage pro ou privé ?
- utilisation dans quel pays ?
...

Le droit d'auteur est très protégé en France.
Ne prenez pas trop de risques.


_________________
Cordialement,

- HMG - hmg_71@yahoo.fr
Expert comptable - Paris - www.hmgec.com
Pensez à regarder le contexte et la date des réponses. Elles ne s'appliquent pas toujours à tous les cas.
Voir le profil de l'utilisateur    
01/08/20 à 12:47
spiralis
Freelance
impliqué
Inscrit le 29 Déc 2008
Messages: 196
Amazigh21 a écrit:
Bonjour,

Je suis entrain de dev un petit outil pour qu'il récupère quelques contenus sur des sites.

Donc je le demande est ce que c'est légale de faire ça ?

Il existe bien des comparateurs de prix des vols, hébergement...
Donc je me dis que, non, ce n'est pas illégale .

Mais j'aimerais bien avoir votre expértise.


Merci pour votre réponse.


Vous voulez parler sûrement de scraping et pas de scaffolding Smile

Voir le profil de l'utilisateur    
01/08/20 à 13:51
Amazigh21
Freelance
discret
Inscrit le 19 Juin 2019
Messages: 24
hmg a écrit:
Bonjour,

Tout dépend.

Du côté documents récupérés :
- ils sont en libre accès ?
- ils sont libres de droits ?
- ils datent de quand ?
- ils sont dans quel pays ?
- leur auteur est identifié ?
- possible de demander autorisation selon usage ?
...

Du côté usage :
- les sources seront citées ?
- usage pro ou privé ?
- utilisation dans quel pays ?
...

Le droit d'auteur est très protégé en France.
Ne prenez pas trop de risques.


Oui ce que je récupère c'est totalement libre, genre un prix d'un produit ou une prestation ...

Pour l'utilisation c'est un outil que je vais finir par partagé au grand public,
Les sites en question sont en france.


Merci pour votre réponse.

Voir le profil de l'utilisateur    
01/08/20 à 13:52
Amazigh21
Freelance
discret
Inscrit le 19 Juin 2019
Messages: 24
spiralis a écrit:

Vous voulez parler sûrement de scraping et pas de scaffolding Smile


Effectivement,je voulais parler du scraping.
Merci pour la correction.

Voir le profil de l'utilisateur    
04/08/20 à 15:59
DidierH
Freelance
actif
Inscrit le 13 Oct 2008
Messages: 57
Bonjour, c'est très très rarement légal.

Certains gros sites indiquent d'ailleurs des mises en garde dans leur fichier robots.txt

exemple chez Leboncoin : https://www.leboncoin.fr/robots.txt

Citation:
## It's forbidden to use search robots or other automatic methods to access Leboncoin.fr.
## Access is only permitted with special permission from Leboncoin.fr.



exemple chez ebay : https://www.ebay.com/robots.txt


Citation:
# The use of robots or other automated means to access the eBay site
# without the express permission of eBay is strictly prohibited.
# Notwithstanding the foregoing, eBay may permit automated access to
# access certain eBay pages but soley for the limited purpose of
# including content in publicly available search engines. Any other
# use of robots or failure to obey the robots exclusion standards set
# forth at <https> is strictly
# prohibited.

Voir le profil de l'utilisateur    
04/08/20 à 18:53
fullstack_obliged
Freelance
actif
Inscrit le 01 Juin 2020
Messages: 56
DidierH a écrit:
Bonjour, c'est très très rarement légal.

Certains gros sites indiquent d'ailleurs des mises en garde dans leur fichier robots.txt

exemple chez Leboncoin : https://www.leboncoin.fr/robots.txt

Citation:
## It's forbidden to use search robots or other automatic methods to access Leboncoin.fr.
## Access is only permitted with special permission from Leboncoin.fr.



exemple chez ebay : https://www.ebay.com/robots.txt


Citation:
# The use of robots or other automated means to access the eBay site
# without the express permission of eBay is strictly prohibited.
# Notwithstanding the foregoing, eBay may permit automated access to
# access certain eBay pages but soley for the limited purpose of
# including content in publicly available search engines. Any other
# use of robots or failure to obey the robots exclusion standards set
# forth at <https> is strictly
# prohibited.



C'est quoi la raison pour laquelle ca pose un probleme d'utiliser de tel procede pour browser le site ?
Par ailleurs, les bots de google permettent d'aider au referencement non ?

Voir le profil de l'utilisateur    
04/08/20 à 19:25
Amarlot
Freelance
nouveau
Inscrit le 20 Juin 2018
Messages: 5
Ca ne respecte peut-être pas les conditions générales d'utilisation du site mais j'ai du mal à voir le risque.

Beaucoup de sociétés font du scrapping de site. Il y a plusieurs sociétés française d'ailleurs.

De l'autre coté il y a des sociétés qui essaient de bloquer ce traffic non légitime comme datadome, cloudflare, netacea sur les différents sites.

C'est le jeu du chat et de la souris ! Les scrappers essayent de nouvelles techniques que les solutions bloquent quelques jours plus tard et ainsi de suite !

Voir le profil de l'utilisateur    
04/08/20 à 20:33
DidierH
Freelance
actif
Inscrit le 13 Oct 2008
Messages: 57
Les bases de données sont spécifiquement protégées par la Loi. Je vous invite à jeter un oeil à la loi n° 98-536 du 1er juillet 1998, portant transposition dans le Code de la propriété intellectuelle de la directive 96/9/CE du 11 mars 1996, concernant la protection juridique des bases de données.

Certains producteurs de données placent parfois des honeypots (faux profil, faux produit, faux numéro de téléphone, fausse référence, etc), et là cela devient très facile d'identifier les contrevenants qui ont extrait et rediffusé la data

Voir le profil de l'utilisateur    
04/08/20 à 20:46
Amarlot
Freelance
nouveau
Inscrit le 20 Juin 2018
Messages: 5
Merci pour l'information. Souvent c'est pour récupérer des informations de prix des produits ou alors de la disponibilité produit.
Je ne sais pas s'il y a souvent des poursuites

Voir le profil de l'utilisateur    

Page 1 de 1
Répondre au sujet
Recruteurs
Accès via Turnover-it :
CVthèque & publication
Nous contacter
Par formulaire
AGSI SAS
75 Rue de Lourmel
75015 PARIS
logo freelance-info.fr
2018 © Copyright AGSI SAS
Conditions d'utilisation