Webinar Scraping pour recruteurs - #sharingiscaring

Articles · 30 mars 2020

Le savoir et la connaissance comme réponse, et comme pied de nez à la crise.

Le 16 mars 2020, le gouvernement décrétait le confinement. Une situation inédite à l’échelle d’un pays. Du jour au lendemain, l’activité de recrutement s’est figée.

Plutôt que de rester désœuvré, j’ai préféré partager.

Depuis deux ans, entre mes recrutements, quelques conférences et mes cours en Master 2, j’anime régulièrement des ateliers : le scraping, les clés du sourcing, l’évaluation des compétences pour le Syntec. J’ai beaucoup appris des autres. Il m’est donc naturel de rendre.

Alors webinar il y a eu. Sur le scraping, puisque c’est un sujet signature.

Dix jours plus tard, 234 inscrits. Le jeudi 26 mars à 18h, 126 personnes m’ont rejoint pour une cinquantaine de minutes d’atelier.

Voici le replay, les slides, et de quoi vous donner envie de les regarder.

Voici donc le replay & les slides !

Le scraping, c’est quoi au juste ?

On en parle beaucoup. C’est devenu un buzzword. Derrière le mot, pourtant, rien de sorcier.

Le scraping est une technique d’extraction de contenu. Il transforme une donnée présentée pour être lue, une page web, un PDF, en donnée structurée, exploitable dans un tableur ou dans votre ATS.

Ce n’est pas du piratage. C’est de la mise en forme.

Une liste de conférenciers sur un site d’événement. Les adhérents d’une fédération professionnelle. Les membres d’un groupe Meetup. Les résultats d’une recherche LinkedIn. Autant de gisements visibles par tous, mais prisonniers d’une présentation qui interdit de les travailler.

Le scraping les libère.

Du copier-coller artisanal au flux outillé

Reprenons le geste préhistorique du sourceur.

Je repère une liste. Je copie-colle dans un tableur. Je recopie chaque nom dans Google. J’espère tomber sur le bon profil LinkedIn. Je recolle l’adresse dans mon tableur.

Multipliez par cent. Vous avez perdu votre journée.

Le scraping outillé ramène ce flux à quelques clics. Là où vous passiez des heures, deux extensions Chrome et un tableur suffisent. Et une fois la liste récupérée, quelques manipulations de plus vous donnent même la requête booléenne toute faite, prête à réinjecter dans LinkedIn ou Google.

Mais récupérer de la donnée n’est pas une fin. C’est un début.

La vraie question n’est jamais « comment je scrape ? ». C’est « qu’est-ce que je veux en faire ? ». Une donnée que vous ne savez pas exploiter ne vaut rien. C’est l’usage qui crée la valeur, et l’enrichissement qui la révèle.

Au programme du webinar

L’atelier déroule une chaîne complète, du repérage d’une liste jusqu’au contact qualifié. Voici les outils que je vous montre, et ce que chacun fait dans le flux.

LinkedIn Helper : extraire les profils d’une recherche LinkedIn en une liste exploitable.
Instant Data Scraper : aspirer n’importe quelle liste web (annuaire, fédération, résultats) en deux clics.
Autopagerize : fusionner des résultats paginés en une seule page avant de les récupérer.
Multiple URL Opener : ouvrir vos profils par salves de 10, 20 ou 30, pour les trier vite.
Phantom Buster : automatiser vos demandes de mise en relation, exporter votre réseau, et même retrouver l’URL LinkedIn d’une personne à partir de son nom.
Hunter et Nymeria : retrouver les adresses email professionnelles, avec un score de fiabilité.
Email Extractor et Email Extractor Pro : collecter des emails en masse, y compris dans vos fichiers locaux.
Le bookmarklet : un petit script maison pour récupérer les membres d’un groupe Meetup.

Le fil rouge : une boucle qui s’enrichit à chaque passage. Vous partez d’une liste, vous l’ouvrez, vous la nettoyez dans un tableur, vous l’enrichissez d’emails, puis vous l’inversez pour retrouver les profils manquants. Un processus itératif, où chaque outil prend le relais du précédent.

Un mot de prudence, au passage. Depuis l’entrée en vigueur du RGPD en mai 2018, l’export de votre propre réseau LinkedIn ne contient plus ni téléphone ni email. Sourcer reste légitime dans un cadre B2B de recrutement, à condition de savoir ce que vous manipulez et pourquoi.

Ma conviction : l’outil ne fait pas le sourceur

Vous attendiez du code ? Il n’y en a pas. Volontairement.

Mon pari, ce soir-là comme aujourd’hui, c’est qu’avec des outils simples et bien maîtrisés, on abat déjà un travail considérable.

Ce n’est pas l’outil qui fait le sourceur. C’est la méthode.

Les plugins vont et viennent. Certains de ceux que je présente ici auront changé de nom, de prix ou de propriétaire d’ici quelques mois. Peu importe. Ce qui reste, c’est la logique : repérer un signal, structurer une donnée, l’enrichir, la qualifier. Cette grammaire-là ne se démode pas.

Maîtrisez trois outils à fond plutôt que d’en accumuler trente. Et gardez toujours une voie de repli, parce qu’aucun outil n’est éternel.

Regardez, testez, amusez-vous

Le replay dure une cinquantaine de minutes. Les slides reprennent chaque étape, avec les liens pour installer les extensions et suivre les tutoriels.

Prenez le temps de jouer avec la donnée. Posez-vous la question de ce que vous cherchez avant de vous demander comment l’obtenir. Soyez curieux, soyez créatifs.

Sortons de cette crise meilleurs.

Bon scraping, et belle cuisine !

Mise à jour 2026 : ce qui a changé en six ans

Ce webinar date de mars 2020. Six ans plus tard, qu’est-ce qui tient encore, et qu’est-ce qui a bougé ?

Les survivants. Instant Data Scraper, Phantom Buster, Hunter : toujours là, toujours efficaces. La chaîne de base, repérer une liste, l’aspirer, l’enrichir, n’a pas pris une ride. Si vous deviez ne retenir que trois outils, ce sont encore de bons candidats.

Le durcissement de LinkedIn. La plateforme a serré la vis. Quotas plus stricts, détection plus fine, bannissements plus rapides. Le jeu du chat et de la souris s’est intensifié. La temporisation, que je recommandais déjà à l’époque, n’est plus une option : ouvrez trop de profils trop vite, et vous êtes bloqué. Prudence et patience sont devenues la règle.

L’explosion des révélateurs d’emails. En 2020, je montrais Hunter et Nymeria. Depuis, le marché a grossi : Kaspr, Lusha, Apollo, RocketReach, ContactOut. Avec une question qui monte chez les acheteurs : d’où vient la donnée ? Le RGPD et la vigilance des régulateurs ont rendu le sujet de la conformité incontournable. Savoir ce que vous manipulez n’a jamais été aussi important.

Le grand bouleversement : l’IA. C’est le vrai changement. En 2020, scraper sans code voulait dire empiler des extensions. Aujourd’hui, vous pouvez décrire ce que vous voulez à une IA et lui faire écrire votre propre outil. C’est ce que j’appelle le vibe coding. Plus besoin d’acheter le scraper de quelqu’un d’autre : vous construisez le vôtre. C’est la logique des FreeSourcingTools, cette boîte à outils que je développe et partage librement.

Mais attention au mirage. L’IA ne source pas à votre place. Elle vous augmente si vous la pilotez, elle vous égare si vous la laissez piloter.

Et un changement plus discret, plus profond. La donnée elle-même a changé de nature. À force d’être rédigés, parfois par des IA, les profils se ressemblent et disent de moins en moins. Le déclaratif s’est gonflé pendant que les vrais signaux, eux, se sont déplacés ailleurs : sur GitHub, dans les contributions, dans les traces de travail. Scraper reste utile. Mais savoir quoi scraper, et comment lire ce qu’on récupère, l’est devenu bien davantage.

Merci à Tous pour votre Attention et votre soutien !