5 juillet 2020

Github & Google CSE

2  comments

Pierre-André Fortin

Plateforme bien connue des développeurs, Github peut être un terrain de jeu particulièrement fécond pour nous autres sourceurs.

Attention cependant, elle n'a pas été conçue pour les recruteurs... n'espérez pas trouver le cv de chaque profil présent... vous ne l'aurez pas !

En revanche avec un peu de méthode vous pourrez trouver de véritable pépites !!!

Tout d'abord, nous pouvons nous pencher sur la recherche avancée de Github. Elle est extrêmement riche et vous permettra déjà des recherches très intéressantes...

En revanche si les critères de recherches sont larges, ils ne prennent pas en compte l'entreprise... Et oui ! Vous pouvez trouver des profils par entreprise sur GitHub.

Pour cela nous allons utiliser Google CSE et ses opérateurs avancés.

Pour rappel, Google CSE, vous permet de requéter sur un nom de domaine précis, en l'occurrence github.com et dans le cas présent de requéter des profils utilisateurs de la plateforme...

https://cse.google.fr/cse?cx=013594538065100501576:edx3ao-racq#gsc.tab=0

Le moteur ci-dessus, vous permettra de faire un X-Ray de la plateforme Github.

Pour rappel les avantage de Google CSE :

  • Vous ne répétez plus l'opérateur site:xxxx.com  (dans le cas présent l'expression site:github.com)
  • le recours au CSE vous évitera aussi les captchas.
  • Seul bémol, vous serez limité à 100 résultats

Moins connus les opérateurs avancés de Google CSE vont vous permettre de creuser des éléments non accessible par le moteur Google traditionnel.

Société

more:p:person-worksfor:company

Cet opérateur vous permet comme son nom peut le sous entendre  de requêter sur la companie.

Voici un exemple avec IBM... more:p:person-worksfor:IBM

Voilà qui ouvre des perspectives... pour autant, peu de profils sont complets, ce qui restreint la portée immédiate de l'opérateur...

En revanche s'intéresser ensuite aux personnes qu'elles suivent et qui la suivent... devrait vous permettre de reconstituer des équipes.

Localisation

more:p:person-homelocation:location

Cet opérateur vous permettra de circonscrire votre recherche sur la géographie

Prenons comme localisation Paris - more:p:person-homelocation:paris

Langage

more:p:code-programminglanguage:language - Cet opérateur ne fonctionne plus ! - MAJ Oct 2021 

prenons comme langage: Pyhton - more:p:code-programminglanguage:python

Cet opérateur vous permettra de requêter sur les langages présents dans les repositories

Description/Biographie

Il est possible de requêter aussi l'élément biographie/description de profil :

more:p:metatags-twitter_Description: datascientist

Combinaison

En combinant ces opérateurs entre eux, nous pouvons mener une recherche extrêmement précise....

more:p:person-worksfor:microsoft more:p:person-homelocation:paris more:p:code-programminglanguage:C 

L'ensemble des réponses rempliront les critères :

  • Société: Microsoft
  • Localisation: Paris
  • Langage : C

Cette approche sera plus restrictive qu'une approche par mots clés classiques. 

Dans le cas présent nous nous appuyons sur des "données structurées" utilisées par Google pour indexer les sites.

Afin de "comprendre" le contenu d'une page, Google offre la possibilité de fournir des informations sur la signification d'une page : ce sont les "données structurées". Elles répondent à un format normalisé. Elles sont présentes dans le code source et ne sont pas visible en navigation classique.

Ces données nous permettent un requêtage extrêmement précis quand les champs ont été renseigné... car si les balises existent, elles sont parfois vides... 🙁

Nous avons vu dans cet article l'utilisation d'un Google CSE pour la plateforme Github et l'utilisation de trois opérateurs spécifiques aux CSE... Ces opérateurs ne fonctionneront que dans le cadre d'un CSE Github.

Les moteurs de recherche personnalisés (CSE) de Google offrent des possibilités de recherche et de paramétrages sans pareil. Les Google CSE ont des paramètres avancés et des opérateurs de recherche qui n’existent pas sur le simple moteur Google et qui bien utilisé permettent de démultiplier votre productivité.


Vous souhaitez laisser un commentaire? 

Votre adresse e-mail ne sera pas publiée.

    1. Effectivement, Github a revu sa politique de référencement, les repositories ne sont plus indexés et il n’est donc plus possible de requêter sur les langages. J’ai supprimé l’opérateur.

{"email":"Email address invalid","url":"Website address invalid","required":"Required field missing"}

D'autres articles

février 6, 2021

LinkedIn est aujourd’hui le Réseau professionnel de Référence

janvier 5, 2021

Recruter sans budget ou avec un faible budget

novembre 24, 2020

Freesourcingtools est pensée comme une boîte à outils