2020 fut l'occasion de retrouver Thierry Vallaud* pour une nouvelle collaboration éditoriale où nous avons croisé nos regards sur l'évolution des métiers de la data.
L'article a été publié sur le site Décideo.fr - Média de référence d'actualité de la BI et du Big Data - voici le lien : https://www.decideo.fr/Les-metiers-de-la-data-science-en-2020-le-futur-d-un-passe-regenere
Datascientist, le job le plus sexy…Nous l’avons tous lu ! Et pour certains… le rêve d’en être…
La data comme nouveau pétrole… le Datascientist comme catalyseur d’intelligence ! Alors oui, je veux réveiller le datascientist qui sommeille en Vous….
Il y a un peu plus de 10 ans LinkedIn ne comptait qu’une centaine de datascientists en France… aujourd’hui rien que sur l’Ile de France, nous en comptons plus 5 000 !
Ne nous y trompons pas, le système éducatif français n’a pas produit du jour au lendemain ces centaines voire milliers de Datascientists… c’est bien l’engouement pour le wording qui a été à l'œuvre….
A l’heure où les appellations des métiers de la data convergent toutes vers le terme générique de datascientist et où l’offre de formation est devenue pléthorique, Nous avons pensé qu’il serait intéressant de reprendre la plume pour remettre à jour nos articles de 2012 (1) & 2014 (2) et mesurer ainsi le chemin parcouru.
De la polysémie à la perte de sens…
Pierre-André Fortin (à droite) et Thierry Vallaud (à gauche)
En avril dernier, au travers d’une études (3) sur les annonces diffusées sur LinkedIn répondant au terme Datascientist, nous observions la forte diversité qu’englobait cette terminologie.
Pour mémoire, il s’agissait d’une études où nous avions porté en critère de recherche le terme « data scientist » et comme zone géographie l’Ile de France - le moteur de recherche LinkedIn nous avait alors donné 674 annonces en résultat…
En y regardant de plus près le Statisticien y côtoyait le Data engineer et le Développeur React… quel rapport ? La data sous toutes ses formes, de l’infra à sa restitution en passant par l'analyse, … plus étonnant, la disparition du terme Datamining et la faible représentation de l’occurrence statistique/statisticiens sur seulement 4 annonces… et une proportion équivalente entre data analyste et data scientist… Nous ne parlons ici que des titres de postes.
Bref une évolution du naming assez importante…
Pour autant que pouvons tirer de cette observation…
Qu’il n’y ait pas un Datascientist mais Des Datascientists avec chacun une spécialité… in fine parler de Data Scientist pour désigner un métier revient à parler de Financier ou de Marketeur : il s’agit plutôt d’une classification générique et d’un département dans l’entreprise. La direction financière selon les groupes sera composée de comptable, contrôleur de gestion, de trésorier, ou encore de Responsable administratif… 4 métiers bien différents comme la chefferie de produit l’est du CRM…. Ou comme nous l’observons dans certaines organisations, les plus matures, des directions data où se côtoient : data engineer - data analyst, ML engineer et autres data Architect...
Aussi, dans un univers poussant à l’ultra-expertise, la désignation générique de Datascientist est d’une part extrêmement confusante, et parce que catégorielle, elle ne permet pas de saisir véritablement la portée d’un métier tout comme informaticien ne permet pas de faire de différence entre un Admin réseau et un développeur…
Le plus à craindre est in fine une perte de repères… A chacun sa vérité et comprenne qui peut… Reprenons le terme expert-comptable ou Dataminer, ces deux titres désignent des fonctions assez précises l’une dans la finance et l’autre dans le monde de la data.
Cette hésitation quant à la dénomination est notable lors de recrutement où en définitive une partie du brief portera sur ce que recouvre la terminologie Datascientist : algorithme, programmation, analyse de données, data visualisation et infrastructure de calcul sur les données.
Cette terminologie de Datascientist ne peut se suffire à elle-même… Certains y verront peut-être l’expression d’âmes chagrines ou tatillonnes, pour autant, en sous-jacent se joue le devenir d’un métier, sa filière, et son impact pour l’organisation.
“ Quand j’emploie un mot, dit Humpty Dumpty […], il signifie exactement ce qui me plaît de lui faire signifier. Rien de moins, rien de plus. – La question, répondit Alice, est de savoir s’il vous est possible de faire signifier à un mot des choses différentes. – La question, répliqua Humpty Dumpty, c’est de savoir qui va être le maître. Et c’est tout. »
En définitive cette imprécision est génératrice… d’incompréhension et de chaos…
A chacun son métier, aux ingénieurs big data, data architecte, de construire les infrastructures, aux data manager d’administrer et définir cette donnée, aux data-analyste de l’analyser et au data visualiser de la restituer…
Certes nous croiserons çà et là la BI qui parfois prendra en charge certains projets.
Même si parfois la différenciation est ténue au fil des annonces nous voyons apparaitre progressivement de nouveaux titres et c’est heureux…
• Chief Data Officer : Chief Data Officer est de piloter la gouvernance de la donnée au sein de l’entreprise afin d’en permettre une exploitation optimale.
• Architecte Big Data : met en place toute l'infrastructure technique utile à la collecte et au traitement d'un gros volume de données brutes
• Business Intelligence Manager : met en place place les outils et technologies transformant les données en informations exploitables pour et par le métier.
• Master Data Manager : pilote le Référentiel de données critiques de l’entreprise. Il en assure la qualité et l’intégrité.
• Data Protection Officer : est la personne chargée de la protection des données au sein d'une organisation. Sa mission est de conseiller son organisation, et contrôler l'application des textes légaux et des règles internes en matière de données personnelles.
• Data Miner : Le rôle du Data Miner est de fouiller la donnée via des techniques statistiques et algorithmique pour identifier les données pertinentes pour l’entreprise.
• Data Analyst : expert métier, le data analyste étudie les données disponibles pour en tirer des insights métiers utiles aux métiers et au pilotage de l’activité.
• Ingénieur Big Data : L’ingénieur Big data développe et met en place les outils et les infrastructures nécessaires aux équipes Data science pour l’analyse de la donnée.
• Machine Learning Engineer : Il développe et met en production industrialisation) des modèles d’intelligence artificielle.
Et le datascientist?
• Selon les organisations nous retrouverons sous ce vocable tout ou partie des composantes des métiers ci-dessus...
Une Offre de formation toujours plus large… CF Liste en fin d’article.
Nous dénombrions une 30aine de formations en 2012 lors de notre dernier article sur le sujet, pour la plupart, héritières des filières statistiques et mathématiques, Aujourd’hui, l’offre de formation est bien plus large ! Puisque nous en avons dénombré un peu plus de 150 !!!
S’il y a eu de nouvelles et nombreuses formations créées ces dernières années, nous avons aussi eu un mouvement de convergence important.
Logiquement, les cursus informatiques adressant le traitement de données, L’intelligence artificielle, L’HPC… se retrouvent aujourd’hui dans la grande famille data-science à raison et juste titre… Par, nombre de ses formations ont ouvert leurs cursus à des éléments statistiques et mathématique…D’autres formations comme certaines en Recherche opérationnelle ont orienté aussi leur formation vers ce métier…
Plus surprenant peut être, les formations en Datascience s’adressant au non-scientifique - Ces dernières années ont vu l'apparition de ce type de cursus en école de commerce… le programme en ce cas préparant plutôt à des débouchées vers des métiers laissant la part belle à l’analyse - si depuis longtemps la Finance a pris en compte la dimension data, et pour cause, c’est une véritable révolution pour d’autres métiers, dans le commerce, le marketing, la Supply Chain… On voit naitre des profils hybrides destinés à accompagner les métiers dans le pilotage de leurs activités…héritier pour certains d’un contrôle de gestion métier… l’entreprise hésite bien souvent dans leur désignation : business analyst, data analyst, data strategist parfois…
Aux formations initiales, l'offre de formation professionnelles a littéralement explosée… Il faut y voir ici la matérialisation d’un besoin en main d’œuvre important mais aussi l’opportunité business que peut représenter ce nouvel Data Eldorado de la formation !
Il nous semble intéressant ici de nous interroger sur cette offre de formation et leur supposé et réel apport en termes de compétences.
Peut-on accorder le même niveau de connaissance et de compétences à une personne ayant effectuée un parcours purement Scientifique vs une personne ayant suivi une filière de Gestion… chacun aura pu dans certains cas étudier les mêmes modèles et algorithmes, pour autant à de rares exceptions, la compréhension en sera forcément différente compte tenu du paradigme originel. Chacun abordera le sujet par un prisme différent.
Désigner l’un et l’autre par la même terminologie, comme nous pouvons le voir, ne bénéficie ni à l’un, ni à l’autre ! Bien au contraire….
Un marché qui reste porteur… mais... !
Malgré la pandémie, le recrutement de profils adressant les sujets data reste encore très important… Cette demande s’oriente sur des profils plutôt juniors ou débutant, nous l’avions noté dans l’article précédent d’avril où 85% de la demande s'échelonne entre des profils débutants (50%) et confirmés, jusqu’à 5 ans d’expérience - cela témoigne d’un marché dynamique et est un excellent signal vis à vis des formations et de leurs débouchées potentielles.
Si jeunesse savait… vieillesse pourrait !
“Une stratégie réussie et avancée d’analyse de données ne se résume pas simplement à acquérir les bons outils. Il est également important de changer les mentalités et la culture, et d’être créatif dans la recherche de la réussite”
Si la demande est bien là
Dans un contexte métier, relativement jeune - d’urbanisation SI peu toujours propice à l’accès de toutes les données… avec des qualités plus qu’hétérogènes, et dans des contextes où l’histoire a multiplié les silos et les systèmes d’information… Nous constatons une certaine sous-évaluation des projets et des enjeux pour lesquelles parfois plus de séniorité serait parfois souhaitable. Faute de quoi il y a un grand risque de ne pas voir le projet aboutir ...
Selon une étude IDC datant de début 2019, plus de 50% des projets d’IA aboutissent à un échec faute d’attentes réalistes et de main d’œuvre qualifiée.
Si complexes et si simple...
Si La VA des métiers de la data est in fine de construire des outils ou méthodologie permettant de comprendre la donnée et ainsi d’interpréter des phénomènes statistiques et mathématiques complexes répondant à des problématiques « business » … il y aurait une certaine naïveté à penser qu’il s’agit en définitive de simplement appliquer des recettes algorithmiques… ce qui dans ce cas pourrait être à la portée de jeunes talents bien formés fraichement diplômés….
Si effectivement, il ne s’agissait que de reproduire des méthodes déjà éprouvées… admettons…
Or sur un sujet émergeant comme la data… rien n’est si simple…
• Formalisation des questions métiers
• Capacité à libérer la donnée… favoriser sa disponibilité. Sujet simple et pourtant… les limites sont autant techniques que politiques…
• Volume de données disponible…
• Qualité des données disponibles
• Outil de data science à utiliser pour atteindre une certaine productivité et ne pas sombrer dans la dérive des POCS
D’une part, bien que l’entreprise stocke de la donnée depuis de nombreuses années, ces systèmes d’information ne permettent pas toujours une exploitation simple desdites data…
Certes l’avènement du big data, a permis dans certains cas de créer des entrepôts de données gigantesques…pour autant, bien que réglant le sujet du stockage, le sujet du modèle de données puis de son analyse sont des problématiques pouvant occuper des mois durant une DSI…reste ensuite à comprendre comment sont construites ces données et ce que leur fouille permettra d’apporter au métier de l’entreprise.
Comme souvent le sujet est un peu plus complexe qu’il n’y parait…Et la capacité d’accompagner les métiers tout en leur expliquant ce qu’un modèle peut faire ou ne pas faire… nécessite de fait, séniorité, pédagogie et surtout connaissance métier… ce qui s’acquière par l’expérience.
Or nous vivons actuellement un double mouvement dans les populations de Datascience, d’une part une pénurie, que la croissance des formations tente d’endiguer et par conséquent avec l’afflux d’une compétence arrivant, un rajeunissement de ce métier…
Par voie de conséquence, nous assistons à un certain « jeunisme » autant subit que désiré et une accélération des parcours : devenir manager rapidement quitte ensuite à délaisser la partie management pour lui préférer l’expertise….
Il y a ici le même paradoxe que dans le digital qui ne voulait recruter que des digital native de moins de 30 ans , parce qu’ayant grandi dans le digital, ils le comprenaient…
Dans une études sur le Mythe des digital native, les Chercheurs Paul A.Kirschnerab et Pedro De Bruyckere ont démontré que le stéréotype du digital native était tout aussi fondé que le mythe du yéti, car grandir dans un environnement numérique ne prédispose aucunement à sa maitrise et à sa compréhension, ni même à un intérêt particulier pour un usage poussé de ces technologies. (Teaching and Teacher Education - Volume 67, October 2017, Pages 135-142)
Cette idée a longtemps perduré et se retrouve parfois encore dans certaines organisations…
A ce premier constat, les progrès supposés de l’IA, laissant croire benoitement que l’algorithme pourra tout résoudre…. Incantation magique, à mettre en regard de l'étude IDC portant à 50% le taux d’échec de projets d’IA.
Contrairement aux idées reçues la qualification ne passe pas uniquement par la maîtrise d’un langage informatique ou la capacité à implémenter tel ou tel algorithme d’IA… si c’était si simple… au-delà de la compétence technique condition nécessaire mais non suffisante, la compétence métier demeure primordiale… et cette dernière ne s’acquière qu’avec de l’expérience… dans la réalité de l’entreprise !
Les modèle sociaux et managériaux à la française sont ici mis à mal… il y a une contradiction profonde : celle de la reconnaissance ultime par le management qui doit dès lors s’acquérir vite car la trajectoire professionnelle se doit d’être fulgurante tandis que l’expertise quant à elle demande du temps… comme un compagnon acquière la maitrise de son art.
C’est d’ailleurs un point notable : car dans l’organisation industrielle ou militaire la compétence valorisée prend son ancrage dans l’art du commandement… dans le cas d’un manager d’une unité de Datascience, le paradigme est tout autre… bien souvent le management se faisant par la compétence, l’écoute et donc par le plus sachant et le plus ouvert aux idées des autres.
L’organisation, pour pouvoir tirer pleinement partie de ses jeunes cerveaux et ne pas réinventer l’eau chaude, doit favoriser l’épanouissement d’un réel savoir et d’un savoir-faire qui s’accumule forcément que dans le temps : historiser les pratiques.
En data science plus que dans tout autre domaine la perte de savoir du passé est de la destruction pure et simple de compétence « métiers » clefs, la formation théorique tout au long de la carrière le seul moyen de la régénérer.
*Thierry Vallaud dirige la connaissance clients de ProBTP. « Datascientist » il a écrit plusieurs ouvrages sur la data sciences, la modélisation. Il est l’auteur d’une dizaine d’ouvrages et plus d’une centaine d’articles sur ces sujets et de nombreux modèles disponibles sur le marché. Titulaires de 3 doctorats et 6 masters il fait de la recherche en statistiques, en modélisation des comportements d’achat et en média planning.
Liste de formation en data science.pdf (102.3 Ko)
(1) - Datamachin, data qui ? Data quoi? mais non dataminer ! par Pierre-André Fortin & Thierry Vallaud - https://www.e-marketing.fr/Thematique/data-1091/Tribune/Datamachin-data-qui-Data-quoi-mais-non-dataminer-229660.htm
(2) - Big Année et Bonne data ! par Pierre-André Fortin & Thierry Vallaud - https://www.e-marketing.fr/Thematique/data-1091/Tribune/Big-Annee-Bonne-data-232451.htm
(3) - Data Scientist, du mythe aux Réalités par Pierre-André Fortin - https://anara.fr/data-scientist-du-mythe-aux-realites/