Le Data scientist est un métier polyglotte.
Au delà du langage statistique, un datascientist doit être capable d’échanger avec le métier pour connaitre, comprendre et répondre à leur problématique. Je dis souvent que je dois en savoir autant sur leur marché que les directeurs. C’est la manière la plus facile et la plus rapide pour fournir une réponse pertinente et adaptée à leur besoin. Le datascientist doit être en capacité de vulgariser les techniques qu’il utilise (statistique, datamining, …) afin de se faire comprendre des personnes métier (marketing, direction, …).
Pour rentrer au coeur de son sujet, le datascientist doit s’appuyer sur l’informatique existante dans l’entreprise. Pour ce faire, le datascientist doit comprendre les problématiques techniques et doit pouvoir traduire les techniques statistiques en développement à mettre en place par l’informatique. Il doit aussi comprendre l’environnement dans lequel il travaille (serveur, outil, langage de programmation, …). Pour ce faire, le datascientist se doit d’avoir un bon niveau en informatique et une bonne culture générale de ce milieu.
Aussi, un datascientist parle 3 langages : Le langage statistique, Le langage courant/métier, Le langage informatique
On peut ensuite distinguer 3 compétences dans la data :
- Construire la data fait partie de la composante informatique du monde de la data. Si un datascientist n’est pas un développeur, il doit être capable de construire un échantillon de données, des indicateurs pertinents, …. Pour ce faire, il se doit d’avoir des compétences dans la manipulation des données (structurées ou non).
- Comprendre la data est le cœur des compétences demandées à un datascientist : l’intelligence de la donnée. Il doit être capable de comprendre la donnée à sa disposition afin d’en extraire les éléments pertinents pour le business de l’entreprise.
- Utiliser la data est la résultante de son travail. Le datascientist doit être en capacité de mettre en oeuvre les éléments pertinents qu’il a pu mettre en avant lors de ces études de données (score, reporting, segmentation, …)
rendez-vous la semaine prochaine pour Que peut-on attendre d’un DataScientist ?