Qu’est-ce qu’un projet data, et comment bien le préparer ?

Sommaire

Le projet data, définition

Le projet data est un type de projet informatique bien particulier. Celui-ci a en effet vocation à traiter des données déjà existantes, internes (systèmes d’information) ou externes à l’entreprise.
Les projets data peuvent avoir des objectifs analytiques, d’aide à la prise de décision ou d’innovations.

Pourquoi se lancer dans un projet data ?

Le projet data doit répondre à un objectif clair, souvent une problématique à solutionner ou un besoin rencontré par les métiers d’une entreprise. Le projet data pertinent a pour mission d’apporter de la valeur.


La première question à se poser est donc ce fameux « pourquoi », l’objectif à atteindre. Il doit être mesurable et le projet de traitement de données doit s’articuler autour de cet enjeu. Plus qu’une finalité, un projet data est un moyen de répondre à un besoin métier. Le projet sert donc les besoins des métiers : sans métiers, pas de projet.

L’enjeu va donc être de trouver le meilleur moyen de répondre à ce besoin. Pas question de brûler les étapes ! Par exemple on ne lance pas un projet d’intelligence artificielle si on ne maîtrise pas déjà ses données.

Les résultats attendus d’un projet data sont souvent un gain de temps, d’argent, une optimisation des processus  d’une entreprise et une meilleure valeur ajoutée des métiers dans leur quotidien.

Comment préparer au mieux un projet data ?

Evaluer la donnée : existence et qualité

Sans data, pas de projet data !

L’existence, la qualité et les processus de collecte de données sont à évaluer avant de se lancer dans son projet data. Si la donnée n’existe pas ou n’est pas suffisante pour répondre aux problématiques métiers, ces aspects sont à considérer avant le lancement du projet data. En effet, ils constituent un prérequis indispensable avant la création de solutions en tant que telle.

Préparer les métiers à s’impliquer dans le projet

Sans métiers, pas de projet !

Les métiers d’une entreprise sont à l’origine du projet data : c’est à eux que s’adressent les solutions produites. Ce sont eux qui connaissent le mieux leur problématique et c’est à eux de transmettre leurs besoins à l’équipe chargée du projet.

Un projet data réussi demande de l’implication de la part des métiers, car ce sont leurs données. Du temps dédié ainsi que des créneaux d’échange réguliers sont donc à prévoir afin de s’assurer d’un projet pertinent et qui correspond aux enjeux métiers.

Les métiers doivent être présents à toutes les étapes du projet : recueil du besoin, des contraintes, des exigences, déroulé du projet, recette, mise en production et maintien de leur projet.

La communication entre les services est également clé : les besoins de chacun sont à considérer, et il faut évaluer en amont qui sera impliqué dans le projet afin de fédérer l’ensemble des acteurs autour de celui-ci, dès le début.
Parce que chaque structure a des besoins différents, il n’y a pas d’organisation-type universelle. Il faut donc trouver celle qui fonctionnera pour votre entreprise.
Une seule contrainte : tous les rôles nécessaires au projet doivent être pourvus, et chacun doit savoir qui est en charge de quel aspect.

Définir les critères de succès

Le projet data doit permettre de résoudre la problématique d’une équipe métier. Afin de s’assurer du succès du projet, les critères de succès doivent être définis en amont. Ces critères sont à suivre tout au long du projet, et après la mise en production.

Ils peuvent concerner beaucoup d’aspects différents de l’entreprise :

→ Gain de temps ?
→ Augmentation du chiffre d’affaires ?
→ Satisfaction client ?
→ Meilleure prise de décision
→ …

Considérer les besoins en sécurité, conformité et accessibilité des données

La gouvernance des données est un élément principal sur lequel la fiabilité de votre projet data repose. Anticiper les besoins en sécurité, conformité (RGPD..) et en accessibilité des données permet de définir une architecture pertinente et adaptée à vos contraintes.

Des règles de gestion claires et définies ainsi qu’un travail préalable sur l’identification des données métiers et leur accessibilité permettent une meilleure compréhension de vos enjeux pour vous proposer un traitement de données sur mesure.

Anticiper la phase de recette

La recette (validation du projet) se fait en collaboration entre les équipes techniques et les métiers.

Les échanges préparatoires doivent permettre de répondre à certaines questions :

Qui est garant du résultat des deux côtés ?
Quelles méthodes de vérification / validation ?
Quels outils pour s’assurer de la conformité par rapport aux besoins du métier ?
Quel planning ? Disponibilité ? (organisation projet)

L’implication des équipes métiers est encore une fois primordiale, car ce sont elles qui confirmeront que la solution offre une réponse à leurs problématiques.

Qui réalise le projet data ?

Les projets data sont des projets complexes qui impactent plusieurs aspects d’une organisation. Les équipes de projet data sont donc composées de profils variés et polyvalents, aux compétences complémentaires.

Tout projet data implique des experts dans le traitement et la valorisation de données, par exemple : data engineer, data analyst, data scientist.

En complément, pour répondre aux différents enjeux, tailles et structures d’organisation, au nombre et à la complexité des projets à traiter, de nouveaux profils ont fait leur apparition : chief data officer, data officer, data protection officer, data steward, chef de projet data, data architect, data owner, ingénieur data ops,…

De même, de nouvelles structurations d’organisations peuvent se mettre en place autour d’un projet data. Les experts du projet forment un pôle à part entière, hors de la DSI.
Ex : la création d’un data office dans certaines entreprises, impliqué dans le COMEX au même titre que les directions des métiers et de la DSI.

Quelles sont les étapes du projet data ?

Hors gouvernance et acculturation, un projet data s’articule autour de cinq étapes-clés :

Identification de la donnée
Quelles sont les données à travailler ?

Collecte de la donnée
Où sont-elles générées et stockées ?

Stockage de la donnée
Mise en place des solutions de stockage adéquates, sécurisation

Transformation / valorisation de la donnée
Nettoyage, analyse, structuration, traitements

Mise à disposition de la donnée
Restitution de la solution : données traitées, visualisation, intégration à une solution métier,…

Quels éléments considérer pour un projet data efficace ?

L'architecture technique

Quelle architecture souhaite-t-on mettre en place ? Elle est déterminée selon la nature du projet, les compétences des équipes et la problématique métier à résoudre. Il est donc essentiel de bien connaître en amont la raison d’être du projet. 

La performance des traitements

La solution data doit permettre de résoudre les problématiques quotidiennes des métiers, dans un délai le plus adapté au besoin. La solution proposée doit donc être performante, pour vous permettre si nécessaire un accès rapide à l’information dont vous avez besoin.

La véracité des données

Pour une solution fiable, la véracité des données est primordiale.
La donnée nécessaire existe-t-elle ? Est-elle fiable et de qualité ?

La gouvernance

Il s’agit à la fois de gouvernance technique et fonctionnelle. Les rôles et les responsabilités doivent être bien définis au sein du projet, entre l’équipe technique et vous, mais également en interne. L’équipe technique travaille afin de mettre à disposition la donnée nécessaire aux métiers. Les métiers, eux, sont propriétaires de cette donnée et en sont donc les garants.

 

La gouvernance des données est également un point capital à considérer, autant pour la sécurité des données que pour la réussite du projet.

  • La donnée est-elle correctement sécurisée tout au long de son parcours, du stockage jusqu’au partage aux différents utilisateurs ?
  • Les règles de gestion permettent-elle de comprendre et d’identifier facilement la donnée ? A ce titre, la mise en place d’un data catalog est souvent nécessaire afin que l’ensemble de l’organisation puisse maîtriser et comprendre sa donnée, en utilisant un vocabulaire commun.
  • Y a-t-il un data lineage, qui permet de suivre les différentes transformations de la donnée tout au long de son parcours ?

Le coût

Un projet data implique des coûts matériels, logiciels et humains.

Le futur maintien en production

La mise en production d’un projet data ne signifie pas qu’il est terminé, la data est changeante et les besoins également.

Un bon projet persiste dans le temps car il créé de nouvelles opportunités et il doit être de qualité pour maintenir la performance des flux de données (mise en place de méthodologies DataOps).

Un suivi post production est donc nécessaire à intervalles réguliers.
Celui-ci permet d’établir si les usages ont changé, si la solution répond toujours aux besoins, si les métiers ont évolué, et finalement si la solution est toujours d’actualité.
Ce suivi permet d’anticiper les besoins d’évolution de la solution et de la maintenir dans le temps.

Les besoins peuvent évoluer, les sources de données également. Une communication ouverte et transparente entre l’équipe technique, les métiers, et éventuellement d’autres fonctions de l’organisation, permet d’anticiper au mieux les évolutions envisagées dans le futur.

Cela permet de penser le projet pour durer dès le début.

Les compétences techniques et fonctionnelles

Le sujet des compétences doit être abordé dès le début du projet avec l’équipe technique (interne ou externe)
Si la réalisation du projet est externalisée, il faut définir quelles compétences sont disponibles en interne pour garantir la disponibilité et l’autonomie des ressources pour la maintenance ultérieure. La flexibilité du prestataire sur les compétences et technologies et sa capacité à transférer des expertises techniques ou fonctionnelles sont donc à intégrer.

Choisir les bons partenaires

Plus qu’une simple création de solution, un projet data est un ensemble de compétences à combiner et à maintenir au long cours.

Le choix d’éventuels partenaires est donc une étape cruciale pour le déroulé du projet et au déla, pour les organisations. Il faut s’assurer de l’adéquation sur les méthodes de travail, les valeurs, l’organisation, ainsi que la vision globale.

REDLab est un pure player data, spécialisé dans les projets de traitement et de valorisation de données pour les grands comptes, start-up, et éditeurs logiciels.
Vous avez un projet data et vous souhaiteriez en discuter avec nos experts ? Venez découvrir notre façon de travailler et ce que nous pouvons faire pour vous :

Photo en noir et blanc de Sarah Blondel, chef de projet data chez REDLab

Par Sarah

Sarah est Chef de Projet Data chez REDLab. 

Rédaction Andréa Meyer

Comment fonctionnent les algorithmes des sites de rencontre ?

Les algorithmes sont des modèles de calcul et fonctionnent grâce à des données d’entrée, input, et des données de sortie, output. L’input est intégré et traité grâce aux différentes instructions de l’algorithme. Est ainsi généré un résultat, une information utilisable par l’utilisateur. Les moteurs de recherche en sont un exemple. En traitant les mots-clés de la recherche, ils proposent à l’utilisateur des résultats correspondants pertinents.

Mais comment fonctionnent l’intelligence artificielle derrière les sites de rencontre ?

Lire la suite »

Comment faire un CV percutant : 9 Bonnes Pratiques pour mettre ton profil en haut de la pile !

En tant que RH on a fait un constat paradoxal. Aujourd’hui, il est difficile pour les recruteurs de trouver des candidats qui correspondent vraiment à leurs besoins, alors qu’il existe encore de nombreux talents sur le marché à la recherche d’un emploi.

Si tu es dans ce cas, la question à te poser est la suivante : ton CV est-il assez attractif et représentatif de tes compétences ? Parvenons-nous à retrouver les informations importantes de ton CV ?

Alors comment mettre ton profil au sommet de la pile ? On va aborder quelques Tips concrets, l’idée générale est de revenir au bon sens quand tu présentes ton parcours ! Allez c’est parti !

Lire la suite »

Le monde merveilleux des flottants ou la représentation des nombres réels en machine

Qu’on parle de nombres entiers, ou de nombres décimaux (“nombres à virgule”), il en existe une infinité. Mais ça, je pense que vous le savez déjà.

Lorsqu’on veut travailler avec des nombres en informatique, il faut pouvoir les représenter en mémoire. On a besoin de les stocker dans des “cases”. Mais aussi sophistiqué soit votre ordinateur, sa mémoire est finie. On ne sait pas vraiment si l’univers est fini ou infini, mais qu’importe la réponse, les ordinateurs à mémoire infinie, ce n’est pas encore pour demain, ni même après-demain ! 😉

Cela nous amène à considérer le postulat suivant (et cela va nous donner le ton pour la suite) : il n’est pas possible de représenter tous les nombres (entiers ou décimaux) qui existent de façon exacte dans un ordinateur.

Lire la suite »