Leando Logo
  • Moderniser votre SIERP, Excel, informations qui circulent mal
  • Outil métier sur mesureBack-office, CRM, règles métier
  • Automatiser avec l'IATris, décisions, traitements répétitifs
  • Lancer un projet innovantProduit, vision, équipe tech
  • Sauvetage de projetReprise, dette, urgence livraison
Cas projetsIls en parlentBlog
Accueil
Blog
Données industrielles PME : structurer avant l'IA
Data industriellePME industrielleCadrage IA

Données industrielles en PME : comment les structurer avant de lancer un projet IA

Un projet IA industriel cale rarement sur l'algorithme. Il cale en phase 1 sur la donnée, parce que personne n'a pris le temps d'inventorier ce qui est mesurable, exploitable et représentatif avant de signer un POC. Voici comment poser cette cartographie en deux à quatre semaines, sans empiler un chantier data lake en plus.

DL

Donatien Lefranc

Fondateur & Président, Leando

18 mai 20268 min de lecture

Le projet IA cale rarement sur l'algo, presque toujours sur la donnée

Quand un projet d'IA industrielle en PME prend du retard, ce n'est presque jamais le modèle qui pose problème. La computer vision dispose aujourd'hui d'outils suffisamment matures pour traiter la quasi-totalité des situations de tri, de calibration ou de contrôle qu'on rencontre dans une chaîne agroalimentaire ou industrielle. Ce qui freine, c'est la donnée d'entrée. Le prestataire arrive en phase 1, demande à voir mille images représentatives des produits réels, et découvre qu'il en existe deux cents prises au téléphone par le directeur de production, mal éclairées, non étiquetées, sans métadonnée de date ni de lot.

Le calendrier dérape immédiatement. La phase 1 prévue pour trois mois en demande quatre, parce qu'il faut installer une caméra sur la chaîne, collecter pendant deux saisons, étiqueter à la main, vérifier la cohérence des libellés entre les opérateurs. Cette dérive n'est pas la faute du prestataire, mais elle est rarement chiffrée dans son devis, parce qu'il a fait l'hypothèse que la PME dispose d'un corpus exploitable. L'hypothèse est fausse neuf fois sur dix. La conséquence : un dirigeant qui pensait engager soixante mille euros sur une phase 1 cadrée découvre en cours de route un chantier data qui coûte autant, voire plus.

Pourquoi vos données ne sont pas prêtes (et personne ne vous le dit)

Le constat est systémique. Une PME industrielle construite sur quinze à quarante ans a accumulé de la donnée dans des fichiers Excel, des journaux papier, des étiquettes lot, des bons de production, des photos prises occasionnellement par le contrôle qualité. Cette accumulation a une utilité historique (traçabilité réglementaire, facturation, conformité) mais elle n'a jamais été pensée pour entraîner un modèle. Les formats varient, les conventions de nommage changent selon l'opérateur de la semaine, les volumétries sont incomplètes sur les périodes les plus instructives (haute saison, défauts atypiques, produits hors gabarit).

Ce n'est pas un défaut de l'entreprise, c'est la trace d'une organisation qui a fonctionné en s'appuyant sur la mémoire des équipes plutôt que sur un référentiel partagé. Les vendeurs de solutions IA ne soulèvent pas le sujet parce qu'il complique leur cycle commercial. Et le dirigeant, lui, ne sait pas qu'il devrait poser la question avant de signer. Le sujet n'est pas tech, il est en amont : organisationnel, systémique, et c'est seulement après qu'il devient technologique.

« Souvent ce ne sont pas des sujets tech. C'est souvent un sujet organisationnel, systémique, et ensuite en effet technologique. »

, Donatien Lefranc, fondateur de Leando

Trois inventaires data à boucler avant de signer une phase 1 IA

La cartographie utile tient en trois inventaires complémentaires, à mener en atelier avec la direction de production et la direction générale. Premier inventaire : les sources existantes. Quels journaux de production sont tenus aujourd'hui, sur quel support, par qui, à quelle fréquence, avec quelle granularité. Cet inventaire fait apparaître ce qui est récupérable immédiatement et ce qui n'a jamais été tracé. Deuxième inventaire : les angles morts. Quels sont les scénarios qui bloquent aujourd'hui la chaîne, et dispose-t-on d'images ou de mesures sur ces scénarios précis. La réponse est presque toujours non, ce qui définit le plan de collecte.

Troisième inventaire, le plus important : la cohérence d'étiquetage. Un modèle de computer vision se nourrit de libellés homogènes. Si un opérateur classe un défaut « rejet » et un autre « hors calibre » pour la même réalité physique, le modèle n'apprend rien d'utile. Cet inventaire force à expliciter le référentiel de classification qui doit exister dans la tête des opérateurs depuis des années, sans avoir jamais été formalisé. La sortie de ces règles métier implicites est un livrable à part entière, pas une formalité, et elle a une valeur indépendamment de l'IA. Pour le détail de cette logique de cadrage, ce qui distingue un cadrage IA d'un cadrage projet classique pose les fondamentaux.

Interface d'annotation de données pour un projet de computer vision industriel : grilles de produits, scores de classification, étiquetage homogène
L'étiquetage homogène des données réelles est la matière première d'une phase 1 IA utile. Sans lui, le modèle n'a rien à apprendre.

Ce que ça change sur le terrain : le cas d'une PME agroalimentaire bretonne

Sur une PME agroalimentaire bretonne d'une dizaine de personnes, produisant environ cinq cents tonnes de produits de la mer par an, la cartographie data préalable a structuré l'ensemble de la phase 1. Avant tout entraînement de modèle, on a identifié les configurations terrain où la machine existante chutait sous soixante pour cent de détection, et on a défini un plan de collecte d'images sur ces configurations précises pendant trois semaines. Le résultat : un corpus représentatif, étiqueté avec un référentiel partagé entre les opérateurs et l'équipe technique, exploitable en entrée du modèle.

La phase 1 a ensuite démontré une détection autour de quatre-vingt-quinze pour cent sur les scénarios qui bloquaient l'installation précédente, contre cinquante à soixante pour cent en départ. Ce passage n'est pas la performance d'un algorithme, c'est la performance d'un algorithme nourri par un corpus calibré sur les bons scénarios. Si la collecte avait été lancée en parallèle du modèle, sans cartographie préalable, le calendrier aurait dérivé de plusieurs mois et la mesure de phase 1 aurait perdu son sens. Pour la suite de ce raisonnement, voir comment valider une phase 1 IA en deux semaines avant d'industrialiser et par quels processus commencer en IA agroalimentaire.

Si vous étudiez un projet d'automatisation IA dans votre PME, une préparation tient en deux questions à poser à toute votre équipe production cette semaine : sur les cinq configurations qui bloquent le plus la chaîne aujourd'hui, disposons-nous d'au moins cinq cents images représentatives sur chacune, et l'étiquetage qui les accompagne est-il homogène entre les opérateurs. Si l'une des deux réponses est non, la cartographie data n'est pas une option, elle est le préalable contractuel à toute signature de phase 1.

Un data lake n'est ni nécessaire ni recommandé au démarrage d'un projet IA en PME industrielle. Ce qui compte, c'est la qualité des données effectivement collectables sur la chaîne ciblée : images de produits réels, journaux de production, mesures process. Sur les projets de computer vision les plus aboutis, le périmètre data utile à la phase 1 tient dans un disque dur, parfois quelques centaines de gigaoctets bien étiquetés. La question d'une infrastructure data structurante arrive après l'industrialisation, quand le pilotage temps réel devient un sujet en soi.

Vous voulez cartographier vos données avant d'engager une phase 1 IA ?

On pose ensemble les trois inventaires (sources, angles morts, étiquetage) en deux à quatre semaines, pour qu'une phase 1 IA démarre sur des données exploitables. Échange exploratoire d'une heure, sans engagement.

Cartographier mes données

Plus de temps à perdre. La suite
s'écrit ensemble_📝

lean
_do

Donner à chaque bonne idée un
impact tangible, mesurable et
durable

Menu

  • Nous contacter
  • L'offre startup
  • CTO externalisé
  • Offre fonds & PE
  • Nous rejoindre

Ressources

  • Notre Blog pour apprendre
  • FAQ
  • Développement Nantes
hello@leando.tech06 09 65 21 51

2 bis rue Voltaire, 44000 Nantes

©2026 Leando - Tous droits réservés

Mentions légales·Confidentialité