Ministudio.ai voulait générer des cartoons personnalisés à partir des dessins d'enfants, avec une consistance de caractère d'une image à l'autre. Problème : quasi aucune ressource publique n'existait sur ce sujet à l'époque, 3 ans avant ChatGPT. Il fallait produire l'état de l'art, pas l'appliquer.
Secteur
EdTech · IA générative
Timing
3 ans avant ChatGPT
Stack
AWS · GCP · computer vision
Résultats
1,3M followers · A16Z convaincus

Architecture IA scalable AWS/GCP, lisible pour des investisseurs US exigeants.
La consistance de caractère, qu'un personnage reste cohérent visuellement d'une image à l'autre, est aujourd'hui un problème résolu par les modèles de génération. En 2020-2021, ce n'était pas le cas. Quasi aucune ressource publique (Reddit, forums, papiers académiques) ne traitait ce problème de façon applicable.
Il n'y avait pas d'état de l'art à appliquer, il fallait le produire. La question pour Ministudio n'était pas de trouver un prestataire qui « sait faire » (impossible). C'était de s'associer à un partenaire capable de pousser les limites en conditions d'incertitude technique totale.
En parallèle : besoin d'une architecture scalable capable de convaincre des fonds américains, et d'une capacité à vulgariser l'architecture technique pour des investisseurs exigeants qui n'ont pas 45 minutes devant eux.
R&D poussée sur la computer vision et la consistance de caractère. Création de masques pour projection sur des caractères personnalisés. Transfert technologique entre différentes approches (nodes, modèles IA), combinaison de briques hétérogènes quand aucune brique seule ne répondait. L'approche : couteau suisse ingénierie appliquée à des problèmes de recherche.
Architecture complète AWS + GCP scalable, conçue pour convaincre A16Z, pas seulement pour faire tourner le produit. Chaque décision d'architecture a été pensée pour être lisible par un investisseur en 5 minutes. La capacité à vulgariser sans simplifier est aussi importante que la capacité technique.
Résultat produit : génération de cartoons personnalisés avec consistance de caractère, UX grand public, viralité organique. 1,3 million de followers sans budget publicitaire, preuve que le produit fonctionne émotionnellement.
1,3M
followers organiques
A16Z
fonds tier 1 US convaincus
+3 ans
d'avance sur l'état de l'art

Consistance de caractère par computer vision, résolu 3 ans avant que l'industrie ait les outils d'aujourd'hui.
Ce cas est l'argument de réassurance technique le plus fort du portfolio. Quand l'état de l'art n'existe pas, Leando le construit, pas seulement l'applique. C'est une différence structurelle avec la majorité des acteurs du marché.
La transférabilité de cette expertise est documentée : les techniques de computer vision développées pour Ministudio ont été réutilisées et adaptées pour un industriel agroalimentaire, de l'art à l'industrie alimentaire, la même rigueur de R&D appliquée à un contexte industriel. Ce n'est pas une coïncidence, c'est une méthode.
Projet IA ambitieux ?
30 min pour évaluer si votre projet IA demande de l'intégration, ou de la recherche. On vous dit honnêtement ce qu'on peut faire.
Discuter de votre projet en 30 minRegard extérieur + vision technique = offerts