Oya × IA — diagnostic de reconversion vers la transition alimentaire
Comment des solutions d'IA, d'agents et de RAG peuvent servir une structure comme Oya.
Yannick Tindy · Chef de projet IA
Cadrage · 1 / 9
Le système alimentaire recrute, mais personne ne sait où aller.
Premier employeur de France toute chaîne confondue, le système alimentaire est paradoxalement en tension de recrutement à chaque maillon — et reste peu lisible pour qui veut s'y reconvertir.
Une double tension à relier
L'enjeu d'emploi (postes non pourvus, métiers peu attractifs) rejoint l'enjeu environnemental : l'alimentation est le premier levier de la transition écologique. Les deux se résolvent ensemble — par la formation et l'orientation des talents.
Le problème vécu — deux besoins encore séparés
Beaucoup veulent « travailler dans l'alimentation durable » sans savoir vers quel métier, ni quelles compétences de leur parcours sont transférables ; les offres de formation sont dispersées et rarement personnalisées. En face, une structure comme Oya cherche à attirer et qualifier ces talents.
🏢 Le besoin d'Oya
Orienter les bonnes personnes vers les métiers de la transition, et faire de ce diagnostic un produit d'appel vers ses formations — tout en valorisant son référentiel de données.
🧭 Le besoin de la personne
Savoir vers quel métier se reconvertir, quelles compétences transférables valoriser, et être guidée avec confiance plutôt que noyée dans des offres dispersées.
Ces deux besoins ont longtemps été traités séparément — les relier est précisément là où l'IA crée le plus de valeur.
Une jeune structure, des moyens comptés, un besoin précis.
Contexte
Oya — SAS ESUS à mission, en cours de création, issue du réseau associatif Les Cols Verts (agriculture urbaine depuis 2016). EdTech « de la fourche à la fourchette », seule à viser toute la chaîne quand les acteurs sont silotés.
Contraintes
- Une personne en interne (le fondateur), équipe technique à recruter (post-levée).
- Moyens de lancement limités → appétence no-code / low-tech.
- RGPD sur les données apprenants ; mise en service visée à la rentrée.
L'analyse du besoin : un même outil pour deux besoins
Le choix structurant du projet : le quiz et l'analyse de CV placent l'IA exactement à l'intersection du besoin d'Oya et du besoin de la personne. C'est le choix à plus forte valeur, car un seul outil sert simultanément la stratégie de la structure et le projet de vie de l'individu.
Reformulation du besoin
« Permettre à une personne en reconversion d'identifier en quelques minutes les métiers de la transition alimentaire qui correspondent à son profil, à ses contraintes et à ses compétences transférables — et de comprendre pourquoi. »
Opportunités d'usage IA
- Diagnostic & matching profil ↔ métier : relie compétences vécues et métiers Oya.
- Personnalisation & explicabilité : pourquoi ce métier, quels écarts à combler.
- Agrégation de données publiques : la valeur d'Oya = le référentiel agrégé, pas la techno (posture agrégateur).
Solution · 3 / 9
Trois briques IA au service de la reconversion.
Le quiz aide à choisir au plus près · le CV agentique fait le pont vers la reconversion en exploitant les données Oya · le RAG consolide et source l'ensemble.
Architecture du système
oya_corpus · cosine ≥ 0.4 · dégradation gracieuse+ RAG top-k 1 (insight affiché)
Le traitement agentique du CV — 5 agents séquentiels
Un prompt unique produit des résultats tièdes et génériques. Le CV est donc traité par une chaîne de 5 agents, chacun au rôle étroit et vérifiable — c'est ce qui permet de coller au plus près de la personne :
Orchestration : extraction d'abord, puis 4 passes GLM-4.5-air focalisées (compétences · profil · synthèse · plan), chacune avec retry et repli statique — ~15 s/CV. cible : passes en parallèle + agents transversales / soft-skills dédiés + modèle premium pour la synthèse
Le RAG : consolider et sourcer, sans halluciner.
Le RAG est la colonne documentaire du diagnostic : il transforme le corpus Oya en mémoire interrogeable, pour ancrer les réponses dans des sources réelles plutôt que dans l'invention du modèle.
Le RAG en pratique
oya_corpuscosinus · seuil ≥ 0,4 · idempotent (hash)Où le RAG agit
- Câblé au quiz : un insight sourcé (top-k 1) enrichit le parcours.
- Découplé du CV (choix assumé) : l'analyse agentique reste rapide et déterministe ; le brancher sur le CV = évolution EPIC-003.
Garanties
- Dégradation gracieuse : Qdrant indisponible → réponse sans citation, jamais d'erreur.
- Anti-hallucination : « écrire sans citation plutôt qu'inventer ».
- Découplé : changer le corpus = ré-indexer, zéro code.
Logique de fonctionnement & choix techniques
Deux portes d'entrée — CV (5 agents) ou quiz (scoring par règles) — convergent vers un même diagnostic : 3 métiers classés, un récit, un plan 90 jours et un PDF.
Choix technologiques
- Django multisite + Alpine.js (parcours fluide, sans SPA lourde).
- Scoring par règles (Python pur, déterministe, traçable).
- MiniLM 384d + Qdrant (RAG léger, multilingue).
- GLM-4.5-air pour les agents CV · WeasyPrint pour le PDF.
🔒 RGPD & ♿ accessibilité
- CV traité en mémoire, jamais sur disque ; conservation 24 mois (commande de purge dédiée) + logs anonymisés.
- Thème contrasté WCAG, « cocher plutôt qu'écrire », navigation clavier.
Pilotage · 5 / 9
Une livraison incrémentale, testée à chaque étape.
Démarche & roadmap
Approche itérative type agile : un POC fonctionnel de bout en bout, puis 15+ incréments (V2 → V16) ajoutant fiche résultat enrichie, partage, back-office d'analytics, sécurisation. Trois EPICs de relance structurent la suite :
EPIC-001
Parcours quiz fluide mono-page (3 niveaux).
EPIC-002
Design system — charte graphique imposée.
EPIC-003
RAG opérationnel — citations sourcées CV + quiz.
Ressources mobilisées
Projet réalisé en solo (développeur full-stack / chef de projet IA), avec le commanditaire (Les Cols Verts) validant le scoring et le périmètre. Infrastructure conteneurisée Podman (Django multisite + Qdrant dédié), outillage QA intégré.
Coûts maîtrisés, valeur mesurable, risques anticipés.
💶 Coûts & ROI
- Scoring déterministe : 7 ms, coût ≈ 0 €.
- Génération LLM : ≤ 20 s, ~0,005 €/CV estim.
- Hébergement ~100 €/mois estim.
- ROI : quiz = produit d'appel à coût marginal quasi nul, alimentant les formations (cœur de revenu).
📊 Indicateurs de réussite
- Implémentés : diagnostics totaux / 30 j, top métiers, secteurs, vues iframe.
- Cibles hypothèses : complétion quiz > 60 %, clic → formation > 15 %, coût / diagnostic < 0,01 €.
Risques, limites & contraintes
⚠️ Risques
- Dépendance LLM → fallback 3 niveaux (GLM → Qwen → texte statique).
- Qualité RAG à valider → seuil cosine 0.4 + tests + dégradation gracieuse.
- Latence API → génération asynchrone + cache.
🚧 Limites connues
- Dimension secteur souvent neutre (dépend du remplissage du référentiel).
- Référentiel partiellement renseigné sur certaines colonnes.
- Mise en production à finaliser (actions VPS restantes).
Déploiement · 7 / 9
Pensé pour grandir et s'intégrer.
Stratégie de passage à l'échelle
Cibles séquentielles sans refonte d'architecture : B2B salariés agri-agro (amorçage, dès la rentrée) → B2C reconversion → collectivités territoriales, puis ouverture multi-secteurs. Le référentiel agrégé se réutilise d'une cible à l'autre.
Intégration à l'existant
Points d'intégration livrés
- Quiz embeddable
<iframe>+ analytics de vues. - Webhook post-diagnostic (vers CRM), API JSON sessions.
- Import du référentiel en XLSX (modifiable sans dev) ; export CSV des sessions / diagnostics.
Cap : vers le LMS
- Standards SCORM / xAPI, OpenBadges, CPF, Qualiopi-ready.
- Posture make-or-buy : agréger les meilleurs outils (ex. Ouvre ta ferme) plutôt que recréer.
Adoptable sans friction, maintenable sans dev.
Dispositif d'accompagnement utilisateurs
Côté apprenant
- Quiz 5 min, sans compte, « cocher plutôt qu'écrire ».
- Résultat automatique ; le conseiller intervient en fin de parcours.
- Landing + « comment ça marche » en 3 étapes.
Côté équipe Oya
- Back-office d'analytics (diagnostics, secteurs, métiers).
- Référentiel modifiable par le métier (admin Django, import CSV).
Plan de pérennité — maintenance & évolutions
- Purge RGPD 24 mois par commande dédiée.
- Ré-indexation RAG par simple commande (corpus découplé du code).
- Fixture rechargeable du référentiel (reproductible sur environnement vierge).
- Tests automatisés garantissant la non-régression à chaque évolution.
Prise de recul · 9 / 9
Ce que la solution ne fait pas (encore).
Limites identifiées
- MVP pragmatique vs vision : scoring par règles (et non vectoriel) ; CV traité par 5 agents séquentiels (extraction + 4 passes GLM) — la cible ajoute la parallélisation, des agents transversales / soft-skills dédiés et le RAG branché sur le CV.
- Une dimension de scoring (secteur) à fiabiliser via le référentiel.
- Qualité du RAG à valider empiriquement sur le corpus réel.
- Mise en production et tests UI end-to-end à finaliser.
Améliorations & perspectives
- Activer pleinement le RAG (EPIC-003) : corpus indexé + citations sourcées, y compris sur le CV.
- Paralléliser les agents + passes dédiées (transversales, soft-skills) + modèle premium pour la synthèse.
- LMS intégré + ouverture B2B / collectivités.
- Subventions Deep Tech adossées au corpus propriétaire.
En orchestrant agents et RAG autour des données d'Oya, une jeune structure aux moyens comptés offre un diagnostic de reconversion personnalisé, sourcé et explicable — là où l'IA sert vraiment le métier, sans s'y substituer.