Cadrage · 1 / 9

Le système alimentaire recrute, mais personne ne sait où aller.

Premier employeur de France toute chaîne confondue, le système alimentaire est paradoxalement en tension de recrutement à chaque maillon — et reste peu lisible pour qui veut s'y reconvertir.

1er

employeur de France (chaîne alimentaire complète)

~3 %

d'actifs agricoles, métiers « hyper en tension »

4

maillons en tension : production · agro · distribution · restauration

Une double tension à relier

L'enjeu d'emploi (postes non pourvus, métiers peu attractifs) rejoint l'enjeu environnemental : l'alimentation est le premier levier de la transition écologique. Les deux se résolvent ensemble — par la formation et l'orientation des talents.

Le problème vécu — deux besoins encore séparés

Beaucoup veulent « travailler dans l'alimentation durable » sans savoir vers quel métier, ni quelles compétences de leur parcours sont transférables ; les offres de formation sont dispersées et rarement personnalisées. En face, une structure comme Oya cherche à attirer et qualifier ces talents.

🏢 Le besoin d'Oya

Orienter les bonnes personnes vers les métiers de la transition, et faire de ce diagnostic un produit d'appel vers ses formations — tout en valorisant son référentiel de données.

🧭 Le besoin de la personne

Savoir vers quel métier se reconvertir, quelles compétences transférables valoriser, et être guidée avec confiance plutôt que noyée dans des offres dispersées.

Ces deux besoins ont longtemps été traités séparément — les relier est précisément là où l'IA crée le plus de valeur.

Cadrage · 2 / 9

Une jeune structure, des moyens comptés, un besoin précis.

Contexte

Oya — SAS ESUS à mission, en cours de création, issue du réseau associatif Les Cols Verts (agriculture urbaine depuis 2016). EdTech « de la fourche à la fourchette », seule à viser toute la chaîne quand les acteurs sont silotés.

Contraintes

Une personne en interne (le fondateur), équipe technique à recruter (post-levée).
Moyens de lancement limités → appétence no-code / low-tech.
RGPD sur les données apprenants ; mise en service visée à la rentrée.

L'analyse du besoin : un même outil pour deux besoins

Le choix structurant du projet : le quiz et l'analyse de CV placent l'IA exactement à l'intersection du besoin d'Oya et du besoin de la personne. C'est le choix à plus forte valeur, car un seul outil sert simultanément la stratégie de la structure et le projet de vie de l'individu.

🏢 Besoin Oyaqualifier des talents · produit d'appel vers les formations · valoriser ses données

🤝 Quiz + Analyse de CVle point de rencontre — la valeur maximale de l'IA

🧭 Besoin personnetrouver son métier · valoriser ses acquis · être guidée avec confiance

Reformulation du besoin

« Permettre à une personne en reconversion d'identifier en quelques minutes les métiers de la transition alimentaire qui correspondent à son profil, à ses contraintes et à ses compétences transférables — et de comprendre pourquoi. »

Opportunités d'usage IA

Diagnostic & matching profil ↔ métier : relie compétences vécues et métiers Oya.
Personnalisation & explicabilité : pourquoi ce métier, quels écarts à combler.
Agrégation de données publiques : la valeur d'Oya = le référentiel agrégé, pas la techno (posture agrégateur).

Solution · 3 / 9

Trois briques IA au service de la reconversion.

Le quiz aide à choisir au plus près · le CV agentique fait le pont vers la reconversion en exploitant les données Oya · le RAG consolide et source l'ensemble.

Architecture du système

📚 Corpus Oya8 sources (PDF · XLSX · MD) — référentiel 80 métiers / 51 compétences

⚙️ Indexationextraction → chunks ~600 mots → embeddings MiniLM L12 v2 (384d)

🔎 Qdrantcollection oya_corpus · cosine ≥ 0.4 · dégradation gracieuse

▼ RAG (retrieval sémantique) ▼

📄 Dépôt CV (PDF)Pipeline agentique — 5 agents séquentiels (détail ci-dessous)

📝 Quiz 5 min8 familles · 3 niveaux → scoring 5 dimensions (règles, 7 ms)
+ RAG top-k 1 (insight affiché)

▼

🌱 DiagnosticTop 3 métiers · récit personnalisé · plan 90 jours · PDF · citations sourcées

Le traitement agentique du CV — 5 agents séquentiels

Un prompt unique produit des résultats tièdes et génériques. Le CV est donc traité par une chaîne de 5 agents, chacun au rôle étroit et vérifiable — c'est ce qui permet de coller au plus près de la personne :

1

Extracteur · déterministe, sans LLMLit le CV PDF en mémoire (pdfplumber) et le normalise en texte — jamais écrit sur disque (RGPD).

2

Compétences · GLMRepère, parmi les 51 compétences du référentiel Oya, celles réellement attestées — avec la preuve citée dans le CV.

3

Profil · GLMDéduit le secteur d'origine et reconstitue l'identité de contact (jamais inventée) pour permettre le recontact.

4

Synthèse · GLMAssemble un récit chaleureux, sans jargon RH, qui valorise le parcours et révèle ce que la personne ne voit pas en elle.

5

Plan 90 jours · GLMTrace un plan d'action en 3 phases (cartographier · tester · engager), ancré sur les métiers réels du diagnostic.

Orchestration : extraction d'abord, puis 4 passes GLM-4.5-air focalisées (compétences · profil · synthèse · plan), chacune avec retry et repli statique — ~15 s/CV. cible : passes en parallèle + agents transversales / soft-skills dédiés + modèle premium pour la synthèse

Solution · 4 / 9

Le RAG : consolider et sourcer, sans halluciner.

Le RAG est la colonne documentaire du diagnostic : il transforme le corpus Oya en mémoire interrogeable, pour ancrer les réponses dans des sources réelles plutôt que dans l'invention du modèle.

Le RAG en pratique

📚 Corpus · 8 sourcesPDF · XLSX · MD → chunks ~600 mots (overlap 100)

🧠 MiniLM L12 v2embeddings 384d · multilingue FR/EN · ~220 Mo

🔎 Qdrant oya_corpuscosinus · seuil ≥ 0,4 · idempotent (hash)

Où le RAG agit

Câblé au quiz : un insight sourcé (top-k 1) enrichit le parcours.
Découplé du CV (choix assumé) : l'analyse agentique reste rapide et déterministe ; le brancher sur le CV = évolution EPIC-003.

Garanties

Dégradation gracieuse : Qdrant indisponible → réponse sans citation, jamais d'erreur.
Anti-hallucination : « écrire sans citation plutôt qu'inventer ».
Découplé : changer le corpus = ré-indexer, zéro code.

Logique de fonctionnement & choix techniques

Deux portes d'entrée — CV (5 agents) ou quiz (scoring par règles) — convergent vers un même diagnostic : 3 métiers classés, un récit, un plan 90 jours et un PDF.

Choix technologiques

Django multisite + Alpine.js (parcours fluide, sans SPA lourde).
Scoring par règles (Python pur, déterministe, traçable).
MiniLM 384d + Qdrant (RAG léger, multilingue).
GLM-4.5-air pour les agents CV · WeasyPrint pour le PDF.

🔒 RGPD & ♿ accessibilité

CV traité en mémoire, jamais sur disque ; conservation 24 mois (commande de purge dédiée) + logs anonymisés.
Thème contrasté WCAG, « cocher plutôt qu'écrire », navigation clavier.

Pilotage · 5 / 9

Une livraison incrémentale, testée à chaque étape.

Démarche & roadmap

Approche itérative type agile : un POC fonctionnel de bout en bout, puis 15+ incréments (V2 → V16) ajoutant fiche résultat enrichie, partage, back-office d'analytics, sécurisation. Trois EPICs de relance structurent la suite :

EPIC-001

Parcours quiz fluide mono-page (3 niveaux).

EPIC-002

Design system — charte graphique imposée.

EPIC-003

RAG opérationnel — citations sourcées CV + quiz.

90+

tests automatisés (scoring · CV · RAG · intégration)

80 / 51

métiers / compétences cartographiés

16+

incréments livrés (POC → V16)

Ressources mobilisées

Projet réalisé en solo (développeur full-stack / chef de projet IA), avec le commanditaire (Les Cols Verts) validant le scoring et le périmètre. Infrastructure conteneurisée Podman (Django multisite + Qdrant dédié), outillage QA intégré.

Pilotage · 6 / 9

Coûts maîtrisés, valeur mesurable, risques anticipés.

💶 Coûts & ROI

Scoring déterministe : 7 ms, coût ≈ 0 €.
Génération LLM : ≤ 20 s, ~0,005 €/CV estim.
Hébergement ~100 €/mois estim.
ROI : quiz = produit d'appel à coût marginal quasi nul, alimentant les formations (cœur de revenu).

📊 Indicateurs de réussite

Implémentés : diagnostics totaux / 30 j, top métiers, secteurs, vues iframe.
Cibles hypothèses : complétion quiz > 60 %, clic → formation > 15 %, coût / diagnostic < 0,01 €.

Risques, limites & contraintes

⚠️ Risques

Dépendance LLM → fallback 3 niveaux (GLM → Qwen → texte statique).
Qualité RAG à valider → seuil cosine 0.4 + tests + dégradation gracieuse.
Latence API → génération asynchrone + cache.

🚧 Limites connues

Dimension secteur souvent neutre (dépend du remplissage du référentiel).
Référentiel partiellement renseigné sur certaines colonnes.
Mise en production à finaliser (actions VPS restantes).

Déploiement · 7 / 9

Pensé pour grandir et s'intégrer.

Stratégie de passage à l'échelle

Cibles séquentielles sans refonte d'architecture : B2B salariés agri-agro (amorçage, dès la rentrée) → B2C reconversion → collectivités territoriales, puis ouverture multi-secteurs. Le référentiel agrégé se réutilise d'une cible à l'autre.

Intégration à l'existant

Points d'intégration livrés

Quiz embeddable <iframe> + analytics de vues.
Webhook post-diagnostic (vers CRM), API JSON sessions.
Import du référentiel en XLSX (modifiable sans dev) ; export CSV des sessions / diagnostics.

Cap : vers le LMS

Standards SCORM / xAPI, OpenBadges, CPF, Qualiopi-ready.
Posture make-or-buy : agréger les meilleurs outils (ex. Ouvre ta ferme) plutôt que recréer.

Déploiement · 8 / 9

Adoptable sans friction, maintenable sans dev.

Dispositif d'accompagnement utilisateurs

Côté apprenant

Quiz 5 min, sans compte, « cocher plutôt qu'écrire ».
Résultat automatique ; le conseiller intervient en fin de parcours.
Landing + « comment ça marche » en 3 étapes.

Côté équipe Oya

Back-office d'analytics (diagnostics, secteurs, métiers).
Référentiel modifiable par le métier (admin Django, import CSV).

Plan de pérennité — maintenance & évolutions

Purge RGPD 24 mois par commande dédiée.
Ré-indexation RAG par simple commande (corpus découplé du code).
Fixture rechargeable du référentiel (reproductible sur environnement vierge).
Tests automatisés garantissant la non-régression à chaque évolution.

Prise de recul · 9 / 9

Ce que la solution ne fait pas (encore).

Limites identifiées

MVP pragmatique vs vision : scoring par règles (et non vectoriel) ; CV traité par 5 agents séquentiels (extraction + 4 passes GLM) — la cible ajoute la parallélisation, des agents transversales / soft-skills dédiés et le RAG branché sur le CV.
Une dimension de scoring (secteur) à fiabiliser via le référentiel.
Qualité du RAG à valider empiriquement sur le corpus réel.
Mise en production et tests UI end-to-end à finaliser.

Améliorations & perspectives

Activer pleinement le RAG (EPIC-003) : corpus indexé + citations sourcées, y compris sur le CV.
Paralléliser les agents + passes dédiées (transversales, soft-skills) + modèle premium pour la synthèse.
LMS intégré + ouverture B2B / collectivités.
Subventions Deep Tech adossées au corpus propriétaire.

En orchestrant agents et RAG autour des données d'Oya, une jeune structure aux moyens comptés offre un diagnostic de reconversion personnalisé, sourcé et explicable — là où l'IA sert vraiment le métier, sans s'y substituer.

Oya × IA — diagnostic de reconversion vers la transition alimentaire