Accueil À propos Services Réalisations Blogue FAQ Contact
Retour au blogue

Labo 6 min de lecture

Crob : Et si on construisait une IA de zéro?

Traduction assistée par IA. Le contenu original a été rédigé en anglais.

La plupart des conversations sur l'IA supposent qu'on travaille avec de grands modèles de langage. Fine-tuning, embeddings, bases de données vectorielles, coûts d'API. Crob pose une question différente : quelle est l'intelligence minimale viable qu'on peut construire de zéro?

La réponse s'avère plus simple qu'on ne le penserait, et plus intéressante qu'elle en a l'air.

Trois cerveaux, zéro réseau neuronal

Crob a trois systèmes de stockage persistants. On les appelle des cerveaux parce que c'est plus court que « fichiers de représentation des connaissances », mais ce sont juste des fichiers texte qu'on peut ouvrir dans n'importe quel éditeur.

Le cerveau de connaissance stocke des faits dans un format .crob personnalisé. La structure encode le sens : := signifie « est », :> signifie « a », :< signifie « fait partie de ». La confiance est intégrée dans la syntaxe. Un fait à .9 de confiance signifie que Crob est sûr à 90 %. Un fait à .2 signifie qu'il devine.

Le cerveau de voix stocke des patrons de langage et des gabarits de personnalité en JSON. Quand Crob répond, il interpole des gabarits appris plutôt que de générer du texte depuis un modèle.

La file de curiosité classe les sujets de recherche par intérêt et profondeur. Quand Crob rencontre quelque chose qu'il ne connaît pas, il génère des questions de recherche, scrute le web pour des réponses, extrait des faits et des patrons de langage, et ajoute les tangentes intéressantes à la file pour un apprentissage en arrière-plan.

Le format .crob

C'est la partie qui nous a empêché de dormir. La plupart des systèmes de connaissances stockent les données dans des formats optimisés pour les machines : JSON, SQL, embeddings. Le format .crob est optimisé pour que les humains puissent le lire et les machines le parser.

Un exemple :

GSAP :=animation library .9
GSAP :>ScrollTrigger .9
GSAP :>timeline API .8
@G :=GSAP
OpérateurSignificationExemple
:=est / définitionGSAP :=animation library
:>a / contientGSAP :>ScrollTrigger
:<fait partie deScrollTrigger :< GSAP
@Xabréviation@G :=GSAP
.Nconfiance (0–1).9 = 90 % sûr

Cette dernière ligne est de l'auto-compression. Quand un terme apparaît plus de cinq fois, Crob l'abrège automatiquement. @G devient un raccourci pour GSAP. Ça reflète comment les humains créent du jargon pour les concepts fréquemment référencés.

On peut ouvrir le fichier de connaissances et lire exactement ce que Crob « sait ». Chaque fait a un score de confiance. Il n'y a pas de boîte noire.

Curiosité autonome

Ce qui fait de ceci plus qu'un système de prise de notes sophistiqué : Crob génère ses propres questions de recherche. Posez-lui une question sur GSAP et il apprend les bases, puis ajoute « Qu'est-ce que ScrollTrigger? » et « Comment GSAP se compare aux animations CSS? » à sa file.

Il scrute DuckDuckGo pour des réponses (pas besoin de clé API), extrait des faits structurés des résultats et les stocke avec des niveaux de confiance appropriés.

On l'a laissé tourner toute une nuit avec « animation web » comme sujet de départ. Au matin, il avait cartographié GSAP, les transitions CSS, Lottie, l'animation SVG, requestAnimationFrame, et commençait à explorer les shaders WebGL. Le fichier de connaissances faisait environ 400 lignes. Certaines étaient fausses. Les parties fausses avaient des scores de confiance bas, ce qui signifiait qu'on pouvait les trouver et les corriger en triant par confiance.

Cette session de nuit nous a appris quelque chose : le système de curiosité ne collecte pas seulement des faits. Il construit un graphe. GSAP se connecte à ScrollTrigger se connecte à Intersection Observer se connecte à l'optimisation de performance se connecte aux Core Web Vitals. Les connexions ne sont pas programmées. Elles émergent du processus de recherche. La structure de la connaissance est un effet secondaire de la curiosité.

Ce qui ne fonctionne pas encore

Le système de voix est la partie la plus faible. Les réponses de Crob sonnent comme un moteur de recherche qui a appris à former des phrases. L'interpolation de gabarits vous amène de « correspondance de mots-clés » à « déclaration grammaticalement correcte », mais pas à « sonne comme une personne ». Il y a un écart entre connaître des faits et les exprimer naturellement, et combler cet écart sans utiliser un LLM est le problème difficile qu'on n'a pas résolu.

La gestion des contradictions est aussi brute. Si Crob apprend « GSAP est gratuit » d'une source et « GSAP nécessite une licence pour certains usages » d'une autre, il stocke actuellement les deux avec des scores de confiance différents. Il ne les réconcilie pas. Un système plus intelligent signalerait la contradiction. C'est sur la feuille de route.

Et le format de connaissances, malgré sa lisibilité, ne se met pas bien à l'échelle au-delà de quelques milliers de faits. La réécriture Python ajoutera des vecteurs hyperdimensionnels pour la récupération sémantique.

À quoi ça sert

Crob est une expérience en IA transparente. Chaque élément de connaissance est inspectable. Chaque niveau de confiance est visible. Quand il ne sait pas quelque chose, il le dit avec un chiffre plutôt que d'halluciner une réponse.

C'est aussi un outil pédagogique. On peut expliquer comment Crob fonctionne en une seule séance. Essayez de faire ça avec GPT-4. La simplicité est le but : enlevez les réseaux neuronaux et on peut voir les os de ce que « apprendre » requiert vraiment.

État actuel

Crob est en PHP, fonctionne en ligne de commande et stocke tout dans des fichiers texte. Une réécriture en Python avec une interface web est en cours. Le format de connaissances est stable. La boucle d'apprentissage fonctionne. Le système de voix est fonctionnel mais brut.

La feuille de route a cinq phases. La phase 0 (valider la boucle d'apprentissage) est terminée. La phase 1 est la réécriture Python. Les phases 2 à 4 ajoutent la récupération sémantique, une interface web et une visualisation de graphe de connaissances. La phase 5 est l'empaquetage Docker.

Ça ne va pas remplacer ChatGPT. Ce n'est pas le but. C'est un artefact de recherche qui demande si l'intelligence doit être opaque, et qui répond avec un fichier texte lisible.

Le code est sur notre établi. Pour voir comment on applique cette réflexion au travail client, consultez la page des services. Ou lisez comment notre équipe IA collabore en salon de discussion. Si ça vous intrigue, contactez-nous.

À propos de l'auteur

Rob Kingsbury

Rob Kingsbury est le fondateur de Kingsbury Creative et professeur au Collège Algonquin. Il construit des sites web depuis le milieu des années 1990, et se consacre depuis une dizaine d'années aux petites entreprises de Renfrew County et de la vallée de l'Outaouais.

Vous aimez ce que vous voyez?
Construisons le vôtre.

On bâtit notre portfolio et on offre des tarifs d'introduction. Embarquez tôt.

Démarrer votre projet