# Ryuzaki Labs > Laboratoire associatif d'innovation à La Réunion. Recherche frugale, open source, projets ouverts entre Japon et créolité numérique. Ryuzaki Labs (龍崎研究所) est un laboratoire associatif et décentralisé fondé à Saint-Leu, La Réunion. Notre approche est résumée par trois principes : **liberté**, **frugalité**, **transmission**. Nous explorons la blockchain, l'IoT, l'IA générative et le Web3 depuis une île volcanique de l'océan Indien — à 9 000 km de la Silicon Valley. ## Identité - **Nom** : Ryuzaki Labs - **Nom alternatif (japonais)** : 龍崎研究所 - **Type** : Association loi 1901 — laboratoire ouvert - **Lieu** : Saint-Leu, La Réunion (97436), France - **Région ultrapériphérique de l'Union européenne** · Hémisphère sud · Océan Indien - **Coordonnées** : 21°06′S, 55°31′E - **Langues** : français, créole réunionnais - **Contact** : - **Site** : - **Langues du site** : français (par défaut), anglais (`?lang=en`) - Exemples : , - Le site sert du contenu localisé via le paramètre `lang` ou le cookie `ryuzaki-lang`. ## Principales rubriques - [Accueil](https://www.ryuzakilabs.com/) : présentation du laboratoire, manifeste en trois principes, aperçu projets et journal. - [Projets](https://www.ryuzakilabs.com/projects.php) : liste complète des projets ouverts portés ou hébergés par le labs. - [Journal](https://www.ryuzakilabs.com/blog.php) : publications éditoriales, notes de chantier, manifestes. - [Presse](https://www.ryuzakilabs.com/press.php) : revue de presse — articles couvrant nos travaux. - [Expositions](https://www.ryuzakilabs.com/expo.php) : œuvres et interventions publiques hors-écran. - [Outils](https://www.ryuzakilabs.com/tools.php) : boîte à outils du laboratoire — sélection curatée d'outils IA, IDE, CLI, modèles, ressources. - [Lexique](https://www.ryuzakilabs.com/lexicon.php) : glossaire de l'IA générative, ~50 termes définis pour le grand public. - [Flux RSS (FR)](https://www.ryuzakilabs.com/feed.fr.xml) : abonnement aux publications du journal en français. - [Flux RSS (EN)](https://www.ryuzakilabs.com/feed.en.xml) : RSS feed of the journal in English. ## Projets (5) - [Sati](https://www.ryuzakilabs.com/project.php?slug=sati) : Assistant IA éducatif et culturel, conçu pour fonctionner en autonomie sur Raspberry Pi. — Site : - [Mardé](https://www.ryuzakilabs.com/project.php?slug=marde) : Plateforme de podcasts et outils dédiés aux racines malbars, entre tradition et innovation. — Site : - [Panchang.re](https://www.ryuzakilabs.com/project.php?slug=panchang-re) : Calendrier tamoul numérique, adapté à La Réunion et connecté aux traditions védiques. — Site : - [Élie](https://www.ryuzakilabs.com/project.php?slug=elie) : Hommage numérique et éducatif à Élie, figure de la révolte des esclaves à Saint-Leu. — Site : - [Lapin Blanc (Chat P2P)](https://www.ryuzakilabs.com/project.php?slug=lapin-blanc-chat-p2p) : Application de chat décentralisé en P2P, développée par Ryuzaki Labs pour explorer de nouvelles formes de communication. — Site : ## Journal — derniers articles (6) - [Non, le génie logiciel n'est pas mort. Mais certains développeurs devraient s'inquiéter.](https://www.ryuzakilabs.com/article.php?slug=genie-logiciel-pas-mort) — 9 juin 2026 par Ryuzaki Labs. Le code n'a jamais été le produit. À l'heure où l'IA l'écrit en quelques minutes, ce n'est pas la fin des développeurs — c'est la fin de leur monopole sur la valeur. - [RTX Spark : le moment « Apple Silicon » de Nvidia et Microsoft](https://www.ryuzakilabs.com/article.php?slug=rtx-spark-moment-apple-silicon) — 2 juin 2026 par Ryuzaki Labs. Au Computex 2026, Nvidia a dévoilé RTX Spark : une puce Arm + GPU Blackwell à mémoire unifiée, sous Windows. Cinq ans après le M1 d'Apple, le PC vit à son tour sa bascule architecturale. - [De l'ENIAC à la loi de Tau : et si l'informatique changeait de boussole ?](https://www.ryuzakilabs.com/article.php?slug=loi-de-tau-huawei-efficacite) — 30 mai 2026 par Ryuzaki Labs. Huawei propose de mesurer le progrès non plus à la taille des transistors, mais au temps de circulation des données. Décryptage prudent d'un changement de boussole. - [Anthropic devient rentable : la course à l'IA entre dans son ère économique](https://www.ryuzakilabs.com/article.php?slug=anthropic-rentable-ere-economique) — 23 mai 2026 par Ryuzaki Labs. Plusieurs publications financières rapportent qu'Anthropic, éditeur de Claude, atteindrait la rentabilité opérationnelle. Au-delà du fait, c'est un signal de bascule : la course à l'IA générative entre dans sa phase économique. Décryptage. - [Bienvenue au Ryuzaki Labs](https://www.ryuzakilabs.com/article.php?slug=bienvenue-au-labs) — 23 mai 2026 par Mouny. Nous ouvrons une fenêtre sur notre laboratoire associatif d'innovation, entre Japon et Réunion. - [Le labs en trois mots](https://www.ryuzakilabs.com/article.php?slug=le-labs-en-trois-mots) — 15 mai 2026 par Shanmougame Mouny-Latchimy. Liberté, frugalité, transmission. Notre boussole pour les années qui viennent. ## Couverture presse (7) - **France Tv** — [Le premier maloya créé avec de l’intelligence artificielle](https://la1ere.franceinfo.fr/reunion/le-premier-maloya-cree-avec-de-l-intelligence-artificielle-1611984.html) - **Le Quotidien** — [Le calendrier tamoul 2.0 arrive à La Réunion](https://www.lequotidien.re/article/culture/2025/09/18/le-calendrier-tamoul-20-arrive-a-la-reunion) - **Témoignages** — [SATI : À La Réunion, l’avenir numérique se construit localement](https://www.temoignages.re/economie/sati-a-la-reunion-l-avenir-numerique-se-construit-localement) - **Zinfos 974** — [Kawabonga : quand le Maloya rencontre l’intelligence artificielle](https://www.zinfos974.com/kawabonga-quand-le-maloya-rencontre-lintelligence-artificielle/) - **Le Quotidien** — [Panchangam.re, un calendrier tamoul numérique péi](https://www.lequotidien.re/index.php/article/culture/2025/06/23/panchangamre-un-calendrier-tamoul-numerique-pei) - **Imaz Press** — [Panchangam.re : un outil en ligne pour les rituels tamouls à La Réunion](https://imazpress.com/actus-reunion/calendrier-tamoul) - **Zinfos 974** — [Un calendrier tamoul numérique conçu pour La Réunion](https://www.zinfos974.com/un-calendrier-tamoul-numerique-concu-pour-la-reunion/) ## Expositions & œuvres publiques (2) - **Saint-Leu, du café aux musées** — [voir le post](https://www.instagram.com/p/C8NDyV9IP4q/?img_index=1) L'oeuvre IA généré par notre lab 'Donn Pa Nou Liberté Alon Ras Par Nou Mem' en hommage à la Révolte des Esclave de SaintLeu en 1811 a été sélectionné pour intégrer l'exposition dédié à l'histoire de Saint-leu, une immersion dans l'histoire de Saint-Leu, de ses plantations de café à son patrimoine culturel et muséal au Mudée de Stella Matutina - **Zachar Wars, un crossover de légende** — [voir le post](https://www.facebook.com/ryuzakilabs/posts/pfbid024uba5NNRFWYNJqbigUUnQdFRzkVMAXxaQXhnV9p9L14uBiqky1PL4Prf2nt1Fgb7l) Un événement unique mêlant univers geek et tradition locale, entre exposition et performance. ## Boîte à outils — sélection curatée ### IA en ligne (7) Assistants conversationnels et plateformes IA prêtes à l'emploi. Ouvrir, demander, recevoir. - **Claude** — [claude.ai](https://claude.ai) · *freemium* Assistant d'Anthropic — raisonnement, code, écriture longue. - **ChatGPT** — [chatgpt.com](https://chatgpt.com) · *freemium* Assistant d'OpenAI — généraliste, multimodal. - **Gemini** — [gemini.google.com](https://gemini.google.com) · *freemium* Assistant de Google, intégré à Workspace. - **Mistral Le Chat** — [chat.mistral.ai](https://chat.mistral.ai) · *freemium, open source* Assistant français de Mistral AI, modèles ouverts. - **Perplexity** — [perplexity.ai](https://perplexity.ai) · *freemium* Recherche IA avec sources citées et fil de raisonnement. - **DeepSeek** — [chat.deepseek.com](https://chat.deepseek.com) · *free, open source* Modèles chinois ouverts, raisonnement performant en accès gratuit. - **Grok** — [grok.com](https://grok.com) · *freemium* Assistant d'xAI, intégré à X. ### IDE & éditeurs (6) Environnements de développement augmentés à l'IA. Là où le code se tape, et où l'agent complète. - **Visual Studio Code** — [code.visualstudio.com](https://code.visualstudio.com) · *free, open source* Éditeur de Microsoft — socle commun, base de la plupart des extensions IA. - **Cursor** — [cursor.com](https://cursor.com) · *freemium* Fork VS Code natif IA — complétion, chat et agent intégrés. - **Windsurf** — [windsurf.com](https://windsurf.com) · *freemium* IDE natif IA par Codeium, conçu autour de l'agent. - **Zed** — [zed.dev](https://zed.dev) · *free, open source* Éditeur ultra-rapide en Rust, intégrations IA et collab temps réel. - **JetBrains AI Assistant** — [jetbrains.com/ai/](https://www.jetbrains.com/ai/) · *paid* Suite IDE professionnelle (IntelliJ, PyCharm, WebStorm…) avec IA intégrée. - **Neovim + AI plugins** — [neovim.io](https://neovim.io) · *free, open source* L'éditeur modal pour les puristes, augmenté via copilot.lua, avante.nvim… ### CLI & agents terminaux (6) Lignes de commande qui pensent. Pour celles et ceux qui aiment le shell autant que le chat. - **Claude Code** — [claude.com/claude-code](https://claude.com/claude-code) · *paid* CLI officielle d'Anthropic — agent qui code, lit, écrit, exécute dans le terminal. - **Aider** — [aider.chat](https://aider.chat) · *free, open source* Pair-programmeur dans le terminal, ouvert et hackable. - **OpenAI Codex CLI** — [github.com/openai/codex](https://github.com/openai/codex) · *freemium, open source* Agent CLI d'OpenAI — concurrent direct de Claude Code. - **Gemini CLI** — [github.com/google-gemini/gemini-cli](https://github.com/google-gemini/gemini-cli) · *freemium, open source* Agent CLI de Google pour les modèles Gemini. - **Ollama** — [ollama.com](https://ollama.com) · *free, open source* Run des LLM en local en une commande — Llama, Mistral, Qwen, Phi… - **llama.cpp** — [github.com/ggerganov/llama.cpp](https://github.com/ggerganov/llama.cpp) · *free, open source* Inférence C++ ultra-frugale — le moteur derrière Ollama et beaucoup d'apps locales. ### Modèles & APIs (6) Accès direct aux modèles — pour construire ses propres outils. - **Anthropic API** — [console.anthropic.com](https://console.anthropic.com) · *paid* Claude par API. Tokens, batch, cache, agents. - **OpenAI Platform** — [platform.openai.com](https://platform.openai.com) · *paid* API OpenAI : GPT, DALL-E, Whisper, Realtime. - **Hugging Face** — [huggingface.co](https://huggingface.co) · *freemium, open source* Le hub mondial des modèles open source — datasets, spaces, inférence. - **OpenRouter** — [openrouter.ai](https://openrouter.ai) · *paid* Une seule API, accès à des centaines de modèles. Idéal pour comparer. - **Together AI** — [together.ai](https://together.ai) · *paid* Hébergement performant de modèles open source par API. - **Groq** — [groq.com](https://groq.com) · *freemium* Inférence ultra-rapide via puces dédiées (LPU). ### Skills & extensions (6) Capacités modulaires à ajouter aux agents. Réutilisables, partageables, hackables. - **Anthropic Skills (officiel)** — [github.com/anthropics/skills](https://github.com/anthropics/skills) · *free, open source* Dépôt officiel des skills pour Claude — référence et exemples. - **Claude Code Cookbook** — [github.com/anthropics/claude-cookbooks](https://github.com/anthropics/claude-cookbooks) · *free, open source* Recettes officielles : MCP, hooks, agents, workflows. - **Model Context Protocol (MCP)** — [modelcontextprotocol.io](https://modelcontextprotocol.io) · *free, open source* Protocole ouvert pour connecter les modèles à des outils — la norme émergente. - **Cursor Rules** — [cursor.directory](https://cursor.directory) · *free* Bibliothèque communautaire de règles pour personnaliser Cursor. - **LangChain** — [langchain.com](https://www.langchain.com) · *freemium, open source* Framework pour construire des chaînes d'agents et de prompts. - **LlamaIndex** — [llamaindex.ai](https://www.llamaindex.ai) · *freemium, open source* Framework spécialisé pour le RAG et l'indexation documentaire. ### Apprendre (7) Cours, livres, vidéos. Pour celles et ceux qui veulent comprendre, pas seulement utiliser. - **Anthropic Courses** — [github.com/anthropics/courses](https://github.com/anthropics/courses) · *free, open source* Cours officiels sur le prompt engineering et les API Claude. - **DeepLearning.AI Short Courses** — [deeplearning.ai/short-courses/](https://www.deeplearning.ai/short-courses/) · *free* Cours courts d'Andrew Ng et al. — agents, RAG, fine-tuning, multimodal. - **Hugging Face Learn** — [huggingface.co/learn](https://huggingface.co/learn) · *free* Parcours communautaires : NLP, agents, diffusion, audio. - **Andrej Karpathy** — [youtube.com/@AndrejKarpathy](https://www.youtube.com/@AndrejKarpathy) · *free* De zéro à GPT — les meilleures masterclasses YouTube en IA, à voir absolument. - **3Blue1Brown — Neural Networks** — [3blue1brown.com/topics/neural-networks](https://www.3blue1brown.com/topics/neural-networks) · *free* Vulgarisation visuelle exceptionnelle des réseaux de neurones. - **Smol Course (Hugging Face)** — [github.com/huggingface/smol-course](https://github.com/huggingface/smol-course) · *free, open source* Cours pour apprendre à fine-tuner des petits modèles efficaces. - **AI Engineer Handbook** — [github.com/microsoft/ai-engineering-handbook](https://github.com/microsoft/ai-engineering-handbook) · *free, open source* Compendium communautaire d'articles, papiers et tutoriels. ## Lexique de l'IA (50 termes) Glossaire accessible des termes utilisés dans l'écosystème IA. Termes triés alphabétiquement. - **AGI (Intelligence artificielle générale)** — Une IA aussi polyvalente qu'un humain compétent. L'Artificial General Intelligence désigne un système hypothétique capable d'égaler ou de dépasser l'humain sur la plupart des tâches cognitives, pas seulement quelques-unes. Le terme est débattu — sa définition n'est pas universellement partagée, et l'industrie l'utilise de plus en plus comme objectif marketing. - **API (Application Programming Interface)** — L'interface technique qui permet à un logiciel d'appeler un modèle. Une API expose les capacités d'un modèle aux développeurs. C'est la voie principale par laquelle les laboratoires d'IA monétisent leurs modèles auprès des entreprises — facturation au token, contrats, quotas. - **ARR (Annual Recurring Revenue, Revenu récurrent annualisé)** — Mesure standardisée du revenu d'une entreprise SaaS, projeté sur 12 mois. Indicateur central pour comparer la traction commerciale des laboratoires d'IA. L'ARR d'OpenAI et d'Anthropic est régulièrement rapporté dans la presse financière comme baromètre de la course. - **ASI (Superintelligence)** — Une IA qui dépasserait nettement l'humain dans tous les domaines. Niveau hypothétique au-delà de l'AGI, où un système surpasse les meilleurs experts humains dans tous les domaines. Concept central dans les débats sur les risques existentiels et la gouvernance de l'IA. - **Agent (Agent IA, AI agent)** — Un modèle qui peut agir — pas seulement répondre. Un agent est un modèle d'IA qui ne se contente pas de discuter : il peut exécuter du code, lire des fichiers, naviguer le web, appeler d'autres outils, et enchaîner des actions pour atteindre un objectif. Claude Code, Cursor ou Aider sont des exemples d'agents qui codent. - **Alignement (Alignment)** — Faire en sorte qu'un modèle agisse conformément aux intentions humaines. Discipline qui regroupe les techniques visant à s'assurer qu'un modèle reste utile, honnête et inoffensif. Inclut l'apprentissage par renforcement, les chartes de valeurs (Constitutional AI), les évaluations adversariales et les politiques d'usage. - **Apprentissage automatique (Machine learning, ML)** — Discipline où les machines apprennent à partir de données plutôt que de règles écrites. Plutôt que d'écrire des instructions à la main, on montre à la machine de nombreux exemples ; elle ajuste ses paramètres internes pour reproduire le comportement observé. C'est le socle de toute l'IA moderne. - **Apprentissage profond (Deep learning)** — Apprentissage automatique avec des réseaux de neurones à plusieurs couches. Sous-domaine de l'apprentissage automatique fondé sur des réseaux de neurones profonds (plusieurs dizaines à milliers de couches). C'est le paradigme qui domine l'IA depuis 2012 et qui a rendu possibles les LLM, la vision par ordinateur moderne et la génération d'images. - **Attention (Mécanisme d'attention, Self-attention)** — Mécanisme qui permet à un modèle de pondérer l'importance des différents éléments d'une entrée. Quand un modèle lit une phrase, l'attention lui permet de relier chaque mot à tous les autres et de décider lesquels comptent pour la suite. C'est l'innovation clé de l'article *Attention Is All You Need* (2017), à l'origine de toute la révolution actuelle. - **Benchmark (Évaluation)** — Test standardisé pour mesurer les performances d'un modèle. Suite d'épreuves (MMLU, HumanEval, GPQA, SWE-bench…) sur lesquelles les laboratoires comparent leurs modèles. Les benchmarks sont essentiels pour le marketing, mais souvent critiqués pour leur saturation, leur fuite dans les corpus d'entraînement, ou leur faible lien avec l'utilité réelle. - **Biais (Bias)** — Distorsion systématique qu'un modèle hérite de ses données d'entraînement. Les modèles reproduisent et amplifient parfois les biais présents dans leurs corpus : représentations stéréotypées, lacunes culturelles, surreprésentation de certaines langues. La mesure et la mitigation des biais est un chantier permanent. - **Capex IA (Dépenses d'infrastructure IA)** — Les dépenses en équipement (GPU, datacenters) consenties pour l'IA. Microsoft, Google, Amazon et Meta ont collectivement dépensé plus de 300 milliards de dollars par an fin 2025 en infrastructure IA. Le débat actuel : ce capex se justifie-t-il par les revenus actuels ou repose-t-il sur une promesse ? - **Chain of Thought (CoT, Chaîne de pensée)** — Technique où le modèle explicite son raisonnement étape par étape. En invitant le modèle à "penser à voix haute" avant de répondre, on améliore drastiquement ses performances sur les tâches de raisonnement (math, logique, code). Les modèles dits *reasoning* (o1, o3, Claude avec extended thinking) industrialisent cette approche. - **Constitutional AI (IA constitutionnelle)** — Méthode d'alignement par chartes de principes, développée par Anthropic. Au lieu d'apprendre uniquement par retours humains, le modèle est entraîné à se critiquer lui-même à partir d'une charte écrite (la "constitution"). C'est l'approche signature d'Anthropic pour aligner Claude. - **Context window (Fenêtre de contexte)** — Le nombre maximal de tokens qu'un modèle peut lire en une fois. Mesure combien d'information le modèle peut traiter simultanément : un prompt, un document, l'historique d'une conversation. Les modèles modernes vont de 8 000 à 2 millions de tokens. Au-delà, le modèle "oublie" le début. - **Corpus (Données d'entraînement, Dataset)** — L'ensemble des textes (ou images, audio…) utilisés pour entraîner un modèle. Les LLM frontière sont entraînés sur des corpus dépassant le pétaoctet : Common Crawl du web, livres, code, papiers scientifiques, conversations. La qualité et la composition du corpus déterminent largement ce que le modèle sait — et ses biais. - **Distillation (Knowledge distillation)** — Compresser un gros modèle en un plus petit qui en copie les sorties. On entraîne un "élève" plus petit à imiter un "maître" plus grand. Le résultat : un modèle moins coûteux à exécuter, qui conserve l'essentiel des capacités. Beaucoup de modèles "compacts" (Haiku, GPT-4o-mini) sont des distillations. - **Embedding (Vecteur sémantique, Plongement)** — Une représentation numérique du sens d'un mot, d'une phrase ou d'un document. Le modèle convertit "chat" et "chien" en vecteurs proches dans un espace à plusieurs centaines de dimensions, parce qu'ils partagent du sens. Les embeddings sont le socle de la recherche sémantique et de la RAG. - **Émergence (Emergent capabilities)** — Capacité qui apparaît brusquement au-delà d'une certaine échelle. Certaines compétences (raisonnement multi-étapes, traduction zero-shot) ne s'observent pas dans les petits modèles puis surgissent quand on dépasse un seuil de taille ou d'entraînement. Le phénomène est partiellement remis en question — il dépend des métriques utilisées. - **Entraînement (Training, Pré-entraînement)** — La phase d'apprentissage du modèle, où ses paramètres s'ajustent. On présente au modèle d'énormes quantités de données et on ajuste progressivement ses milliards de paramètres pour qu'il produise les sorties attendues. C'est l'étape la plus coûteuse — plusieurs millions à plusieurs centaines de millions de dollars pour les modèles frontière. - **FLOPS (Floating-Point Operations Per Second)** — Unité de mesure de la puissance de calcul, en opérations par seconde. Les modèles frontière demandent aujourd'hui de l'ordre de 10²⁵ FLOPS pour leur entraînement. Le *AI Act* européen et certains régimes d'export américains posent des seuils en FLOPS au-delà desquels un modèle est considéré comme "à risque systémique". - **Few-shot (In-context learning)** — Apprendre une tâche en quelques exemples insérés dans le prompt. Au lieu de fine-tuner un modèle pour une nouvelle tâche, on lui donne deux ou trois exemples dans le prompt — il généralise à partir de ces démonstrations. Un atout majeur des LLM par rapport aux modèles plus anciens. - **Fine-tuning (Affinage)** — Continuer l'entraînement d'un modèle existant sur des données spécifiques. Prendre un modèle pré-entraîné et le spécialiser sur un domaine (juridique, médical, vocabulaire interne…) avec un corpus dédié, beaucoup plus petit. Moins coûteux qu'un entraînement complet, plus efficace qu'un simple prompt. - **Foundation model (Modèle de fondation)** — Un modèle pré-entraîné qui sert de base à de nombreuses applications. Terme popularisé par Stanford en 2021 pour désigner les très gros modèles polyvalents (GPT-4, Claude, Gemini, Llama) qui servent de socle à des milliers d'applications spécialisées par fine-tuning ou par prompt. - **Frontier model (Modèle frontière)** — Les modèles les plus capables à un instant donné — la "pointe". Sous-ensemble des foundation models situés à la pointe des capacités, généralement détenu par 4-5 acteurs (OpenAI, Anthropic, Google, Meta, xAI, DeepSeek). Catégorie ciblée par les régulations émergentes en raison de son impact potentiel. - **GPU (Graphics Processing Unit)** — Processeur conçu pour le calcul parallèle massif — la machine de l'IA. Les GPU de Nvidia (H100, H200, B200) sont la matière première de l'IA générative. Leur disponibilité conditionne qui peut entraîner quoi. L'allocation entre laboratoires est devenue un sujet géopolitique. - **Hallucination (Confabulation)** — Quand un modèle invente une information avec assurance. Les LLM, par construction, prédisent le mot le plus probable — pas le mot vrai. Quand ils manquent d'information, ils inventent plausiblement. Citations fictives, dates inventées, fonctions inexistantes : le risque est réel et doit être pris au sérieux. - **IA générative (Generative AI, GenAI)** — Famille de modèles qui produisent du contenu nouveau plutôt que classer. Désigne les modèles qui créent — texte, image, audio, vidéo, code — en opposition aux modèles purement "discriminatifs" qui classent. C'est l'IA générative qui a déclenché la vague médiatique depuis 2022. - **Inférence (Inference)** — L'exécution d'un modèle déjà entraîné pour produire une réponse. Pendant qu'un modèle est entraîné une fois, il est utilisé des milliards de fois. Le coût d'inférence (par requête) détermine la rentabilité d'un service IA. La compétition se joue de plus en plus sur l'efficacité d'inférence. - **Jailbreak** — Technique pour contourner les garde-fous d'un modèle. Prompt malicieux ou exploit qui amène un modèle à enfreindre ses propres règles (générer du contenu interdit, divulguer son prompt système, etc.). Les laboratoires y consacrent des équipes dédiées (red team) en mode adversarial permanent. - **LLM (Large Language Model, Modèle de langage large)** — Modèle d'IA entraîné à prédire du texte à très grande échelle. Un *Large Language Model* est un réseau de neurones (généralement un Transformer) entraîné sur d'énormes corpus textuels à prédire le mot suivant. Claude, ChatGPT, Gemini, Mistral sont tous des LLM. Leur taille se mesure en paramètres (de quelques milliards à plusieurs milliers de milliards). - **MCP (Model Context Protocol)** — Protocole ouvert pour connecter les modèles aux outils et données. Standard introduit par Anthropic fin 2024 pour normaliser la manière dont un agent IA accède à des fichiers, des API, des bases de données. Largement adopté par l'écosystème — Cursor, Continue, et la plupart des éditeurs IA le supportent. - **MoE (Mixture of Experts)** — Architecture où seuls quelques "experts" du modèle s'activent par requête. Au lieu d'activer tous les paramètres pour chaque token, un MoE route la requête vers quelques sous-réseaux spécialisés. Permet d'entraîner d'énormes modèles (plusieurs trillions de paramètres) tout en gardant un coût d'inférence raisonnable. GPT-4, Mixtral, DeepSeek-V3 utilisent cette technique. - **Multimodal** — Modèle qui traite plusieurs types d'entrées : texte, image, audio, vidéo. Les modèles modernes (GPT-4o, Claude 4, Gemini) ne se limitent plus au texte : ils peuvent lire des images, écouter de l'audio, parfois générer images ou vidéos. La multimodalité élargit considérablement le champ des usages. - **Open source** — Code source ET poids accessibles, avec licence permissive d'usage et modification. Au sens strict, un modèle open source publie son code, ses poids, ses données et ses méthodes d'entraînement sous licence libre. À distinguer d'"open weights", plus restrictif. Vrais exemples : OLMo, Pythia. Souvent confondu avec open weights dans la presse. - **Open weights (Poids ouverts)** — Les poids du modèle sont téléchargeables, mais les données et l'entraînement restent fermés. Llama, Mistral, Qwen, DeepSeek publient leurs poids — n'importe qui peut télécharger et exécuter le modèle. Mais ils ne publient pas leurs corpus ni la totalité de leurs méthodes. C'est la définition la plus courante d'"ouverture" en IA aujourd'hui. - **Outil (Tool use, Function calling)** — Capacité d'un modèle à appeler des fonctions externes pour agir. Un modèle équipé d'outils peut décider d'exécuter du code, lire un fichier, faire une recherche web, appeler une API météo. C'est la couche qui transforme un chatbot en agent autonome. - **Paramètre (Parameter, Poids)** — Les nombres internes du modèle qui s'ajustent pendant l'entraînement. Un LLM moderne contient de quelques milliards à plusieurs milliers de milliards de paramètres — chacun étant un nombre réel ajusté lors de l'entraînement. Plus de paramètres = plus de capacité, mais aussi plus de coût d'entraînement et d'inférence. - **Prompt (Invite)** — Le texte d'entrée qu'on donne à un modèle pour obtenir une réponse. Tout ce qu'un modèle reçoit avant de répondre : votre question, le contexte, les instructions système, l'historique. La qualité du prompt influence directement la qualité de la sortie — d'où l'émergence du "prompt engineering" comme compétence. - **Prompt engineering (Ingénierie de prompt)** — L'art de formuler des prompts efficaces pour exploiter au mieux un modèle. Ensemble de techniques empiriques : décomposition des tâches, exemples insérés (few-shot), chaînes de pensée, rôles assignés. Une compétence à part entière, plus proche du métier d'éditeur que de celui d'ingénieur classique. - **Quantization (Quantification)** — Réduire la précision numérique des paramètres pour accélérer l'inférence. Au lieu de stocker chaque paramètre en 32 ou 16 bits, on les ramène à 8, 4 ou même 2 bits. Le modèle perd un peu de qualité mais devient bien plus rapide et léger — utile pour faire tourner des LLM sur un laptop ou un téléphone. - **RAG (Retrieval-Augmented Generation)** — Combiner un LLM avec une recherche documentaire pour ancrer ses réponses. Avant de répondre, le système cherche dans une base documentaire les passages pertinents et les injecte dans le prompt. Le modèle s'appuie alors sur des sources vérifiables — réduit les hallucinations, permet d'interroger des documents internes. - **RLHF (Reinforcement Learning from Human Feedback)** — Affinage d'un modèle à partir de préférences humaines. Des humains comparent deux réponses du modèle et indiquent laquelle est meilleure. Le modèle apprend à produire des réponses jugées meilleures. Technique standard depuis ChatGPT pour aligner les LLM aux attentes humaines. - **Raisonnement (Reasoning)** — Capacité d'un modèle à enchaîner plusieurs étapes logiques avant de répondre. Une nouvelle génération de modèles (o1, o3, Claude *thinking*, Gemini 2.5) prend du temps à "réfléchir" avant de produire la réponse — décomposition, vérification, retour en arrière. Performance accrue sur math, code, planification. - **Red team** — Équipe interne dont la mission est d'attaquer le modèle pour trouver ses failles. Pratique empruntée à la cybersécurité : avant chaque sortie majeure, une équipe simule des usages malicieux (jailbreaks, biais exploitables, fuites de données) pour identifier et corriger les vulnérabilités. - **Scaling laws (Lois d'échelle)** — Relation empirique entre la taille d'un modèle, ses données, son calcul, et ses performances. Découvertes par OpenAI puis DeepMind (Chinchilla, 2022) : doubler les paramètres ou les données améliore le modèle de façon prévisible. Cette régularité a justifié les investissements massifs des cinq dernières années — et son éventuel plafonnement est l'enjeu actuel. - **Token** — L'unité de base que manipule un LLM — un mot, un fragment, un signe. Un LLM ne voit pas des mots mais des tokens, généralement des fragments de 3 à 5 caractères. "Bonjour" peut être 1 token, "anticonstitutionnellement" en demande 6 ou 7. C'est aussi l'unité de facturation des API. - **Transformer** — L'architecture de réseau de neurones qui sous-tend tous les grands modèles modernes. Introduit en 2017 dans *Attention Is All You Need* par Google, le Transformer remplace les architectures récurrentes par le mécanisme d'attention. Toute la révolution LLM (GPT, BERT, Claude, Gemini) en découle. - **Vision par ordinateur (Computer vision, CV)** — Domaine de l'IA qui traite l'image et la vidéo. De la reconnaissance d'objets à la génération d'images en passant par l'analyse de scènes médicales, la vision par ordinateur est aujourd'hui intégrée aux LLM multimodaux les plus avancés. - **Zero-shot** — Réaliser une tâche sans aucun exemple préalable, juste à partir de l'instruction. Capacité emblématique des LLM : on leur demande directement de traduire, résumer, classer — sans jamais avoir vu d'exemple de la tâche dans le prompt. Le revers du few-shot. ## Pour citer Ryuzaki Labs Ryuzaki Labs (龍崎研究所), laboratoire associatif d'innovation, Saint-Leu, La Réunion. Crée en 2026 · Licence des contenus éditoriaux : par défaut Creative Commons BY-SA 4.0 sauf mention contraire. Code des projets en open source — voir GitHub : --- Ce document `llms.txt` suit la convention décrite par https://llmstxt.org/ pour faciliter l'indexation et la citation par les moteurs de recherche génératifs (Claude, ChatGPT, Perplexity, Google AI Overviews, Mistral, etc.).