Les modèles D1sm et D1aq — tout comprendre
BATEN AI utilise deux modèles distincts, entraînés spécifiquement pour son architecture. Comprendre leur différence vous permet de choisir le plus adapté à vos besoins.
D1sm — Déterministe 1, Standard Multi-adapter
D1sm est basé sur Mistral 7B — un modèle compact (7 milliards de paramètres) entraîné avec 8 adapters LoRA distincts, un par archétype. C'est le modèle actif par défaut sur BATEN AI.
- Modèle de base : Mistral 7B v0.3
- 8 adapters LoRA : ORIG, NARR, PSYC, KINE, CORP, POET, MINI, TECH
- Chaque adapter a été entraîné avec des pertes entre 0.18 et 0.29
- Déployé sur GPU A10G (24GB) — réponses rapides, coût maîtrisé
- Le mix d'archétypes dans un persona est appliqué via injection textuelle
D1aq — Déterministe 1, Adaptive Quantum
D1aq est basé sur Qwen3-30B-A3B — un modèle quantique à 30.5 milliards de paramètres avec une architecture MoE (Mixture of Experts). 128 experts, dont 8 sont activés simultanément à chaque token généré.
- Modèle de base : Qwen3-30B-A3B (30.5B paramètres totaux, 3.3B actifs par token)
- Architecture MoE : 128 experts, 8 activés — sélection quantique native
- En cours d'entraînement (Mars 2026)
- Déployé sur GPU A100-40GB — plus puissant, réponses plus riches
- Le mix d'archétypes sera appliqué via fusion tensorielle réelle
La différence clé
Avec D1sm, un persona à 60% CORP + 40% NARR injecte cette information dans un texte que le modèle lit. Avec D1aq, les 60% et 40% modifient les poids tensoriels du modèle à l'inférence — la différence est mathématiquement réelle jusque dans la probabilité de chaque token.
Quand utiliser D1sm vs D1aq ?
| Critère | D1sm (Mistral 7B) | D1aq (Qwen3-30B) |
|---|---|---|
| Vitesse | Plus rapide | Plus lent (modèle plus grand) |
| Profondeur | Bonne | Très élevée |
| Précision du mix | Suggestive (textuelle) | Réelle (tensorielle) |
| Coût | Plus faible | Plus élevé |
| Disponibilité | Maintenant | Prochainement |
| Idéal pour | Conversations quotidiennes | Analysis complexes, personas fins |
L'architecture 3 couches
Quel que soit le modèle, BATEN AI structure la génération en 3 couches superposées :
- Archétype — structure cognitive fondamentale (sélection de l'adapter LoRA)
- Monde FTH — espace de savoir et de personnalité dans lequel évolue le persona
- Persona — style d'expression, vocabulaire, énergie, ton de surface
La réponse finale est la résultante de ces 3 couches. C'est pourquoi deux personas avec le même archétype dominant mais dans des Portes différentes donnent des réponses de nature différente — le monde change la profondeur et le registre, même si la voix est identique.