Applications IA pour secteurs sensibles et militaires

Pourquoi le cloud public est exclu des secteurs sensibles

Les secteurs défense, santé, énergie et infrastructures critiques partagent une contrainte fondamentale : les données qu'ils traitent ne peuvent pas quitter un périmètre de contrôle maîtrisé. Dès lors, les offres cloud publiques des grands fournisseurs américains — même les plus sécurisées, même avec des clauses contractuelles renforcées — posent un problème structurel. Le CLOUD Act américain oblige les sociétés dont le siège social est aux États-Unis à fournir des données aux autorités fédérales sur demande, quelle que soit la localisation physique des serveurs. Une API OpenAI, un endpoint AWS Bedrock ou un modèle Azure OpenAI Service traite vos données dans une infrastructure soumise à cette juridiction.

Ce n'est pas une considération théorique. Les référentiels de qualification de l'ANSSI et le label SecNumCloud excluent explicitement les prestataires soumis à des droits extraterritoriaux non européens. Ces exigences s'inscrivent dans un cadre plus large que nous explorons en détail dans notre analyse des les exigences de sécurité des applications critiques. Les marchés publics de défense et les contrats avec les opérateurs d'importance vitale (OIV) exigent une qualification HDS pour la santé, ou une conformité aux instructions générales interministérielles pour les données classifiées. Dans ce contexte, utiliser ChatGPT ou Claude.ai — même en version enterprise — n'est tout simplement pas une option contractuellement ou réglementairement acceptable.

La conséquence pratique est que l'adoption de l'IA dans ces secteurs passe nécessairement par une autre architecture : modèles déployés sur infrastructure souveraine, sans sortie de données vers des API tierces, avec une chaîne de traitement entièrement auditée. Cette contrainte ajoute de la complexité, mais elle n'empêche pas de tirer des gains significatifs des LLM modernes.

LLM souverains : l'offre disponible en 2026

L'écosystème des modèles de langage déployables on-premise a considérablement mûri. Mistral AI, société française, propose Mistral Large et Mistral Medium sous licence commerciale avec déploiement sur infrastructure privée, sans aucune transmission de données aux serveurs Mistral en production. Ces modèles atteignent des niveaux de performance comparables à GPT-4 sur la majorité des tâches de traitement documentaire, d'analyse de texte et de génération de synthèses — les cas d'usage les plus courants dans les secteurs sensibles.

Du côté open source, la famille Llama 3 de Meta (notamment Llama 3.1 70B et 405B) est désormais suffisamment performante pour des applications professionnelles exigeantes. Sa licence permet un déploiement commercial sans royalties pour les organisations de moins de 700 millions d'utilisateurs actifs mensuels, ce qui couvre l'intégralité des organisations concernées par les secteurs sensibles. Des modèles fine-tunés sur des domaines spécifiques — médical, juridique, technique — sont disponibles sur Hugging Face et peuvent être déployés et customisés en interne.

Pour des besoins de traitement de documents classifiés de niveau DR (Diffusion Restreinte), des solutions françaises comme Dust ou des offres OEM construites autour de Mistral sont évaluées et qualifiées par plusieurs administrations. Pour le niveau Confidentiel Défense et au-delà, les solutions restent très spécifiques, souvent custom, et nécessitent une qualification ANSSI au cas par cas. La bonne nouvelle est que la performance des modèles souverains s'améliore plus vite que les contraintes réglementaires ne les rattrapent.

Architecture on-premise : les composantes essentielles

Déployer un LLM on-premise dans un environnement sensible n'est pas simplement “installer Ollama sur un serveur”. Une architecture de production robuste comprend plusieurs couches interdépendantes. La couche d'inférence — serveur de modèle avec vLLM, TGI (Text Generation Inference) ou llama.cpp selon les contraintes matérielles — doit être dimensionnée pour les volumes attendus avec de la redondance. Pour les systèmes où la sécurité mémoire est critique, l'usage de Rust pour les systèmes souverains et critiques offre des garanties supplémentaires au niveau du runtime. Un modèle 70B quantisé en FP8 nécessite 80 à 120 Go de VRAM selon la précision, ce qui implique typiquement 2 à 4 GPU A100 ou H100 pour une inférence fluide avec plusieurs utilisateurs simultanés.

La couche RAG (Retrieval Augmented Generation) est souvent plus critique que le modèle lui-même. C'est elle qui permet à l'IA d'accéder à la documentation interne, aux bases de connaissances métier, aux procédures opérationnelles — sans avoir été entraînée sur ces données. Elle comprend une pipeline d'ingestion de documents (OCR, chunking, embedding), une base de données vectorielle (Qdrant, Weaviate ou pgvector selon les contraintes d'infrastructure), et une logique de reranking pour améliorer la pertinence des réponses. Toute cette infrastructure doit être déployée on-premise au même titre que le modèle.

Enfin, la couche de sécurité applicative comprend l'authentification SSO (SAML/OIDC) intégrée aux annuaires existants, la gestion fine des droits d'accès aux sources documentaires, le logging exhaustif de toutes les interactions, et des guardrails de détection de prompt injection. Dans un contexte sensible, chaque requête envoyée au modèle et chaque réponse reçue doit être tracée, horodatée et archivée pour audit ultérieur.

Conformité et certification : ce que vos clients exigent

Les organismes clients des secteurs sensibles n'achètent pas un outil IA — ils achètent une garantie de conformité. Comprendre ce que chaque référentiel exige concrètement est indispensable avant de commencer à architecturer une solution. ISO 27001 est le socle commun : elle exige une gestion documentée des risques liés au traitement de l'information, ce qui inclut les flux de données vers et depuis les modèles IA. Les évaluations annuelles doivent désormais couvrir les risques spécifiques à l'IA : fuite de données dans les prompts, biais dans les décisions automatisées, défaillance des guardrails.

SecNumCloud est le référentiel de qualification des prestataires cloud de l'ANSSI. Il impose une immunité aux droits extraterritoriaux, une localisation des données sur le territoire français, et des niveaux d'exigences techniques très élevés sur la disponibilité, la réversibilité et la sécurité des opérations. Pour les OIV et les opérateurs de services essentiels, utiliser un prestataire cloud non qualifié SecNumCloud pour des données sensibles expose à des sanctions et à des non-conformités NIS2. Le RGPD s'applique dès lors que les données traitées par le LLM contiennent des informations permettant d'identifier des personnes physiques — ce qui est souvent le cas dans les applications de santé ou de gestion RH.

Du côté des certifications produit, les solutions IA déployées dans des contextes de défense doivent souvent passer par des processus d'homologation spécifiques (RGS, IGI 1300) qui examinent non seulement la sécurité de l'infrastructure mais aussi la robustesse du modèle face aux tentatives de manipulation. Nous recommandons d'intégrer ces exigences dès la conception de l'architecture, et non comme une étape finale, car les modifications tardives coûtent en moyenne trois fois plus cher que les décisions initiales. Pour mener à bien ces projets à fort enjeu, appuyez-vous sur notre expertise Projets Critiques & Secteurs Sensibles.

“Dans les secteurs sensibles, l'IA n'est pas seulement un outil de performance. C'est un composant critique dont la défaillance ou la compromission peut avoir des conséquences majeures, voire vitales.”

Cas d'usage concrets (défense, santé, énergie)

Dans le secteur de la défense, les cas d'usage les plus matures sont la synthèse automatique de rapports de renseignement open source (OSINT), l'assistance à la rédaction de comptes rendus opérationnels, et l'analyse de documentation technique volumineuse (manuels de maintenance, spécifications d'équipements). Ces applications fonctionnent parfaitement avec un LLM 70B on-premise couplé à un pipeline RAG sur les bases documentaires internes. Aucune de ces données ne sort du périmètre classifié. Des expérimentations plus avancées portent sur l'aide à la planification tactique et à l'analyse d'imagerie, domaines où les modèles multimodaux souverains commencent à atteindre un niveau opérationnel.

Dans la santé, la transformation documentaire est le levier le plus immédiat : compte rendus d'hospitalisation, lettres de sortie, synthèses de dossiers patients. Une solution IA on-premise qualifiée HDS peut réduire de 40 à 60 % le temps consacré par les praticiens à la documentation, tout en maintenant une conformité RGPD totale puisque les données de santé ne quittent jamais l'infrastructure hospitalière. Les projets les plus ambitieux portent sur l'aide au diagnostic par analyse de littérature médicale et sur l'optimisation des flux de soins, avec des LLM fine-tunés sur des corpus médicaux francophones.

Dans le secteur énergétique, les gestionnaires de réseaux (RTE, Enedis, GRTgaz) explorent l'IA pour la maintenance prédictive documentaire — analyser les historiques d'incidents, identifier des patterns précurseurs de défaillance, générer automatiquement des rapports d'inspection. Les contraintes de disponibilité sont extrêmes : un système qui traite des données de réseau électrique doit fonctionner en mode dégradé même en cas de défaillance partielle, ce qui impose une architecture redondante avec capacité d'inférence locale sur site, indépendante de toute connexion réseau — ce qu'on appelle un déploiement air-gap. Ce mode de fonctionnement, techniquement plus complexe, est aujourd'hui parfaitement réalisable avec les modèles quantisés actuels sur du matériel GPU standard.

Pourquoi le cloud public est exclu des secteurs sensibles

LLM souverains : l'offre disponible en 2026

Architecture on-premise : les composantes essentielles

Conformité et certification : ce que vos clients exigent

“Dans les secteurs sensibles, l'IA n'est pas seulement un outil de performance. C'est un composant critique dont la défaillance ou la compromission peut avoir des conséquences majeures, voire vitales.”

Applications IA pour secteurs sensibles et militaires

Pourquoi le cloud public est exclu des secteurs sensibles

LLM souverains : l'offre disponible en 2026

Architecture on-premise : les composantes essentielles

Conformité et certification : ce que vos clients exigent

Cas d'usage concrets (défense, santé, énergie)

Articles liés

Vous opérez dans un secteur sensible et souhaitez déployer de l'IA ?

Applications IA pour secteurs sensibles et militaires

Pourquoi le cloud public est exclu des secteurs sensibles

LLM souverains : l'offre disponible en 2026

Architecture on-premise : les composantes essentielles

Conformité et certification : ce que vos clients exigent

Cas d'usage concrets (défense, santé, énergie)

Articles liés

Vous opérez dans un secteur sensible et souhaitez déployer de l'IA ?