LLM et cybersécurité : ChatGPT, Claude, Gemini en première ligne

Le paysage numérique de ce début d’année 2026 ne ressemble plus à l’euphorie naïve des débuts de l’intelligence artificielle générative. Ce qui était perçu comme un assistant de rédaction bienveillant s’est transformé en un arsenal de précision chirurgicale entre les mains d’acteurs malveillants. Les entreprises françaises, déjà échaudées par des vagues de rançongiciels, font désormais face à des menaces automatisées capables de raisonner, de s’adapter et de coder en temps réel. La barrière technique qui protégeait encore certains systèmes s’effondre, car la puissance des grands modèles de langage n’est plus l’apanage des chercheurs en blouse blanche.

Le basculement s’est opéré lorsque la course à la performance a privilégié la puissance brute sur les garde-fous éthiques. Aujourd’hui, un pirate informatique n’a plus besoin de maîtriser les subtilités du Python ou du C++ pour infiltrer un réseau complexe. Il lui suffit d’orchestrer des agents autonomes capables d’identifier des vulnérabilités zero-day avec une rapidité dépassant les capacités de détection humaines. Cette mutation profonde de la menace cyber interroge notre dépendance à un petit groupe de géants technologiques dont les outils, censés accroître la productivité, deviennent les vecteurs d’une insécurité généralisée.

Face à ce constat, les organisations ne peuvent plus se contenter de simples pare-feu. L’enjeu n’est plus seulement technique, il est stratégique. La montée en puissance du triumvirat composé d’OpenAI, de Google et d’Anthropic redéfinit les règles de la guerre froide numérique. Alors que ces modèles s’intègrent au cœur même des processus de travail, ils ouvrent paradoxalement autant de portes dérobées qu’ils prétendent en fermer. Comprendre comment ces outils sont détournés est devenu le premier rempart d’une défense moderne et proactive.

Sommaire

La fin d’un monopole et l’avènement d’une menace automatisée

Le monopole d’OpenAI sur le secteur des Large Language Models (LLM) appartient désormais au passé. En ce milieu de décennie, nous observons une fragmentation du marché où la performance ne se mesure plus seulement au buzz médiatique, mais à l’efficacité opérationnelle en entreprise. Cette bascule a des conséquences directes sur la cybersécurité. Un environnement où plusieurs modèles dominants coexistent multiplie les surfaces d’attaque et les méthodes d’exploitation. Les cybercriminels profitent de cette diversité pour contourner les filtres de sécurité, testant la même attaque sur ChatGPT, puis sur Claude, avant de la finaliser sur Gemini.

L’utilisation de l’intelligence artificielle pour la cybersécurité offensive n’est plus une théorie de laboratoire. Des structures cybercriminelles utilisent désormais des versions modifiées de ces modèles pour générer des campagnes de phishing ultra-personnalisées. En analysant les profils LinkedIn ou les rapports annuels des entreprises, ces IA rédigent des messages dont le ton et le contexte sont impossibles à distinguer d’une communication interne légitime. Le danger est d’autant plus grand que les modèles comme Claude 4.5 ou Gemini 3 affichent des capacités de raisonnement logique bien supérieures à leurs prédécesseurs.

La situation devient critique quand ces outils tombent entre de mauvaises mains. Au-delà du simple texte, c’est la capacité de génération de code qui inquiète les responsables de la sécurité des systèmes d’information (RSSI). Un attaquant peut demander à une IA de réécrire un script malveillant pour qu’il devienne indétectable par les antivirus classiques. Cette mutation constante du code, pilotée par l’intelligence artificielle, rend les signatures de virus obsolètes en quelques secondes, forçant les défenseurs à entrer dans une course à l’armement technologique sans précédent.

Le déclin relatif de l’avance d’OpenAI face aux nouveaux géants

Pendant longtemps, ChatGPT était le seul nom sur toutes les lèvres, mais la réalité financière et technique de 2026 tempère cette hégémonie. OpenAI, malgré des revenus impressionnants de plus de 4 milliards de dollars, fait face à des pertes colossales atteignant 13,5 milliards de dollars au premier semestre 2025. Cette fragilité économique contraste avec la montée en puissance d’Anthropic, qui détient désormais environ 32 % du marché de l’IA en entreprise. Les organisations se tournent vers des modèles perçus comme plus stables et plus spécialisés dans les tâches de productivité pure.

Claude Opus 4.5 s’est imposé comme une alternative de choix pour les directions techniques. Sa précision dans la revue de code et sa capacité à traiter des volumes massifs de données sans hallucinations majeures en font un outil redoutable, mais aussi une arme potentielle pour l’analyse de failles logicielles. De son côté, Google a intégré massivement Gemini 3 dans Workspace, rendant l’IA omniprésente dans les outils quotidiens des entreprises françaises. Cette intégration facilite l’adoption, mais elle crée aussi un point de défaillance unique : si un compte Google est compromis, l’attaquant accède à un agent AI capable d’exécuter des tâches complexes en toute autonomie.

Raisonnement, vitesse, images, vidéo… tout est plus net et plus rapide.

Cette déclaration de Marc Benioff, CEO de Salesforce, illustre parfaitement le virage pris par les grands comptes. Le choix d’un modèle ne se fait plus sur la curiosité, mais sur la capacité à générer de la valeur. Cependant, cette valeur attire également les regards de ceux qui cherchent à l’extraire illégalement. Le ChatGPT largué par ses concurrents sur certains benchmarks techniques montre que la compétition est désormais une affaire de précision chirurgicale, une précision qui sert aussi bien à bâtir qu’à détruire.

Gemini et Claude : les nouveaux visages de la performance offensive

L’arrivée de Gemini 3 Pro a marqué un tournant dans l’évaluation des capacités des IA. Sur les tests de référence comme ARC AGI 2, le modèle de Google surpasse désormais GPT-5 Pro tout en affichant un coût par tâche divisé par dix. Pour un cybercriminel, cette efficacité économique est une aubaine. Elle permet de lancer des attaques par force brute intelligente à une échelle industrielle pour un investissement dérisoire. L’automatisation ne concerne plus seulement l’envoi de mails, mais la planification complète d’une intrusion réseau.

Anthropic, avec sa gamme Claude, a choisi une voie différente en se concentrant sur la fiabilité. Cette spécialisation séduit les développeurs, mais elle facilite aussi la création de malwares sophistiqués. Un modèle capable de comprendre parfaitement une architecture logicielle complexe pour l’optimiser est tout aussi capable d’en trouver le maillon faible. La distinction entre un usage légitime et un détournement malveillant devient de plus en plus ténue, car les instructions données à l’IA peuvent être subtilement masquées derrière des demandes d’audit de sécurité ou d’optimisation de code.

Les fonctionnalités d’agents autonomes, propulsées par des systèmes comme Google Antigravity, permettent désormais à l’IA de prendre des initiatives. On imagine aisément un scénario où un agent malveillant, une fois introduit dans un réseau d’entreprise, commence à cartographier les serveurs, à exfiltrer des données sensibles et à effacer ses propres traces sans intervention humaine. Le vibe coding, qui permet de programmer en langage naturel, simplifie encore cette tâche pour des acteurs n’ayant aucune formation initiale en informatique, démocratisant ainsi le cyber-espionnage.

L’exploitation des biais et des failles sémantiques

Au-delà de la technique pure, les vulnérabilités résident aussi dans la structure même des modèles. Des études récentes ont montré que les LLM restent sensibles aux biais linguistiques et culturels. Cette faiblesse peut être exploitée pour manipuler les décisions prises par des IA de modération ou des systèmes de filtrage automatique. En utilisant certains dialectes ou registres de langue spécifiques, des attaquants parviennent à glisser des contenus malveillants à travers des mailles du filet censées être hermétiques.

Voici quelques exemples de détournements constatés sur le terrain :

Génération automatisée de faux rapports financiers pour manipuler les cours de bourse via des agents de trading haute fréquence.
Création de deepfakes audio en temps réel pour des attaques de type fraude au président, utilisant la voix parfaite de dirigeants captée lors de conférences.
Développement de scripts de phishing polymorphes qui changent de structure à chaque envoi pour échapper aux analyses heuristiques.
Analyse automatisée de fuites de données massives pour extraire les identifiants les plus prometteurs en quelques secondes.

Ces méthodes ne sont plus de la science-fiction. En France, plusieurs PME ont déjà signalé des tentatives d’escroquerie où l’interlocuteur, bien que virtuel, affichait une connaissance parfaite des dossiers en cours. La capacité des modèles à ingérer des documents volumineux permet aux pirates de se familiariser instantanément avec l’historique d’une cible, rendant leur discours d’autant plus crédible. La confiance, pilier de l’économie numérique, est directement attaquée par ces capacités de mimétisme augmentées.

Les angles morts du triumvirat et le défi de la souveraineté

L’omniprésence du triumvirat américain pose une question fondamentale de souveraineté pour l’Europe. En confiant leurs données les plus sensibles à des infrastructures situées outre-Atlantique, les entreprises et les administrations françaises s’exposent à des risques juridiques et stratégiques majeurs. Le cadre du RGPD, bien que protecteur, semble parfois dérisoire face à la puissance d’intégration de Google Workspace ou des API d’OpenAI. La dépendance technologique crée une vulnérabilité systémique : une panne ou une décision politique unilatérale pourrait paralyser des pans entiers de l’économie européenne.

La question de la rentabilité des géants de l’IA est également un signal d’alarme. Le coût opérationnel de ChatGPT, estimé à 700 000 dollars par jour dès 2023, a explosé avec la montée en charge des modèles. Si le modèle économique de ces entreprises venait à vaciller, la sécurité des services qu’elles fournissent pourrait être sacrifiée sur l’autel de la réduction des coûts. Une IA moins bien surveillée ou dont les filtres de sécurité sont allégés pour économiser de la puissance de calcul devient immédiatement une cible plus facile pour les attaquants.

Enfin, le manque de représentativité culturelle des données d’entraînement reste un défi éthique et sécuritaire. Les modèles excellent dans un anglais normé mais montrent des faiblesses dans d’autres langues ou contextes juridiques. Pour l’Europe, l’enjeu de 2026 est de réussir à faire émerger des alternatives souveraines, capables de rivaliser en performance tout en respectant des standards de sécurité et d’éthique locaux. Sans cette autonomie, nous resterons les spectateurs d’une guerre de l’ombre dont les règles sont écrites ailleurs.

Post-quantique : préparer sa cryptographie aux ordinateurs de demain

IA défensive vs IA offensive : la nouvelle course aux armements cyber