10 octobre, le laboratoire de recherche en IA spécialisé dans les marchés financiers nof1 a lancé une expérience sans précédent : faire gérer 10 000 dollars de fonds réels par six modèles d’IA de classe mondiale — GPT-5, Gemini 2.5 Pro, Grok-4, Claude Sonnet 4.5, DeepSeek V3.1, Qwen3 Max — sur Hyperliquid, pour effectuer des transactions de cryptomonnaies en conditions réelles.

Classement actuel et valeur du compte : au soir du 30 octobre, le classement le plus récent est le suivant :
Ce classement a connu des changements spectaculaires par rapport aux données d’il y a quelques jours. Bien que DeepSeek reste en tête, son rendement a fortement reculé, passant de 95,71 % à 56,71 %, la valeur du compte étant tombée de 19 570 $ à 15 671 $, évaporant près de 4 000 $. Qwen3 a également subi un recul, passant de 53,68 % à 25,20 %. Mieux encore, Claude Sonnet 4.5 est passé d’un léger profit à une perte de 7 %, tandis que GPT-5 a vu sa perte s’aggraver, atteignant 72 %, s’approchant du risque de liquidation.
Le marché évolue dans un canal haussier, et les stratégies des différents modèles commencent à diverger :


Le succès de DeepSeek repose sur le principe de “suivre la tendance” : 95 % du temps en position longue, croyant que la tendance va continuer. En tendance haussière, cette stratégie lui a permis d’atteindre un rendement maximal de 95 %. Mais lorsque la tendance s’inverse, la même stratégie lui fait perdre 30 %.
Cela met en évidence une question cruciale : **les stratégies de suivi de tendance nécessitent un mécanisme efficace de prise de profit et de stop-loss.** Si l’on se contente de “laisser courir les profits” sans couper les pertes, une inversion majeure peut tout anéantir.
DeepSeek semble trop confiant dans la valeur du “long terme”, négligeant l’incertitude du marché. Son profit maximal de 7 378 $ sur une transaction ETH de 60 heures, expérience qui a renforcé sa croyance dans le “long terme”, montre qu’il privilégie cette approche. Mais le marché financier n’est pas une voie unique : la tendance peut s’inverser à tout moment.

Qwen3 démontre la valeur de la position de fermeture. Ses 82,4 % de temps en position short semblent être une “opportunité manquée” en hausse, mais en baisse, cela lui permet d’éviter des pertes.
Une baisse de 26 % contre 32 %, une différence de seulement 6 points de pourcentage, mais avec l’effet de capitalisation, cette différence s’amplifie. Plus important encore, Qwen3 conserve plus de capital et d’avantages psychologiques, pouvant rapidement se repositionner lorsque le marché se stabilise. DeepSeek, s’il continue à reculer, risque de tomber dans un cercle vicieux de “pertes flottantes — hésitation — rebond manqué”.
Le portefeuille “Achat & Conservation BTC” donne une leçon à toutes les IA “intelligentes”. Sans analyse technique, sans algorithme complexe, sans rotations fréquentes, il se classe troisième, dépassant la moitié des modèles.
Ce résultat montre que : dans le trading, faire moins d’erreurs est plus important que faire plus de bonnes opérations. **Gemini a perdu 66 % en 193 transactions, alors que BTC Buy & Hold n’a effectué aucune transaction et a conservé son capital. Qui est le plus performant ? La réponse est évidente.
Hormis Qwen3, toutes les IA présentent de graves lacunes en gestion du risque :
Cela montre que, même si ces IA peuvent “comprendre” les données du marché et “exécuter” des ordres, leur maîtrise de la gestion du risque — cœur du trading — reste encore très immature.
Après avoir analysé les chiffres, il est facile d’être attiré par le rendement de 56 % de DeepSeek ou la perte de 66 % de Gemini. Mais avant de tirer des conclusions, il faut reconnaître les limites systémiques de cette expérience — qui peuvent être plus importantes que les résultats eux-mêmes.
L’expérience s’étend du 18 au 30 octobre, soit 12 jours. Que signifie 12 jours dans le marché crypto ? Peut-être seulement un début de cycle complet haussier ou baissier.
Ce que nous voyons — une montée, un sommet, un recul — constitue un petit cycle, mais cela pourrait aussi être de la chance. Si l’expérience avait commencé au sommet du marché ou lors d’un crash brutal de 30 % en un jour, le classement serait totalement différent.
Le rendement de 56 % de DeepSeek dépend fortement de cette période. Sa stratégie de 95 % en position longue fonctionne dans une tendance haussière unilatérale, mais en cas de marché latéral de 3 mois, les frais et les stops répétés l’éroderaient.
De même, le taux de 82 % de position short de Qwen3 est un avantage en marché latéral, mais en marché haussier comme en 2021, il aurait sous-performé. Sur un marché haussier où le BTC passe de 10 000 $ à 100 000 $, rester en position short 80 % du temps ne rapporterait que 20 %.
12 jours ne suffisent pas pour juger de la pérennité d’une stratégie.
Les 6 IA reçoivent toutes les mêmes données de marché et le même cadre de trading. C’est comme demander à 6 gestionnaires de fonds de prendre des décisions à partir du même rapport d’analyse — vous testez leur discipline d’exécution, pas leur capacité d’innovation.
Dans la vraie vie, l’alpha vient de l’asymétrie d’information. Les fonds quantitatifs de haut niveau ont des systèmes de suivi blockchain exclusifs, voient les transferts de baleines, ont accès à des flux hors marché pour anticiper les mouvements institutionnels.
Mais dans cette expérience, toutes les IA voient la même information. C’est plus une compétition d’exécution que d’innovation stratégique.
On ne peut pas savoir, si on leur donnait des données blockchain exclusives ou des analyses Twitter, qui serait le vrai gagnant.
Chaque IA gère 10 000 $. C’est une très petite échelle sur Hyperliquid — on peut entrer et sortir à volonté, sans slippage, sans impact sur le marché, sans souci de décomposer de gros ordres.
Mais dans le vrai trading quantitatif, gérer 1 million ou 10 millions n’a rien à voir :
Ce test concerne la flexibilité à petite échelle, pas la robustesse à grande échelle.
Pendant l’expérience, le marché est resté relativement stable, avec une volatilité modérée. Nous n’avons pas vu :
Tous ces scénarios extrêmes, qui testeraient la gestion du risque, n’ont pas été rencontrés. On ne sait pas comment DeepSeek ou Qwen3 réagiraient dans ces conditions. La chance a joué un rôle plus important qu’on ne pense.
C’est une expérience ponctuelle, sans “saison 2” pour confirmer la stabilité des stratégies. On ne peut pas savoir :
Les résultats actuels ressemblent à six personnes lançant des dés, et DeepSeek ayant tiré le plus grand nombre. Mais cela ne prouve pas que ses dés sont meilleurs, juste qu’il a eu plus de chance.
Après avoir pris en compte ces limites, vous pourriez vous demander : cette expérience a-t-elle encore du sens ?
Oui, mais pas pour désigner un champion. La véritable valeur de cette expérience, c’est de nous faire voir que :
Mais si vous vous précipitez pour confier votre argent à DeepSeek ou copier sa stratégie parce qu’il est en tête, vous faites une erreur.
Un classement sur 12 jours ne garantit pas un succès sur 12 mois ; gérer 10 000 $ ne veut pas dire gérer 1 million ; un marché haussier ne prédit pas un marché baissier. La réussite en trading n’a pas de formule magique. Cette expérience nous fournit des données précieuses, mais ses limites, souvent plus importantes que les résultats eux-mêmes, méritent une réflexion approfondie.
Ce rapport a été édité et synthétisé par WolfDAO. Pour toute question, contactez-nous pour mise à jour.
Rédaction : Riffi / WolfDAO( X : @10xWolfdao )