Lorsque nous testons un ensemble de stratégies et examinons un ensemble d’indicateurs, sommes-nous vraiment dans l’instant présent ? Cet article part des deux pièges de la « fuite de données future » et du « surapprentissage », et analyse le test fatal de l’analyse on-chain à double sommet en 2021. (Synopsis : Marché de la continuation de la vie : analyse du double top le plus étrange de 2021 avec des données on-chain) (Supplément de contexte : Académie des données on-chain (1) : Savez-vous quel est le coût moyen du BTC sur l’ensemble du marché ? Points clés : Parlez du concept de « biais d’anticipation » Parlez des succès dans le trading : Surajustement Double top en 2021 : le plus grand test pour sculpter l’épée Examen de la performance de trois indicateurs et d’un modèle Biais d’anticipation Imaginez un scénario : « Supposons que j’élabore une stratégie de trading et que je la teste rigoureusement au cours des 50 dernières années 1975 ~ 2024, et a obtenu une très bonne performance de backtest. C’est pourquoi j’ai décidé de lancer cette stratégie en 2025. Chers lecteurs, pour la description ci-dessus, quelqu’un voit-il ce qui ne va pas ? Si vous ne faites vraiment que des backtests de 1975 ~ 2024, il est en fait facile de tomber dans le piège de la « fuite de données future ». Parce que nous avons simplement utilisé toutes les données « jusqu’à présent » pour faire du backtesting, cela conduira aux paramètres de stratégie que nous avons entraînés, qui sont susceptibles d’être « impatients » ! Une approche plus rigoureuse est, par exemple : vous pouvez backtester les performances de l’ensemble de l’année 2024 pour « 1975 ~ 2023 » (en supposant que nous sommes en 2024) et utiliser la stratégie d’entraînement ; Bien entendu, vous pouvez également utiliser les données de la période 1975 ~ 2022 pour entraîner la stratégie, puis utiliser la stratégie entraînée pour backtester les performances de 2023 et 2024. Plus précisément, nous pouvons éviter autant que possible les « fuites de données futures » grâce au « roll-backtesting » ou au « step-backtesting ». L’avantage est de « s’assurer que la stratégie post-formation peut résister à l’épreuve de l’avenir ». Le surapprentissage : le poison le plus mortel Quiconque a un peu de concept de développement de stratégie quantitative de base saura à quel point les problèmes de surapprentissage peuvent être graves. Ce que l’on appelle le surapprentissage, en termes simples, consiste à « tailler le bateau pour l’épée », ce qui rendra les données du backtest bonnes (faible erreur d’entraînement), mais difficiles à appliquer au combat réel (erreur de test élevée). Ici, j’ai l’intention d’introduire un concept mathématique pour expliquer : (lecteurs qui ont mal à la tête quand ils voient les mathématiques, vous pouvez passer directement au paragraphe suivant pour voir la conclusion) Supposons qu’il y ait une suite de nombres : « 1 , 2 , 4 , 8 , 16 , ? » Les lecteurs qui sont un peu sensibles aux chiffres devraient penser que le nombre suivant est 32, car les cinq premiers éléments de données sont évidemment liés à la « puissance de 2 ». Mais en fait, nous ne pouvons pas réellement prédire quel sera le prochain chiffre. Parce que d’un point de vue mathématique, nous pouvons utiliser l’interpolation de Lagrange pour construire un autre polynôme d’ordre supérieur, de sorte que la sixième donnée n’est pas 32, mais satisfait également à la loi. Cela signifie : « Les prédictions qui sont extrapolées uniquement sur des points de données finis ne sont pas fiables. » Deuxième top 2021 : le plus grand test pour la plupart des indicateurs Après avoir parlé de concepts théoriques ennuyeux, parlons du combat réel. Ci-dessous, je vais sortir trois indicateurs de données on-chain et un modèle que j’ai personnellement développé pour expliquer à tous les lecteurs : 1. MVRV Je pense que les lecteurs qui ont un peu étudié l’analyse des données on-chain doivent avoir entendu parler de MVRV, et mon article précédent a également fait un enseignement détaillé sur cet indicateur ( On-chain data school (1) : Savez-vous quel est le coût moyen du BTC sur l’ensemble du marché ? )。 Comme indiqué ci-dessus, il s’agit d’un graphique des données historiques de MVRV. Les 1, 2, 3 et 4 marqués dans le graphique correspondent respectivement au sommet de 13, 17 et 2021. Nous pouvons clairement voir que les sommets MVRV au sommet de chaque tour sont « en baisse ». J’ai entendu beaucoup de gens utiliser les méthodes suivantes pour faire face au phénomène de la diminution des aigus : « Je sais qu’il diminue, donc lorsque je juge le sommet, je vais prendre un seuil plus conservateur et plus bas comme signal d’avertissement. » Maintenant, la question se pose : comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021 et que nous ne voyons que 13 ou 17 années de données historiques, le seuil fixé de manière prudente peut-il être déclenché le 21 avril ? Le seuil ainsi fixé peut-il être déclenché au deuxième sommet en 2021 ? Si vous pensez qu’avril 2021 n’est pas le sommet, alors le deuxième sommet de 2021 est encore moins susceptible d’échapper au sommet, n’est-ce pas ? Ce que je veux dire, c’est ceci : parce que la taille de l’échantillon des données historiques du BTC est trop petite, et si vous considérez simplement les cycles précédents, il est probable qu’il tombe dans le piège de la « fuite de données future ». Une personne en avril 2021 (le premier en haut) ne saura pas que la valeur MVRV à ce moment-là est en fait le point le plus élevé de ce cycle, car elle ne peut voir que les données de 13 ou 17 ans ; De même, lorsque le deuxième sommet est apparu en 2021, la valeur MVRV était dans une position très basse, et si le premier sommet ne s’échappait pas, il était naturellement impossible d’échapper au sommet selon les données du deuxième sommet, de sorte que la meilleure occasion d’échapper au sommet en 2021 serait manquée. 2. Indicateur AVIV L’AVIV peut être considéré comme un MVRV corrigé et plus bien considéré, et a une caractéristique de « réversion de la moyenne » plus évidente que MVRV. Mais même ainsi, le phénomène des « pics décroissants (sommets) » est toujours évident : les 1, 2, 3 et 4 marqués dans la figure correspondent respectivement au sommet de 13, 17 et 2021. Pour la même question, je vais copier directement le texte ci-dessus pour que les lecteurs y réfléchissent : Comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021 et que nous ne voyons que 13 ou 17 années de données historiques, le seuil fixé de manière prudente peut-il être déclenché le 21 avril ? Le seuil ainsi fixé peut-il être déclenché au deuxième sommet en 2021 ? Si vous pensez qu’avril 2021 n’est pas le sommet, alors le deuxième sommet de 2021 est encore moins susceptible d’échapper au sommet, n’est-ce pas ? RUP (Profit Relatif Non Réalisé) J’ai également présenté les données RUP on-chain en détail avant, les lecteurs intéressés peuvent se référer aux deux articles suivants : On-Chain Data Academy (9) : Baromètre du marché RUPL(I) - Introduction aux données > application de lecture de fond Académie des données on-chain (10) : Baromètre du marché RUPL(II) - Signal supérieur le plus fort et cycle historique Analyse détaillée du haut Un lecteur a demandé un jour : « Peut comprendre la logique de la divergence RUP, Mais devrions-nous également prendre en compte les sommets historiques atteints par RUP ? Comme le montre la figure ci-dessus, il s’agit du graphique historique du RUP, et les 1, 2, 3 et 4 marqués dans la figure correspondent respectivement au sommet de 13, 17 et 2021. On peut voir que même si le RUP a été standardisé pour la capitalisation boursière, il y a toujours un phénomène de pics décroissants. Encore une torture de l’âme : comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021, nous pouvons voir que les données historiques ne sont que de 13 ou 17 ans, et que le seuil fixé de manière prudente peut être fixé à 21 ...
Le contenu est fourni à titre de référence uniquement, il ne s'agit pas d'une sollicitation ou d'une offre. Aucun conseil en investissement, fiscalité ou juridique n'est fourni. Consultez l'Avertissement pour plus de détails sur les risques.
Prenons comme exemple la structure en double sommet du Bitcoin en 2021 : parlons de ce qu'est une « fuite de données future ».
Lorsque nous testons un ensemble de stratégies et examinons un ensemble d’indicateurs, sommes-nous vraiment dans l’instant présent ? Cet article part des deux pièges de la « fuite de données future » et du « surapprentissage », et analyse le test fatal de l’analyse on-chain à double sommet en 2021. (Synopsis : Marché de la continuation de la vie : analyse du double top le plus étrange de 2021 avec des données on-chain) (Supplément de contexte : Académie des données on-chain (1) : Savez-vous quel est le coût moyen du BTC sur l’ensemble du marché ? Points clés : Parlez du concept de « biais d’anticipation » Parlez des succès dans le trading : Surajustement Double top en 2021 : le plus grand test pour sculpter l’épée Examen de la performance de trois indicateurs et d’un modèle Biais d’anticipation Imaginez un scénario : « Supposons que j’élabore une stratégie de trading et que je la teste rigoureusement au cours des 50 dernières années 1975 ~ 2024, et a obtenu une très bonne performance de backtest. C’est pourquoi j’ai décidé de lancer cette stratégie en 2025. Chers lecteurs, pour la description ci-dessus, quelqu’un voit-il ce qui ne va pas ? Si vous ne faites vraiment que des backtests de 1975 ~ 2024, il est en fait facile de tomber dans le piège de la « fuite de données future ». Parce que nous avons simplement utilisé toutes les données « jusqu’à présent » pour faire du backtesting, cela conduira aux paramètres de stratégie que nous avons entraînés, qui sont susceptibles d’être « impatients » ! Une approche plus rigoureuse est, par exemple : vous pouvez backtester les performances de l’ensemble de l’année 2024 pour « 1975 ~ 2023 » (en supposant que nous sommes en 2024) et utiliser la stratégie d’entraînement ; Bien entendu, vous pouvez également utiliser les données de la période 1975 ~ 2022 pour entraîner la stratégie, puis utiliser la stratégie entraînée pour backtester les performances de 2023 et 2024. Plus précisément, nous pouvons éviter autant que possible les « fuites de données futures » grâce au « roll-backtesting » ou au « step-backtesting ». L’avantage est de « s’assurer que la stratégie post-formation peut résister à l’épreuve de l’avenir ». Le surapprentissage : le poison le plus mortel Quiconque a un peu de concept de développement de stratégie quantitative de base saura à quel point les problèmes de surapprentissage peuvent être graves. Ce que l’on appelle le surapprentissage, en termes simples, consiste à « tailler le bateau pour l’épée », ce qui rendra les données du backtest bonnes (faible erreur d’entraînement), mais difficiles à appliquer au combat réel (erreur de test élevée). Ici, j’ai l’intention d’introduire un concept mathématique pour expliquer : (lecteurs qui ont mal à la tête quand ils voient les mathématiques, vous pouvez passer directement au paragraphe suivant pour voir la conclusion) Supposons qu’il y ait une suite de nombres : « 1 , 2 , 4 , 8 , 16 , ? » Les lecteurs qui sont un peu sensibles aux chiffres devraient penser que le nombre suivant est 32, car les cinq premiers éléments de données sont évidemment liés à la « puissance de 2 ». Mais en fait, nous ne pouvons pas réellement prédire quel sera le prochain chiffre. Parce que d’un point de vue mathématique, nous pouvons utiliser l’interpolation de Lagrange pour construire un autre polynôme d’ordre supérieur, de sorte que la sixième donnée n’est pas 32, mais satisfait également à la loi. Cela signifie : « Les prédictions qui sont extrapolées uniquement sur des points de données finis ne sont pas fiables. » Deuxième top 2021 : le plus grand test pour la plupart des indicateurs Après avoir parlé de concepts théoriques ennuyeux, parlons du combat réel. Ci-dessous, je vais sortir trois indicateurs de données on-chain et un modèle que j’ai personnellement développé pour expliquer à tous les lecteurs : 1. MVRV Je pense que les lecteurs qui ont un peu étudié l’analyse des données on-chain doivent avoir entendu parler de MVRV, et mon article précédent a également fait un enseignement détaillé sur cet indicateur ( On-chain data school (1) : Savez-vous quel est le coût moyen du BTC sur l’ensemble du marché ? )。 Comme indiqué ci-dessus, il s’agit d’un graphique des données historiques de MVRV. Les 1, 2, 3 et 4 marqués dans le graphique correspondent respectivement au sommet de 13, 17 et 2021. Nous pouvons clairement voir que les sommets MVRV au sommet de chaque tour sont « en baisse ». J’ai entendu beaucoup de gens utiliser les méthodes suivantes pour faire face au phénomène de la diminution des aigus : « Je sais qu’il diminue, donc lorsque je juge le sommet, je vais prendre un seuil plus conservateur et plus bas comme signal d’avertissement. » Maintenant, la question se pose : comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021 et que nous ne voyons que 13 ou 17 années de données historiques, le seuil fixé de manière prudente peut-il être déclenché le 21 avril ? Le seuil ainsi fixé peut-il être déclenché au deuxième sommet en 2021 ? Si vous pensez qu’avril 2021 n’est pas le sommet, alors le deuxième sommet de 2021 est encore moins susceptible d’échapper au sommet, n’est-ce pas ? Ce que je veux dire, c’est ceci : parce que la taille de l’échantillon des données historiques du BTC est trop petite, et si vous considérez simplement les cycles précédents, il est probable qu’il tombe dans le piège de la « fuite de données future ». Une personne en avril 2021 (le premier en haut) ne saura pas que la valeur MVRV à ce moment-là est en fait le point le plus élevé de ce cycle, car elle ne peut voir que les données de 13 ou 17 ans ; De même, lorsque le deuxième sommet est apparu en 2021, la valeur MVRV était dans une position très basse, et si le premier sommet ne s’échappait pas, il était naturellement impossible d’échapper au sommet selon les données du deuxième sommet, de sorte que la meilleure occasion d’échapper au sommet en 2021 serait manquée. 2. Indicateur AVIV L’AVIV peut être considéré comme un MVRV corrigé et plus bien considéré, et a une caractéristique de « réversion de la moyenne » plus évidente que MVRV. Mais même ainsi, le phénomène des « pics décroissants (sommets) » est toujours évident : les 1, 2, 3 et 4 marqués dans la figure correspondent respectivement au sommet de 13, 17 et 2021. Pour la même question, je vais copier directement le texte ci-dessus pour que les lecteurs y réfléchissent : Comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021 et que nous ne voyons que 13 ou 17 années de données historiques, le seuil fixé de manière prudente peut-il être déclenché le 21 avril ? Le seuil ainsi fixé peut-il être déclenché au deuxième sommet en 2021 ? Si vous pensez qu’avril 2021 n’est pas le sommet, alors le deuxième sommet de 2021 est encore moins susceptible d’échapper au sommet, n’est-ce pas ? RUP (Profit Relatif Non Réalisé) J’ai également présenté les données RUP on-chain en détail avant, les lecteurs intéressés peuvent se référer aux deux articles suivants : On-Chain Data Academy (9) : Baromètre du marché RUPL(I) - Introduction aux données > application de lecture de fond Académie des données on-chain (10) : Baromètre du marché RUPL(II) - Signal supérieur le plus fort et cycle historique Analyse détaillée du haut Un lecteur a demandé un jour : « Peut comprendre la logique de la divergence RUP, Mais devrions-nous également prendre en compte les sommets historiques atteints par RUP ? Comme le montre la figure ci-dessus, il s’agit du graphique historique du RUP, et les 1, 2, 3 et 4 marqués dans la figure correspondent respectivement au sommet de 13, 17 et 2021. On peut voir que même si le RUP a été standardisé pour la capitalisation boursière, il y a toujours un phénomène de pics décroissants. Encore une torture de l’âme : comment fixer un seuil plus conservateur ? Si nous remontons à avril 2021, nous pouvons voir que les données historiques ne sont que de 13 ou 17 ans, et que le seuil fixé de manière prudente peut être fixé à 21 ...