Sebagai contoh struktur double top Bitcoin tahun 2021: membahas apa itu "kebocoran data masa depan"

Ketika kita melakukan backtest serangkaian strategi dan memeriksa serangkaian indikator, apakah kita benar-benar berdiri pada saat ini? Makalah ini dimulai dari dua jebakan "kebocoran data di masa depan" dan "overfitting", dan menganalisis uji fatal analisis on-chain double-top pada tahun 2021. (Ringkasan: Kelanjutan pasar kehidupan: analisis double top paling aneh pada tahun 2021 dengan data on-chain) (Suplemen latar belakang: Akademi data on-chain (1): Tahukah Anda berapa biaya rata-rata BTC di seluruh pasar? Poin-poin penting: Bicara tentang konsep "Look-ahead bias" Bicara tentang hit dalam perdagangan: Overfitting Double top pada tahun 2021: ujian terbesar untuk mengukir pedang Ulasan kinerja tiga indikator dan satu model Bias lihat ke depan Bayangkan sebuah skenario: "Katakanlah saya mengembangkan strategi perdagangan dan secara ketat mendukungnya selama 50 tahun terakhir 1975 ~ 2024, dan mendapat kinerja backtest yang sangat baik. Itu sebabnya saya memutuskan untuk meluncurkan strategi ini pada tahun 2025." Pembaca yang budiman, untuk uraian di atas, apakah ada yang melihat apa yang salah? Jika Anda benar-benar hanya melakukan backtesting 1975 ~ 2024, sebenarnya mudah untuk jatuh ke dalam perangkap "kebocoran data di masa depan". Karena kami hanya menggunakan semua data "sejauh ini" untuk melakukan backtesting, ini akan mengarah pada parameter strategi yang kami latih, yang cenderung "tidak sabar"! Pendekatan yang lebih ketat adalah, misalnya: Anda dapat menguji kembali kinerja sepanjang tahun 2024 untuk "1975 ~ 2023" (dengan asumsi bahwa kita berada di 2024) dan menggunakan strategi pelatihan; Tentu saja, Anda juga dapat menggunakan data periode 1975 ~ 2022 untuk melatih strategi, dan kemudian menggunakan strategi terlatih untuk menguji kembali kinerja 2023 dan 2024. Lebih tepatnya, kita dapat menghindari "kebocoran data di masa depan" sebanyak mungkin melalui "rolling backtesting" atau "stepping backtesting". Keuntungan dari ini adalah untuk "memastikan bahwa strategi pasca-pelatihan dapat bertahan dalam ujian masa depan." Overfitting: racun paling mematikan Siapa pun yang memiliki sedikit konsep pengembangan strategi kuantitatif dasar akan tahu seberapa serius masalah overfitting. Yang disebut overfitting, dalam istilah awam, adalah "mengukir perahu untuk pedang", yang akan membuat data backtest terlihat bagus (kesalahan pelatihan rendah), tetapi sulit diterapkan pada pertempuran yang sebenarnya (kesalahan tes tinggi). Di sini saya bermaksud memperkenalkan konsep matematika untuk menjelaskan: (pembaca yang pusing ketika melihat matematika, Anda bisa langsung melompat ke paragraf berikutnya untuk melihat kesimpulannya) Misalkan ada urutan angka: "1 , 2 , 4 , 8 , 16 , ?" Pembaca yang sedikit sensitif terhadap angka harus berpikir bahwa angka berikutnya adalah 32, karena lima item data pertama jelas terkait dengan "kekuatan 2". Namun nyatanya, kita tidak bisa benar-benar memprediksi berapa angka selanjutnya. Karena dari sudut pandang matematika, kita dapat menggunakan interpolasi Lagrange untuk membangun polinomial orde tinggi lainnya, sehingga data keenam bukan 32, tetapi juga memenuhi hukum. Ini berarti: "Prediksi yang diekstrapolasi hanya pada titik data terbatas tidak dapat diandalkan." 2021 Teratas Kedua: Tes Terbesar untuk Sebagian Besar Indikator Setelah berbicara tentang konsep teoretis yang membosankan, mari kita bicara tentang pertempuran yang sebenarnya. Di bawah ini, saya akan mengambil tiga indikator data on-chain dan model yang saya kembangkan secara pribadi untuk menjelaskan kepada semua pembaca: 1. MVRV Saya percaya bahwa pembaca yang telah mempelajari analisis data on-chain sedikit pasti pernah mendengar tentang MVRV, dan artikel saya sebelumnya juga telah melakukan pengajaran terperinci tentang indikator ini ( Sekolah data on-chain (1): Tahukah Anda berapa biaya rata-rata BTC di seluruh pasar? )。 Seperti yang ditunjukkan di atas, ini adalah bagan data historis MVRV. 1, 2, 3, dan 4 yang ditandai dalam grafik masing-masing sesuai dengan bagian atas 13, 17, dan 2021. Kita dapat dengan jelas melihat bahwa tertinggi MVRV di bagian atas setiap putaran "menurun". Saya telah mendengar banyak orang menggunakan metode berikut untuk menghadapi fenomena penurunan tertinggi: "Saya tahu ini menurun, jadi ketika menilai bagian atas, saya akan mengambil ambang batas yang lebih konservatif dan lebih rendah sebagai sinyal peringatan." Sekarang muncul pertanyaan: bagaimana cara menetapkan ambang batas yang lebih konservatif? Jika kita kembali ke April 2021 dan hanya melihat data historis 13 atau 17 tahun, dapatkah ambang batas yang ditetapkan secara konservatif dipicu pada 21 April? Bisakah ambang batas yang ditetapkan dengan cara ini dipicu di puncak kedua pada tahun 2021? Jika Anda tidak berpikir April 2021 adalah yang teratas, maka puncak kedua pada tahun 2021 bahkan lebih kecil kemungkinannya untuk lolos dari puncak, bukan? Yang ingin saya katakan adalah ini: karena ukuran sampel data historis BTC terlalu kecil, dan jika Anda hanya mempertimbangkan siklus sebelumnya, kemungkinan akan jatuh ke dalam perangkap "kebocoran data di masa depan". Seseorang pada April 2021 (puncak pertama) tidak akan tahu bahwa nilai MVRV pada saat itu sebenarnya adalah titik tertinggi dari siklus itu, karena ia hanya dapat melihat data 13 atau 17 tahun; Demikian pula, ketika top kedua muncul pada tahun 2021, nilai MVRV berada di posisi yang sangat rendah, dan jika top pertama tidak lolos, secara alami tidak mungkin untuk lolos dari top menurut data top kedua, sehingga peluang terbaik untuk lolos dari top pada tahun 2021 akan terlewatkan. 2. Indikator AVIV AVIV dapat dianggap sebagai MVRV yang dikoreksi dan dianggap lebih baik, dan memiliki karakteristik "pengembalian rata-rata" yang lebih jelas daripada MVRV. Namun demikian, fenomena "puncak yang semakin berkurang (tertinggi)" masih jelas: 1, 2, 3, dan 4 yang ditandai pada gambar sesuai dengan puncak 13, 17, dan 2021, masing-masing. Untuk pertanyaan yang sama, saya akan langsung menyalin teks di atas untuk dipertimbangkan pembaca: Bagaimana cara menetapkan ambang batas yang lebih konservatif? Jika kita kembali ke April 2021 dan hanya melihat data historis 13 atau 17 tahun, dapatkah ambang batas yang ditetapkan secara konservatif dipicu pada 21 April? Bisakah ambang batas yang ditetapkan dengan cara ini dipicu di puncak kedua pada tahun 2021? Jika Anda tidak berpikir April 2021 adalah yang teratas, maka puncak kedua pada tahun 2021 bahkan lebih kecil kemungkinannya untuk lolos dari puncak, bukan? RUP (Laba Relatif Belum Terealisasi) Saya juga memperkenalkan data on-chain RUP secara rinci sebelumnya, pembaca yang tertarik dapat merujuk ke dua artikel berikut: Akademi Data On-Chain (9): Barometer Pasar RUPL(I) - Pengenalan Data > Aplikasi Membaca Bawah Akademi Data On-Chain (10): Barometer Pasar RUPL(II) - Sinyal Atas Terkuat & Analisis Detail Teratas Siklus Historis Seorang pembaca pernah bertanya: "Dapat memahami logika divergensi RUP, Tetapi haruskah kita juga mempertimbangkan tertinggi sepanjang masa yang telah dicapai RUP?" Seperti yang ditunjukkan pada gambar di atas, ini adalah grafik historis RUP, dan 1, 2, 3, dan 4 yang ditandai pada gambar sesuai dengan bagian atas masing-masing 13, 17, dan 2021. Dapat dilihat bahwa meskipun RUP telah distandarisasi untuk kapitalisasi pasar, masih ada fenomena puncak yang semakin berkurang. Satu lagi penyiksaan jiwa: Bagaimana cara menetapkan ambang batas yang lebih konservatif? Jika kita kembali ke April 2021, kita dapat melihat bahwa data historis hanya 13 atau 17 tahun, dan ambang batas yang ditetapkan secara konservatif dapat ditetapkan pada 21 ...

Lihat Asli
Konten ini hanya untuk referensi, bukan ajakan atau tawaran. Tidak ada nasihat investasi, pajak, atau hukum yang diberikan. Lihat Penafian untuk pengungkapan risiko lebih lanjut.
  • Hadiah
  • Komentar
  • Bagikan
Komentar
0/400
Tidak ada komentar
  • Sematkan
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate.io
Komunitas
Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • ไทย
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)