Lấy cấu trúc đỉnh đôi của Bitcoin năm 2021 làm ví dụ: Nói về cái gọi là "rò rỉ dữ liệu trong tương lai"

Khi chúng ta kiểm tra lại một tập hợp các chiến lược và kiểm tra một tập hợp các chỉ số, chúng ta có thực sự đứng trong thời điểm này không? Bài viết này bắt đầu từ hai cái bẫy "rò rỉ dữ liệu trong tương lai" và "overfitting", đồng thời phân tích thử nghiệm nghiêm trọng của phân tích on-chain hai đỉnh vào năm 2021. (Tóm tắt: Tiếp tục thị trường cuộc sống: phân tích đỉnh kép kỳ lạ nhất năm 2021 với dữ liệu on-chain) (Bổ sung cơ bản: Học viện dữ liệu on-chain (1): Bạn có biết chi phí trung bình của BTC trên toàn thị trường là bao nhiêu không? Những điểm chính: Nói về khái niệm "Thiên vị nhìn về phía trước" Nói về lượt truy cập trong giao dịch: Overfitting Double top vào năm 2021: thử nghiệm lớn nhất để khắc thanh kiếm Đánh giá hiệu suất của ba chỉ số và một mô hình Thiên vị nhìn về phía trước Hãy tưởng tượng một kịch bản: "Giả sử tôi phát triển một chiến lược giao dịch và kiểm tra lại nó một cách nghiêm ngặt trong 50 năm qua 1975 ~ 2024, và có hiệu suất backtest rất tốt. Đó là lý do tại sao tôi quyết định khởi động chiến lược này vào năm 2025". Bạn đọc thân mến, đối với mô tả trên, có ai thấy có gì sai không? Nếu bạn thực sự chỉ làm backtesting 1975 ~ 2024, thực sự rất dễ rơi vào cái bẫy "rò rỉ dữ liệu trong tương lai". Bởi vì chúng tôi chỉ đơn giản là sử dụng tất cả dữ liệu "cho đến nay" để thực hiện backtesting, điều này sẽ dẫn đến các thông số chiến lược mà chúng tôi đã đào tạo, có khả năng là "thiếu kiên nhẫn"! Một cách tiếp cận nghiêm ngặt hơn là, ví dụ: bạn có thể kiểm tra lại hiệu suất của cả năm 2024 cho "1975 ~ 2023" (giả sử rằng chúng ta đang ở năm 2024) và sử dụng chiến lược đào tạo; Tất nhiên, bạn cũng có thể sử dụng dữ liệu của giai đoạn 1975 ~ 2022 để đào tạo chiến lược, sau đó sử dụng chiến lược đã đào tạo để kiểm tra lại hiệu suất của năm 2023 và 2024. Chính xác hơn, chúng ta có thể tránh "rò rỉ dữ liệu trong tương lai" càng nhiều càng tốt thông qua "rollping backtesting" hoặc "stepping backtesting". Ưu điểm của việc này là "đảm bảo rằng chiến lược sau đào tạo có thể chịu được thử thách của tương lai". Overfitting: chất độc nguy hiểm nhất Bất cứ ai có một chút khái niệm phát triển chiến lược định lượng cơ bản sẽ biết các vấn đề quá mức có thể nghiêm trọng như thế nào. Cái gọi là overfitting, theo thuật ngữ của giáo dân, là "khắc thuyền cho thanh kiếm", điều này sẽ làm cho dữ liệu backtest trông đẹp (lỗi huấn luyện thấp), nhưng khó áp dụng cho chiến đấu thực tế (lỗi kiểm tra cao). Ở đây mình định giới thiệu một khái niệm toán học để giải thích: (độc giả đau đầu khi thấy toán học, bạn có thể bỏ qua trực tiếp đoạn tiếp theo để xem kết luận) Giả sử có một dãy số: "1 , 2 , 4 , 8 , 16 , ?" Độc giả hơi nhạy cảm với các con số nên nghĩ rằng số tiếp theo là 32, bởi vì năm mục dữ liệu đầu tiên rõ ràng có liên quan đến "sức mạnh của 2". Nhưng trên thực tế, chúng ta không thể thực sự dự đoán con số tiếp theo sẽ là gì. Bởi vì từ quan điểm toán học, chúng ta có thể sử dụng nội suy Lagrange để xây dựng một đa thức bậc cao khác, để dữ liệu thứ sáu không phải là 32, mà còn thỏa mãn định luật. Điều này có nghĩa là: "Các dự đoán được ngoại suy chỉ trên các điểm dữ liệu hữu hạn là không đáng tin cậy." 2021 Second Top: Bài kiểm tra lớn nhất cho hầu hết các chỉ số Sau khi nói về các khái niệm lý thuyết nhàm chán, hãy nói về chiến đấu thực tế. Dưới đây, tôi sẽ đưa ra ba chỉ số dữ liệu trên chuỗi và một mô hình mà cá nhân tôi đã phát triển để giải thích cho tất cả độc giả: 1. MVRV Tôi tin rằng những độc giả đã nghiên cứu phân tích dữ liệu on-chain một chút chắc hẳn đã nghe nói về MVRV, và bài viết trước của tôi cũng đã thực hiện giảng dạy chi tiết về chỉ số này ( Trường dữ liệu on-chain (1): Bạn có biết chi phí trung bình của BTC trên toàn thị trường là bao nhiêu không? )。 Như được hiển thị ở trên, đây là biểu đồ dữ liệu lịch sử của MVRV. 1, 2, 3 và 4 được đánh dấu trong biểu đồ tương ứng với đầu 13, 17 và 2021 tương ứng. Chúng ta có thể thấy rõ rằng mức cao MVRV ở đầu mỗi vòng đang "giảm". Tôi đã nghe nhiều người sử dụng các phương pháp sau đây để đối phó với hiện tượng giảm dần mức cao: "Tôi biết nó đang giảm, vì vậy khi đánh giá đỉnh, tôi sẽ lấy ngưỡng bảo thủ hơn và thấp hơn như một tín hiệu cảnh báo." Bây giờ câu hỏi đặt ra: làm thế nào để đặt một ngưỡng bảo thủ hơn? Nếu chúng ta quay trở lại tháng 4 năm 2021 và chỉ thấy dữ liệu lịch sử 13 hoặc 17 năm, liệu ngưỡng được đặt ra một cách thận trọng có thể được kích hoạt vào ngày 21 tháng 4 không? Ngưỡng được đặt theo cách này có thể được kích hoạt ở đỉnh thứ hai vào năm 2021 không? Nếu bạn không nghĩ tháng 4/2021 là đỉnh, thì đỉnh thứ hai vào năm 2021 thậm chí còn ít có khả năng thoát khỏi đỉnh phải không? Điều tôi muốn nói là: bởi vì kích thước mẫu của dữ liệu lịch sử BTC quá nhỏ và nếu bạn chỉ xem xét các chu kỳ trước đó, nó có khả năng rơi vào cái bẫy "rò rỉ dữ liệu trong tương lai". Một người vào tháng 4 năm 2021 (đỉnh đầu tiên) sẽ không biết rằng giá trị MVRV tại thời điểm đó thực sự là điểm cao nhất của chu kỳ đó, bởi vì anh ta chỉ có thể xem dữ liệu của 13 hoặc 17 năm; Tương tự, khi đỉnh thứ hai xuất hiện vào năm 2021, giá trị MVRV ở vị trí rất thấp và nếu đỉnh thứ nhất không thoát ra thì đương nhiên không thể thoát khỏi đỉnh theo dữ liệu của đỉnh thứ hai, do đó cơ hội tốt nhất để thoát khỏi đỉnh vào năm 2021 sẽ bị bỏ lỡ. 2. Chỉ báo AVIV AVIV có thể được coi là MVRV được điều chỉnh, cân nhắc kỹ lưỡng hơn và có đặc tính "đảo ngược trung bình" rõ ràng hơn MVRV. Nhưng ngay cả như vậy, hiện tượng "đỉnh giảm dần (mức cao)" vẫn rõ ràng: 1, 2, 3 và 4 được đánh dấu trong hình tương ứng với đỉnh 13, 17 và 2021, tương ứng. Với cùng một câu hỏi, tôi sẽ trực tiếp copy văn bản trên để bạn đọc cân nhắc: Làm thế nào để đặt ngưỡng bảo thủ hơn? Nếu chúng ta quay trở lại tháng 4 năm 2021 và chỉ thấy dữ liệu lịch sử 13 hoặc 17 năm, liệu ngưỡng được đặt ra một cách thận trọng có thể được kích hoạt vào ngày 21 tháng 4 không? Ngưỡng được đặt theo cách này có thể được kích hoạt ở đỉnh thứ hai vào năm 2021 không? Nếu bạn không nghĩ tháng 4/2021 là đỉnh, thì đỉnh thứ hai vào năm 2021 thậm chí còn ít có khả năng thoát khỏi đỉnh phải không? RUP (Lợi nhuận chưa thực hiện tương đối) Tôi cũng đã giới thiệu chi tiết dữ liệu on-chain RUP trước đây, bạn đọc quan tâm có thể tham khảo hai bài viết sau: Học viện dữ liệu on-chain (9): Phong vũ biểu thị trường RUPL (I) - Giới thiệu dữ liệu > ứng dụng đọc dưới cùng Học viện dữ liệu on-chain (10): Phong vũ biểu thị trường RUPL (II) - Tín hiệu hàng đầu & chu kỳ lịch sử mạnh nhất Phân tích chi tiết hàng đầu Một độc giả từng hỏi: "Có thể hiểu logic của phân kỳ RUP, Nhưng chúng ta cũng có nên xem xét mức cao nhất mọi thời đại mà RUP đã đạt được không?" Như thể hiện trong hình trên, đây là biểu đồ lịch sử của RUP và 1, 2, 3 và 4 được đánh dấu trong hình tương ứng với đỉnh của 13, 17 và 2021, tương ứng. Có thể thấy, ngay cả khi RUP đã được chuẩn hóa cho vốn hóa thị trường, vẫn có hiện tượng giảm dần các đỉnh. Thêm một lần tra tấn linh hồn: Làm thế nào để thiết lập một ngưỡng bảo thủ hơn? Nếu chúng ta quay trở lại tháng 4 năm 2021, chúng ta có thể thấy rằng dữ liệu lịch sử chỉ là 13 hoặc 17 năm và ngưỡng được đặt ra một cách thận trọng có thể được đặt ở mức 21 ...

Xem bản gốc
Nội dung chỉ mang tính chất tham khảo, không phải là lời chào mời hay đề nghị. Không cung cấp tư vấn về đầu tư, thuế hoặc pháp lý. Xem Tuyên bố miễn trừ trách nhiệm để biết thêm thông tin về rủi ro.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate.io
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)