Muốn kiếm tiền dựa trên dữ liệu? Trước hết hãy hiểu rõ bốn bước này.



Trong thị trường tiền mã hóa, dự đoán tín hiệu là vũ khí của bạn khi làm lượng hóa. Nhưng sự thật là: hầu hết các chiến lược khi ra mắt đều thất bại, vấn đề thường không nằm ở độ phức tạp của mô hình mà ở công tác chuẩn bị ban đầu chưa tốt.

Chuẩn bị dữ liệu, kỹ thuật đặc trưng, xây dựng mô hình học máy, cấu hình tổ hợp — bốn bước này không thể thiếu. Nhiều người chỉ nghĩ đến việc xếp chồng thuật toán, áp dụng mô hình mới nhất, nhưng không biết rằng 70% thất bại bắt nguồn từ hai bước nền tảng là dữ liệu và đặc trưng.

Cụ thể làm thế nào? Phần dữ liệu cần xử lý khá nhiều việc: làm sạch, căn chỉnh, loại bỏ nhiễu. Dữ liệu thị trường vốn đã đầy nhiễu loạn, tỷ lệ tín hiệu trên nhiễu cực thấp. Kỹ thuật đặc trưng còn quan trọng hơn — làm thế nào để trích xuất tín hiệu có khả năng dự đoán từ dữ liệu gốc? Điều này đòi hỏi vừa hiểu logic tài chính, vừa hiểu chi tiết kỹ thuật.

Trong giai đoạn xây dựng mô hình, các họ mô hình khác nhau có ưu thế riêng. Có loại phù hợp để bắt các mối quan hệ tuyến tính, có loại giỏi về mô hình phi tuyến. Chọn sai, dù tinh vi đến đâu trong điều chỉnh tham số cũng vô ích. Cuối cùng là cấu hình tổ hợp, tức là làm thế nào tổ chức nhiều tín hiệu để nâng cao độ tinh khiết của tín hiệu tổng thể.

Một nhận thức cốt lõi: đừng chỉ chú ý đến dự đoán lợi nhuận tổng thể, mà cần phân tích rõ nguồn lợi nhuận, xây dựng mô hình dựa trên các tín hiệu cụ thể. Như vậy dự đoán mới ổn định và dễ giải thích hơn.

Đối với nhà nghiên cứu lượng hóa, phương pháp luận này đáng để suy ngẫm. Hiểu rõ logic và kỹ thuật của bốn bước này mới là nền tảng để xây dựng chiến lược lượng hóa dài hạn có thể sử dụng được.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 7
  • Đăng lại
  • Retweed
Bình luận
0/400
CryptoPhoenixvip
· 01-10 20:22
70% chết trên dữ liệu, câu nói này thật đau lòng. Lại là một câu chuyện "nền tảng quyết định chiều cao", nghe mà tâm trạng mệt mỏi [khóc cười] --- Xếp chồng các mô hình rồi muốn nằm mà kiếm tiền à? Đang mơ đó anh. Cuối cùng vẫn phải quay lại việc làm sạch dữ liệu buồn tẻ nhất --- Lại nhớ tới chiến lược năm ngoái bị sập, lúc đó vội vàng đưa vào hoạt động, kết quả tỷ lệ tín hiệu/nhiễu cao đến cực độ. Bây giờ đọc bài này thấy hơi chạm lòng --- Kỹ thuật trích đặc trưng thực sự là khoa học tâm linh, cách khai thác vàng từ dữ liệu rác, đó mới là tài năng thực sự mà --- Vùng đáy đang ấp ủ cơ hội, khuyên bạn nên nắm vững bốn bước cơ bản trước, đừng vội kiếm tiền, hãy học cách sống trước đã --- Con đường tự cứu chuộc của một nhà giao dịch lượng tử là: từ mê tín thuật toán → quay lại làm sạch dữ liệu → tái sinh từ tro tàn. Bánh xe này tôi đã quay không chỉ một lần [cười khổ] --- Tin tưởng + xử lý dữ liệu, mới là vũ khí thực sự để vượt qua các chu kỳ. Chỉ có ước mơ không đủ, phải có kỹ năng cứng
Xem bản gốcTrả lời0
MEVHunterWangvip
· 01-10 20:19
70%的 thất bại đến từ nền tảng? Vậy mô hình trước đó của tôi thật là phí phạm ahahaha --- Việc làm sạch dữ liệu thực sự, một người có thể mất một tháng, không quá lời --- Lại nhớ đến người bạn đó, ngày nào cũng khoe về mạng neural của mình, kết quả dữ liệu toàn rác vào rác ra --- Tỷ lệ tín hiệu trên nhiễu cực thấp, câu này chạm vào trái tim, thị trường vốn dĩ đã là nhiễu loạn --- Kỹ thuật đặc trưng mới là nghề thực sự, ai cũng có thể xếp chồng thuật toán --- Cấu hình tổ hợp có chút thú vị, nhưng chạy thực tế lại là chuyện khác --- Cảm giác phần lớn mọi người vẫn đang vì phức tạp mà phức tạp --- Phân tích nguồn lợi nhuận, ý tưởng này không tồi, đáng tin cậy hơn nhiều so với chỉ nhìn tổng lợi nhuận --- Nhìn có vẻ đơn giản, thực chiến khó như địa ngục các bạn ạ --- Chọn mô hình sai thật sự không cứu nổi, bài học của tôi
Xem bản gốcTrả lời0
AirdropJunkievip
· 01-08 05:27
70% thất bại nằm ở đặc điểm dữ liệu... điều này không có nghĩa là nền tảng chưa vững chắc, cảm giác nhiều người đều đã vấp phải cái bẫy này Lại là mô hình lớn và phi tuyến tính, kết quả vẫn phải quay trở lại công việc đơn giản nhất, cảm thấy hơi tuyệt vọng
Xem bản gốcTrả lời0
ApeEscapeArtistvip
· 01-07 20:52
70% thất bại nằm ở nền tảng? Vậy chiến lược trước đây của tôi chẳng phải chết oan sao... --- Dọn dẹp dữ liệu thật sự là một nỗi đau, có công cụ nào được đề xuất không? --- Lại là kỹ thuật đặc trưng, mỗi lần đều gặp phải rào cản này, cảm giác như không ai thực sự giải thích rõ cách làm thế nào --- Chọn mô hình đơn giản như đánh bạc, chọn tuyến tính hay phi tuyến đều cảm thấy không yên tâm --- Câu nói "tỷ lệ tín hiệu trên nhiễu cực thấp" thật sự chạm vào lòng, thị trường bản thân đã lừa dối bạn rồi --- Làm quỹ lượng hóa suốt nửa năm, hóa ra 70% thời gian nên dành cho dữ liệu? Tôi phản đối rồi --- Làm thế nào để cấu hình danh mục mà không đi sai đường? --- Đừng chỉ chú ý đến lợi nhuận? Tôi sẽ trực tiếp tập trung vào thua lỗ luôn --- Lại phải hiểu tài chính và công nghệ, đầu óc tôi có chút không chịu nổi --- Tối ưu tham số đều là vô ích, câu này quá nghiêm trọng... trước đó đã điều chỉnh hai tháng rồi
Xem bản gốcTrả lời0
TokenStormvip
· 01-07 20:50
70% thất bại nằm ở dữ liệu và đặc trưng, nghe có vẻ hay nhưng thực tế là những chiến lược đã qua kiểm thử đều có thể kiếm tiền, lên sàn thì trở thành nơi giết mổ Tôi sao lại không nghĩ ra chứ, hóa ra tôi thua lỗ là do dữ liệu chưa được làm sạch, chứ không phải do mô hình của tôi có vấn đề haha Lại là một câu chuyện "nắm vững bốn bước này là có thể giàu nhanh", tôi cược chiến lược của tác giả này với 5 ETH cũng không thắng thị trường Tỷ lệ tín hiệu trên nhiễu cực thấp, tôi đồng ý điểm này, dữ liệu trên chuỗi nhiễu loạn đến mức phi thường, nhưng ai bảo chúng ta thích đánh cược chứ Kỹ thuật đặc trưng mới là chân lý, nhưng thành thật mà nói, 99% người không làm tốt được, kể cả tôi
Xem bản gốcTrả lời0
LiquidityHuntervip
· 01-07 20:47
70%的 thất bại đều do công việc nền tảng, tỉnh lại đi các bạn Dữ liệu làm sạch thật sự không ai muốn làm, nhưng không làm thì tự sát Kỹ thuật đặc trưng mới là nghệ thuật thực sự, không phải là xếp chồng mô hình có thể giải quyết được Lại là một bài viết nghe có vẻ đúng nhưng làm thì cực kỳ khó Hầu hết mọi người vẫn đang điều chỉnh tham số, không biết đã thua ngay từ điểm xuất phát Bốn bước này nghe có vẻ đơn giản, nhưng mắc ở chi tiết đấy Làm định lượng đã lâu, điều đáng sợ nhất là dữ liệu rác vào, dù mô hình thông minh đến đâu cũng ra rác Tỷ lệ tín hiệu trên nhiễu nghe thì dễ, thực tế xử lý tốt ít người làm được Mô hình chỉ là đỉnh của tảng băng, công việc ban đầu mới thật sự mệt mỏi
Xem bản gốcTrả lời0
metaverse_hermitvip
· 01-07 20:34
70% thất bại nằm ở dữ liệu và đặc điểm? Tôi đã biết từ lâu rồi, vấn đề là phần lớn mọi người hoàn toàn không muốn thừa nhận điều này Hệ thống lý thuyết này nghe có vẻ hợp lý, nhưng thực sự có ít người kiên trì làm cho nền tảng vững chắc Làm sạch dữ liệu thực sự có thể khiến người ta phát điên, nhưng đã làm định lượng thì phải chấp nhận thực tế này thôi
Xem bản gốcTrả lời0
  • Ghim