【Sapien làm thế nào để thực hiện việc nâng cấp dữ liệu đào tạo liên tục?】



Một vấn đề lâu dài trong việc đào tạo AI: Dữ liệu không phải là nhiệm vụ một lần.

Trong quy trình đào tạo AI truyền thống, một khi dữ liệu đào tạo nào đó được sản xuất và sử dụng, nhiệm vụ coi như đã hoàn thành và vai trò của người đóng góp cũng kết thúc. Vấn đề do mô hình dữ liệu "tiêu thụ một lần" này mang lại là rõ ràng: dữ liệu đào tạo thiếu sự cập nhật, không thể thích nghi một cách linh hoạt với sự phát triển của mô hình, dẫn đến khả năng của mô hình bị kìm hãm. Trong bối cảnh kiến thức con người không ngừng tiến hóa, nếu mô hình AI không thể liên tục nhận được dữ liệu bổ sung sâu hơn, chuyên nghiệp hơn và mới nhất, sẽ rất khó để đối phó với thách thức của trí tuệ tổng quát.

Sapien cố gắng phá vỡ giới hạn này, không coi nhiệm vụ dữ liệu như là một "dự án" để giao, mà xây dựng một cơ chế tiến hóa dữ liệu liên tục, cho phép dữ liệu huấn luyện có chu kỳ sống, hệ thống phiên bản và khả năng bảo trì động.

Hai, làm thế nào để thực hiện việc nâng cấp dữ liệu liên tục?

Giao thức Sapien được thiết kế với ba cơ chế, đảm bảo dữ liệu đào tạo có thể được cập nhật lâu dài và chất lượng liên tục tiến hóa:

(1) Cơ chế phiên bản nhiệm vụ: Các nhiệm vụ đào tạo cùng loại sẽ được định kỳ tạo ra các phiên bản như "v2", "v3" dựa trên tần suất cập nhật mô hình, thu hút những người đóng góp cũ tham gia lại, đồng thời đưa ra những góc nhìn mới và bổ sung, hình thành tập huấn luyện nhiều vòng lặp.

(2) Cơ chế hồi báo dựa trên uy tín: Hệ thống dựa trên hồ sơ lịch sử và trọng số uy tín của người huấn luyện, gửi cho họ các nhiệm vụ hoặc nhiệm vụ sửa đổi dữ liệu có cấp độ cao hơn, thực hiện cơ chế "người cũ dẫn dắt người mới" và "tối ưu hóa chuyên biệt";

(3) Chu trình phản hồi trên chuỗi: Thông qua cơ chế phản hồi của bên sử dụng mô hình, tự động đánh dấu các đoạn dữ liệu có hiệu quả kém hoặc cần tối ưu, quay lại hồ dữ liệu đào tạo, mời người đóng góp sửa đổi và bổ sung lại.

Các cơ chế này đảm bảo rằng dữ liệu không phải là sản phẩm được giao tĩnh, mà có khả năng tiến hóa động với ba giai đoạn "phiên bản - bảo trì - nâng cấp".

Ba, vai trò mới của người duy trì dữ liệu: Người tham gia liên tục vào dữ liệu huấn luyện

Các cơ chế của Sapien đã thay đổi cách xác định danh tính của những người làm việc với dữ liệu truyền thống. Những người huấn luyện không còn chỉ là nhà cung cấp dữ liệu ở một giai đoạn nào đó, mà trở thành "người duy trì dữ liệu" và "nhà điều hành tài sản tri thức" lâu dài. Điều này không chỉ nâng cao giá trị tham gia và sức ảnh hưởng của họ trong hệ thống mà còn cho phép chất lượng dữ liệu phát triển theo nhịp độ tiến hóa của giao thức.

Trong dài hạn, mô hình này thậm chí có thể tạo ra "chuỗi nghề nghiệp nâng cấp dữ liệu" trong tương lai - bao gồm nhiều vai trò như người đánh dấu, người kiểm tra, người tối ưu hóa, người điều phối phản hồi, từ đó hình thành một mạng lưới hợp tác công việc tri thức xung quanh vòng đời dữ liệu.
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Chia sẻ
Bình luận
0/400
Không có bình luận
  • Ghim
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)