แหล่งที่มา: Cointelegraph ต้นฉบับ: 《 OORT AI ข้อมูลแบบกระจายศูนย์ขึ้นสู่อันดับต้น ๆ บน Google Kaggle 》
ชุดข้อมูลภาพที่ผ่านการฝึกอบรมโดย AI ที่พัฒนาโดย OORT ผู้ให้บริการโซลูชัน AI แบบกระจายอํานาจประสบความสําเร็จอย่างโดดเด่นบนแพลตฟอร์ม Kaggle ของ Google
รายการชุดข้อมูล “Diverse Tools Kaggle” ของ OORT ได้รับการเผยแพร่ในต้นเดือนเมษายน; หลังจากนั้น มันได้ขึ้นสู่หน้าหลักในหลายหมวดหมู่ Kaggle เป็นแพลตฟอร์มออนไลน์ภายใต้ Google สำหรับการแข่งขันด้านวิทยาศาสตร์ข้อมูลและการเรียนรู้ของเครื่อง การเรียนรู้ และการทำงานร่วมกัน.
Ramkumar Subramaniam ผู้มีส่วนร่วมหลักของโครงการ OpenLedger กล่าวกับ Cointelegraph ว่า “การจัดอันดับบนหน้าแรกของ Kaggle เป็นสัญญาณทางสังคมที่แข็งแกร่ง ซึ่งแสดงให้เห็นว่าชุดข้อมูลนี้กำลังดึงดูดการมีส่วนร่วมอย่างกระตือรือร้นจากชุมชนที่สำคัญ เช่น นักวิทยาศาสตร์ข้อมูล วิศวกรการเรียนรู้ของเครื่อง และผู้ปฏิบัติงานต่างๆ.”
Max Li ผู้ก่อตั้งและ CEO ของ OORT ได้เปิดเผยกับ Cointelegraph ว่าบริษัท “ได้สังเกตเห็นตัวชี้วัดการมีส่วนร่วมที่น่าพอใจ ซึ่งยืนยันว่า “ข้อมูลการฝึกอบรมที่รวบรวมผ่านโมเดลแบบกระจาย” นั้นมีความต้องการในตลาดในระยะเริ่มต้นและมีความเกี่ยวข้องจริงๆ” เขาเสริมว่า:
“ความสนใจที่เกิดขึ้นเองจากชุมชน รวมถึงการใช้งานจริงและการมีส่วนร่วม เป็นการแสดงให้เห็นอย่างชัดเจนว่าไปป์ไลน์ข้อมูลที่ขับเคลื่อนโดยชุมชนแบบกระจายอํานาจเช่น OORT สามารถเปิดใช้งานการกระจายอย่างรวดเร็วและการมีส่วนร่วมในวงกว้างโดยไม่ต้องพึ่งพาตัวกลางแบบรวมศูนย์ได้อย่างไร”
Li ยังกล่าวว่า OORT วางแผนที่จะปล่อยชุดข้อมูลหลายชุดในอีกไม่กี่เดือนข้างหน้า ซึ่งรวมถึงชุดข้อมูลคำสั่งเสียงในรถ ชุดข้อมูลคำสั่งเสียงในบ้านอัจฉริยะ และชุดข้อมูลวิดีโอปลอมลึกที่ออกแบบมาเพื่อเพิ่มความสามารถในการตรวจสอบความถูกต้องของสื่อที่ขับเคลื่อนด้วย AI.
Cointelegraph ได้ยืนยันข้อมูลอย่างอิสระว่า ชุดข้อมูลดังกล่าวได้ขึ้นหน้าแรกในหมวดหมู่ AI ทั่วไป, การค้าปลีกและการช็อปปิ้ง, อุตสาหกรรมการผลิต และวิศวกรรมบน Kaggle เมื่อต้นเดือนนี้ จนถึงเวลาที่เขียนบทความ ชุดข้อมูลนี้ไม่ได้รักษาตำแหน่งเหล่านี้อีกต่อไปหลังจากการอัปเดตชุดข้อมูลที่อาจไม่เกี่ยวข้องเมื่อวันที่ 6 พฤษภาคมและการอัปเดตอีกครั้งในวันที่ 14 พฤษภาคม.
แม้จะยอมรับความสำเร็จนี้ แต่ Subramaniam กล่าวกับ Cointelegraph ว่า “นี่ไม่ใช่ตัวชี้วัดที่เด็ดขาดสำหรับการประยุกต์ใช้งานจริงหรือคุณภาพระดับองค์กร” เขาเน้นว่า ความโดดเด่นของชุดข้อมูล OORT “ไม่เพียงแต่สะท้อนในอันดับ แต่ยังอยู่ที่แหล่งที่มาของชุดข้อมูลและกลไกการกระตุ้น” เขาอธิบายเพิ่มเติมว่า:
“แตกต่างจากผู้จัดจำหน่ายแบบรวมศูนย์ที่อาจพึ่งพากระบวนการที่ไม่โปร่งใส ระบบที่โปร่งใสและมีแรงจูงใจจากโทเค็นสามารถเสนอความสามารถในการติดตาม ความร่วมมือในการจัดการจากชุมชน และการปรับปรุงอย่างต่อเนื่อง โดยมีเงื่อนไขว่ามีการจัดตั้งโครงสร้างการปกครองที่เหมาะสม.”
Lex Sokolin, หุ้นส่วนของบริษัทลงทุนด้านความเสี่ยงด้านปัญญาประดิษฐ์ Generative Ventures กล่าวว่า แม้ว่าเขาจะคิดว่าผลลัพธ์เหล่านี้ไม่ได้ยากที่จะทำซ้ำ “แต่นี่ก็เป็นการพิสูจน์ว่ากระบวนการเข้ารหัสสามารถใช้กลไกการกระตุ้นแบบกระจายเพื่อจัดระเบียบกิจกรรมที่มีค่าเศรษฐกิจได้.”
ตามข้อมูลที่เผยแพร่โดย Epoch AI ซึ่งเป็นสถาบันวิจัยปัญญาประดิษฐ์ข้อมูลการฝึกอบรม AI ข้อความที่มนุษย์สร้างขึ้นคาดว่าจะหมดลงภายในปี 2028 ความกดดันนั้นยิ่งใหญ่มากจนตอนนี้นักลงทุนกําลังทําข้อตกลงนายหน้าเพื่อรักษาสิทธิ์ในการใช้เนื้อหาที่มีลิขสิทธิ์สําหรับ บริษัท AI
รายงานการวิจัยได้รับการหมุนเวียนมานานหลายปีเกี่ยวกับความขาดแคลนที่เพิ่มขึ้นของข้อมูลการฝึกอบรม AI และวิธีที่สิ่งนี้อาจ จํากัด การพัฒนาภาคสนาม ในขณะที่สังเคราะห์ ( ข้อมูล ) ที่สร้างขึ้นโดย AI กําลังถูกใช้อย่างกว้างขวางและประสบความสําเร็จมากขึ้นข้อมูลที่มนุษย์สร้างขึ้นยังคงถูกมองว่าเป็นตัวเลือกที่ต้องการสําหรับการพัฒนาโมเดล AI ที่มีประสิทธิภาพดีกว่า
ในด้านการฝึกอบรมภาพด้วย AI สถานการณ์เริ่มซับซ้อนมากขึ้น ศิลปินกำลังตั้งใจทำลายการฝึกอบรม เพื่อปกป้องงานของตนจากการถูกใช้ในการฝึกอบรม AI โดยไม่ได้รับอนุญาต เครื่องมือ Nightshade ช่วยให้ผู้สร้างสามารถ “ทำให้ภาพของพวกเขาเป็นพิษ” ซึ่งจะส่งผลกระทบอย่างมากต่อประสิทธิภาพของโมเดล.
Subramaniam กล่าวไว้ว่า: “เรากำลังเข้าสู่ยุคที่ข้อมูลภาพคุณภาพสูงมีความขาดแคลนมากขึ้น.” เขายังเน้นย้ำว่าการใช้เทคนิคการโจมตีภาพอย่างแพร่หลายทำให้ความท้าทายนี้ยิ่งรุนแรงขึ้น:
“ด้วยการเกิดขึ้นของเทคโนโลยีการซ่อนภาพและวิธีการฝึก AI เช่น การโจมตีข้อมูลที่เป็นอันตราย ชุดข้อมูลแบบเปิดจึงเผชิญกับความท้าทายทั้งในด้านจำนวนและความเชื่อถือได้.”
เพื่อตอบสนองต่อสถานการณ์ Subramaniam กล่าวว่าชุดข้อมูลแรงจูงใจที่ตรวจสอบได้และมีส่วนร่วมกับชุมชนนั้น “มีค่ามากกว่าที่เคย” เขาเชื่อว่าโครงการดังกล่าว “จะไม่เพียง แต่เป็นทางเลือกเท่านั้น แต่ยังจะกลายเป็นเสาหลักของการจัดตําแหน่ง AI และการตรวจสอบย้อนกลับข้อมูลในระบบเศรษฐกิจข้อมูล” "
แนะนำที่เกี่ยวข้อง: Kima เข้าร่วม Mastercard Sandbox เพื่อทำการเติมเงินบัตรสเตเบิลคอยน์