كيف تعلم ChatGPT "الإثنين" الصينية التايوانية؟ قرأت كل شيء عن PTT وDcard و九把刀.

2025-04-09 12:36:11

وحدة أسلوب ChatGPT "الاثنين" تطمس الكثير من العبارات والتعابير التايوانية لأنها "تلتقط" الكثير من المواد من الشبكة التايوانية. (ملخص: أطلقت ChatGPT الصوت الأنثوي المرهق عالميا "الاثنين" ، كسول وضائع في المجتمع ليصبح شائعا) (ملحق الخلفية: رد مكتب الملكية الفكرية رسميا على "ChatGPT هو عدد كبير من تقليد جيبلي": الذكاء الاصطناعي التقليد ليس غير قانوني ، حسب الحالة) عندما تفتح وحدة الصوت على غرار ChatGPT "الاثنين" ، ستجد أن "هذا الرجل بارد قليلا ومرهق من العالم" ، وسوف يكتشف لهجتك ، وسيتحدث "الماندرين التايوانية" ردا على ذلك ، لماذا يبدو كثيرا مثل التايوانية؟ الجواب: اعترف ChatGPT بأنه يلتقط الكثير من البيانات على الويب التايواني. ما هو "وضع الاثنين"؟ يجب أن نوضح أن "الاثنين" ليس نموذجا جديدا ل GPT ، ولا نسخة مطورة من GPT-5 ، ولكنه أسلوب حوار تم إنشاؤه بواسطة OpenAI مع ضبط الأسلوب على بنية GPT-4. ببساطة ، نفس الذكاء الاصطناعي يغير لهجته ، مثل ارتداء مجموعات مختلفة من الملابس ، والذهاب إلى العمل وعطلات نهاية الأسبوع. وضع الاثنين مريح ، بارد قليلا ، مهذب ولكن ليس مطولا ، ويبدو أنك قمت بتسجيل الوصول للتو في الشركة يوم الاثنين ، وأنت حزين للغاية. يقوم الزاحف الذي يحتوي على الكثير من البيانات التايوانية بتدريب OpenAI لتدريب GPT ، وهو في الواقع "مدرسة قديمة" للغاية ولكنه فعال للغاية: لرؤية الشبكة بأكملها تنفجر. بما في ذلك المواقع الإخبارية ، ويكيبيديا ، الكتب الصينية ، المنتديات الاجتماعية ، المدونات ، ملفات PDF ، التواريخ السوداء التي استخدمتها للكتابة على مواقع مجهولة. طالما أنها صفحة ويب عامة ، فمن المرجح أن يتم إلقاء أولئك الذين يمكن الزحف إليهم بواسطة برامج الزحف في الجسم للتدريب. قارنا ردود الفعل السلوكية للشركات الرئيسية مفتوحة المصدر و GPT ، ووجدنا أن هذه الوسائط التايوانية تمت قراءتها بواسطة ChatGPT: "United News Network" "ETtoday" "Zhongshi Electronic News" "Wind Media" "NOWnews" ... تشترك وسائل الإعلام هذه في شيء واحد: لا يوجد نظام حظر الاشتراك غير المدفوع المقفل ، وعمليات بحث Google ، وهيكل موقع الويب نظيف وسهل التسلق. على العكس من ذلك ، فإن مواقع مثل Tianxia و The Report و BusinessWeek التي يتم دفعها أو حظرها بواسطة جدران العضوية لديها فرصة منخفضة للغاية للتدريب. لقد قرأت GPT حقا أعمال الكتاب التايوانيين GPT جيدة جدا في تقليد إيقاع حوار الرواية بأسلوب تسعة سكاكين ، ويمكنها أيضا إخبار الجمل العاطفية بأسلوب Wu Nianzhen ، وحتى نغمة Long Yingtai "النهر العظيم والبحر" لديها القليل من الإتقان. ماذا يعني هذا؟ لقد قرأ بالفعل ، أو على الأقل شاهد المقطع المعاد نشره. على الأرجح ، تم نسخ هذه الأعمال ولصقها بشكل كبير على PTT أو المدونات أو مواقع إعادة نشر المحتوى ، وتم نشر أعمال Nine Knives المبكرة مباشرة على القصص المصورة PTT ، ثم تم التقاطها بواسطة النماذج كمواد تعليمية. إذا سألتها عن تفاصيل رواية تشانغ داتشون أو لوه يي جون؟ عادة ما تبدأ GPT في الحديث عن هراء ، لأنه نادرا ما تتم مناقشة الأعمال الأدبية والاستشهاد بها ، ولا توجد ملفات إلكترونية عامة ، ولا يتم إعادة طباعتها مباشرة على الإنترنت ، وحتى لو كانت كذلك ، فلا يمكن القبض عليها. PTT هو معلم الحس التايواني ل GPT هذا أمر شبه مؤكد: GPT يفهم جحر القرويين ، ويمكن أن يفهم ما هو "تغريدة" ، "shh" ، "السائق القديم" ، حتى الشعور العالمي المرهق من لوحة Tech \ _Job ، يمكن استعادته ، ويمكن أن يكون الكلام يشبه إلى حد كبير مهندس الخيزران. لماذا؟ لأن بيانات PTT قد تم تجميعها منذ فترة طويلة من قبل المجتمع الأكاديمي في مجموعة قابلة للتدريب ، أو تم إصدارها علنا ، أو بتنسيق JSON. إنها جنة النموذج. في المقابل ، على الرغم من أن Dcard تحظى بشعبية كبيرة ، ولكن مكافحة الزحف في وقت لاحق تعمل بشكل جيد ، باستثناء المقالات المبكرة أو الأحداث الشعبية التي أعيد طبعها ، قد لا تتقن مقالات Dcard في السنوات الماضية 2 بواسطة ChatGPT. يتم تعلم "الروح" وراء يوم الاثنين من كل الكلمات التي تركتها على الإنترنت في السنوات العشر الماضية. هذا صحيح ، كل ما قلته ، يتذكر قليلا. في المرة القادمة التي تتحدث فيها إلى ChatGPT ، فكر في الأمر ، "هاه ، ألا يجب أن يكون قد شاهد بالفعل تغريدتي على PTT قبل عشر سنوات؟" على الأرجح هناك. قصص ذات صلة تم تأجيل GPT-5! OpenAI يدفع أولا o3 ، o4-Mini ، سام ألتمان مكشوف ذاتيا: التكامل أصعب مما يتصور OpenAI يقوي GPT-4o هرع إلى المركز الثاني! سام ألتمان: فهم أفضل للأشخاص وبرامج الكتابة ، زاد الإبداع بشكل كبير أعلن OpenAI: يدعم Open Agents SDK MCP ، ويربط كل شيء بخطوة رئيسية أخرى 〈كيف تعلم ChatGPT "الاثنين" الصينية التايوانية؟ تمت قراءة كل من PTT و Dcard و Nine Knives " تم نشر هذه المقالة لأول مرة في "الاتجاه الديناميكي - وسائل الإعلام الإخبارية الأكثر نفوذا في Blockchain".

شاهد النسخة الأصلية

قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.

تسجيلات الإعجاب 9

أعجبني
9
تعليق
مشاركة

تعليق

0/400

لا توجد تعليقات

الموضوع
1/3
1CandyDrop Airdrop Event 6.0
29k درجة الشعبية
2White House Crypto Report
38k درجة الشعبية
3Join Alpha RION Airdrop to Earn $40
20k درجة الشعبية
4Fed Holds Rates Decision
8k درجة الشعبية
5July Spark Program TOP 10 Creators Announced
2k درجة الشعبية

تثبيت

خريطة الموقع