OpenAI في 12/12 أطلقت رسمياً GPT-5.2، وتصنف على أنها حالياً أنسب سلسلة نماذج ذكاء اصطناعي لـ«العمل في المعرفة المهنية». وذكرت الشركة أن GPT-5.2 يمكنه مباشرة إنتاج نتائج عملية مثل العروض التقديمية، جداول البيانات، الشفرات، وتحليل المستندات الطويلة، ويدعم التعامل عبر أدوات متعددة، ومهام متعددة الخطوات، كما يمكنه إنشاء ألعاب صغيرة على الويب وبطاقات تهنئة. بناءً على ردود الفعل، يمكن للمستخدمين من الشركات الخاصة باستخدام ChatGPT توفير من 40 إلى 60 دقيقة من وقت العمل يومياً، ويُوفر المستخدمون المكرسون أكثر من 10 ساعات أسبوعياً، ويُعتبر GPT-5.2 نسخة رئيسية لتعزيز الإنتاجية بشكل أكبر.
ثلاث نسخ تُطلق بالتزامن، وتلبي جميعها سيناريوهات الاستخدام المهني المختلفة
ذكرت OpenAI أن GPT-5.2 أُطلق بالتزامن بثلاث نسخ: Instant، Thinking، وPro، كل منها يركز على الكفاءة اليومية، والتفكير العميق، وجودة المسائل ذات الصعوبة العالية. وعلى صعيد تطبيقات ChatGPT، ستتوفر GPT-5.2 للمستخدمين الذين يشتركون في خطط مدفوعة أولاً. وفي منصة API، تم فتحها بالكامل للمطورين للاستخدام.
قفزات نوعية في قدرات العمل المهني، لأول مرة تصل إلى مستوى خبراء البشر في GDPval
أشارت OpenAI إلى أن GPT-5.2 Thinking حققت اختراقاً رئيسياً في تقييم GDPval للمعرفة المهنية. يشمل هذا التقييم 44 مهنة، و9 صناعات رئيسية، ويطلب من النموذج إنتاج نتائج قابلة للتسليم مباشرة، مثل العروض التقديمية، جداول البيانات، جداول المواعيد، والوثائق التجارية.
وأظهرت النتائج أن 70.9% من المهام التي قام بها GPT-5.2 Thinking تفوقت على أداء خبراء الصناعة، أو كانت بمثابة تساويهم، مع سرعة إنتاج تزيد عن 11 مرة عن الإنسان، وتكلفة أقل من 1%، مما يجعلها أول نموذج من OpenAI يصل إلى مستوى خبرة البشر، أو يتجاوزها.
ترقية شاملة لقدرات التطبيق العملي، وتعزيز إنتاج المشاريع وتطوير البرمجيات بشكل متزامن
وفي التطبيق العملي، أصبحت عروض GPT-5.2 Thinking التقديمية وجداول البيانات أكثر تكاملاً وترابطاً، مع منطق أقرب إلى الاستشاريين والمحللين المهنيين، ويمكنها التعامل مع تخطيط الموارد، وهيكلة الأسهم، وإدارة المشاريع لمهام معقدة. في مهام جداول البيانات بمستوى البنوك الاستثمارية، تحسنت أداؤها بنسبة حوالي 9% مقارنة بالجيل السابق.
وفي تطوير البرمجيات، حقق GPT-5.2 Thinking معدل دقة بنسبة 56% في اختبار SWE-Bench Pro لمحاكاة إصلاح الكود في العالم الحقيقي، حيث يمكنه قراءة مستودعات الكود مباشرة، وفهم المشكلات الهندسية، وإخراج تصحيحات قابلة للاستخدام.
(ملاحظة: SWE-Bench Pro هو اختبار لمحاكاة «عمل مهندس البرمجيات في العالم الحقيقي»، يتطلب من الذكاء الاصطناعي إصلاح مشكلات برمجية في مشاريع فعلية مباشرة، وليس فقط الإجابة على أسئلة نظرية. )
رفع مستوى الثقة والتكامل، وتحسين التعامل مع المستندات الطويلة، والصور، والأدوات التعاونية
ذكرت OpenAI أن معدل أخطاء GPT-5.2 Thinking أقل بنسبة تقارب 30% مقارنة بالجيل السابق. وفي تقييم MRCRv2، حتى مع التعامل مع مستندات طويلة تصل إلى مئات الآلاف من الكلمات، حافظ النموذج على دقة قريبة من الحد الأقصى، مما يجعله مناسباً لتحليل العقود، البيانات المالية، والمستندات النصية.
وفي مجال فهم الصور، انخفض معدل الأخطاء عند قراءة الرسوم البيانية وواجهات البرمجيات بشكل واضح، وبلغت دقته 98.7% في اختبار Tau2-bench، مما يمكنه من إتمام المهام عبر الأنظمة، وبتعدد الخطوات بشكل ثابت ومستقر.
كما يمكن لـGPT-5.2 أيضاً إنشاء صفحات ويب صغيرة، وألعاب صغيرة، وغيرها.
(ملاحظة: MRCRv2 هو اختبار يقيم قدرة الذكاء الاصطناعي على التعرف الصحيح على المعلومات الرئيسية ضمن محتوى طويل، وعدم الخلط بين السياقات خلال عمليات الاستنتاج المتعددة. وTau2-bench هو اختبار لمحاكاة خدمة العملاء والعمليات التجارية الحقيقية، ويختبر قدرة الذكاء الاصطناعي على استدعاء الأدوات بشكل صحيح، ودمج المعلومات، وإتمام المهام عبر عدة جولات تفاعلية. )
تم نشر هذا المقال بعنوان: OpenAI تطلق GPT-5.2 الجديد: يمكنه عمل ألعاب صغيرة وبطاقات تهنئة، والمستخدمون من الشركات يوفرون 10 ساعات عمل أسبوعياً. ظهر أولاً في أخبار السلسلة ABMedia.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
OpenAI تقدم GPT-5.2 الجديد: يمكنه إعداد الألعاب الصغيرة والبطاقات، وتوفير 10 ساعات عمل أسبوعياً للمستخدمين من الشركات
OpenAI في 12/12 أطلقت رسمياً GPT-5.2، وتصنف على أنها حالياً أنسب سلسلة نماذج ذكاء اصطناعي لـ«العمل في المعرفة المهنية». وذكرت الشركة أن GPT-5.2 يمكنه مباشرة إنتاج نتائج عملية مثل العروض التقديمية، جداول البيانات، الشفرات، وتحليل المستندات الطويلة، ويدعم التعامل عبر أدوات متعددة، ومهام متعددة الخطوات، كما يمكنه إنشاء ألعاب صغيرة على الويب وبطاقات تهنئة. بناءً على ردود الفعل، يمكن للمستخدمين من الشركات الخاصة باستخدام ChatGPT توفير من 40 إلى 60 دقيقة من وقت العمل يومياً، ويُوفر المستخدمون المكرسون أكثر من 10 ساعات أسبوعياً، ويُعتبر GPT-5.2 نسخة رئيسية لتعزيز الإنتاجية بشكل أكبر.
ثلاث نسخ تُطلق بالتزامن، وتلبي جميعها سيناريوهات الاستخدام المهني المختلفة
ذكرت OpenAI أن GPT-5.2 أُطلق بالتزامن بثلاث نسخ: Instant، Thinking، وPro، كل منها يركز على الكفاءة اليومية، والتفكير العميق، وجودة المسائل ذات الصعوبة العالية. وعلى صعيد تطبيقات ChatGPT، ستتوفر GPT-5.2 للمستخدمين الذين يشتركون في خطط مدفوعة أولاً. وفي منصة API، تم فتحها بالكامل للمطورين للاستخدام.
قفزات نوعية في قدرات العمل المهني، لأول مرة تصل إلى مستوى خبراء البشر في GDPval
أشارت OpenAI إلى أن GPT-5.2 Thinking حققت اختراقاً رئيسياً في تقييم GDPval للمعرفة المهنية. يشمل هذا التقييم 44 مهنة، و9 صناعات رئيسية، ويطلب من النموذج إنتاج نتائج قابلة للتسليم مباشرة، مثل العروض التقديمية، جداول البيانات، جداول المواعيد، والوثائق التجارية.
وأظهرت النتائج أن 70.9% من المهام التي قام بها GPT-5.2 Thinking تفوقت على أداء خبراء الصناعة، أو كانت بمثابة تساويهم، مع سرعة إنتاج تزيد عن 11 مرة عن الإنسان، وتكلفة أقل من 1%، مما يجعلها أول نموذج من OpenAI يصل إلى مستوى خبرة البشر، أو يتجاوزها.
ترقية شاملة لقدرات التطبيق العملي، وتعزيز إنتاج المشاريع وتطوير البرمجيات بشكل متزامن
وفي التطبيق العملي، أصبحت عروض GPT-5.2 Thinking التقديمية وجداول البيانات أكثر تكاملاً وترابطاً، مع منطق أقرب إلى الاستشاريين والمحللين المهنيين، ويمكنها التعامل مع تخطيط الموارد، وهيكلة الأسهم، وإدارة المشاريع لمهام معقدة. في مهام جداول البيانات بمستوى البنوك الاستثمارية، تحسنت أداؤها بنسبة حوالي 9% مقارنة بالجيل السابق.
وفي تطوير البرمجيات، حقق GPT-5.2 Thinking معدل دقة بنسبة 56% في اختبار SWE-Bench Pro لمحاكاة إصلاح الكود في العالم الحقيقي، حيث يمكنه قراءة مستودعات الكود مباشرة، وفهم المشكلات الهندسية، وإخراج تصحيحات قابلة للاستخدام.
(ملاحظة: SWE-Bench Pro هو اختبار لمحاكاة «عمل مهندس البرمجيات في العالم الحقيقي»، يتطلب من الذكاء الاصطناعي إصلاح مشكلات برمجية في مشاريع فعلية مباشرة، وليس فقط الإجابة على أسئلة نظرية. )
رفع مستوى الثقة والتكامل، وتحسين التعامل مع المستندات الطويلة، والصور، والأدوات التعاونية
ذكرت OpenAI أن معدل أخطاء GPT-5.2 Thinking أقل بنسبة تقارب 30% مقارنة بالجيل السابق. وفي تقييم MRCRv2، حتى مع التعامل مع مستندات طويلة تصل إلى مئات الآلاف من الكلمات، حافظ النموذج على دقة قريبة من الحد الأقصى، مما يجعله مناسباً لتحليل العقود، البيانات المالية، والمستندات النصية.
وفي مجال فهم الصور، انخفض معدل الأخطاء عند قراءة الرسوم البيانية وواجهات البرمجيات بشكل واضح، وبلغت دقته 98.7% في اختبار Tau2-bench، مما يمكنه من إتمام المهام عبر الأنظمة، وبتعدد الخطوات بشكل ثابت ومستقر.
كما يمكن لـGPT-5.2 أيضاً إنشاء صفحات ويب صغيرة، وألعاب صغيرة، وغيرها.
(ملاحظة: MRCRv2 هو اختبار يقيم قدرة الذكاء الاصطناعي على التعرف الصحيح على المعلومات الرئيسية ضمن محتوى طويل، وعدم الخلط بين السياقات خلال عمليات الاستنتاج المتعددة. وTau2-bench هو اختبار لمحاكاة خدمة العملاء والعمليات التجارية الحقيقية، ويختبر قدرة الذكاء الاصطناعي على استدعاء الأدوات بشكل صحيح، ودمج المعلومات، وإتمام المهام عبر عدة جولات تفاعلية. )
تم نشر هذا المقال بعنوان: OpenAI تطلق GPT-5.2 الجديد: يمكنه عمل ألعاب صغيرة وبطاقات تهنئة، والمستخدمون من الشركات يوفرون 10 ساعات عمل أسبوعياً. ظهر أولاً في أخبار السلسلة ABMedia.