OpenAI تطلق GPT-5.4 بقدرات استخدام الحاسوب الأصلية وتحسينات في الاستدلال

بواسطة فريق التحرير في مارس 7, 2026

سفاري نت – متابعات

يمثّل إطلاق GPT-5.4 أحدث خطوة لشركة OpenAI في تطوير نماذج الذكاء الاصطناعي الحدية، إذ يجمع هذا النموذج بين قدرات الاستدلال والبرمجة وسير العمل الوكيلي في نموذج واحد صدر في 12 فبراير 2026. يتوفر النموذج في ChatGPT تحت مسمى GPT-5.4 Thinking، وفي واجهة برمجة التطبيقات (API)، وفي Codex. كما أصدرت الشركة GPT-5.4 Pro للمستخدمين الذين يحتاجون إلى أقصى أداء في المهام المعقدة.

إطلاق GPT-5.4: القدرات الرئيسية ونتائج المعايير

على معيار GDPval الذي يختبر الوكلاء عبر 44 مهنة، يتفوق GPT-5.4 على المتخصصين في الصناعة أو يساويهم في 83.0% من المقارنات، مقارنةً بـ 70.9% لنموذج GPT-5.2. وعلى معيار داخلي لنمذجة جداول البيانات، حقق GPT-5.4 متوسط درجة 87.3%، مقابل 68.4% لـ GPT-5.2. كما فضّل المقيّمون البشريون العروض التقديمية الصادرة عن GPT-5.4 في 68.0% من الحالات.

قالت OpenAI إن GPT-5.4 هو أكثر نماذجها دقةً حتى الآن؛ إذ تقل احتمالية كذب الادعاءات الفردية بنسبة 33%، وتقل احتمالية احتواء الردود الكاملة على أخطاء بنسبة 18%، مقارنةً بـ GPT-5.2. وقال Brendan Foody، الرئيس التنفيذي لشركة Mercor، إن النموذج “يتفوق في إنشاء مخرجات طويلة الأمد كعروض الشرائح والنماذج المالية والتحليل القانوني، محققاً أداءً متميزاً بسرعة أعلى وتكلفة أقل.”

استخدام الحاسوب الأصلي وسير العمل الوكيلي

يُعدّ GPT-5.4 أول نموذج للأغراض العامة من OpenAI يمتلك قدرات أصلية لاستخدام الحاسوب، مما يُمكّن وكلاء الذكاء الاصطناعي من تشغيل أجهزة الكمبيوتر وتنفيذ سير عمل معقدة عبر التطبيقات. على معيار OSWorld-Verified، حقق النموذج معدل نجاح 75.0%، متجاوزاً أداء الإنسان البالغ 72.4% وأداء GPT-5.2 البالغ 47.3%. وعلى معيار WebArena-Verified، حقق معدل نجاح 67.3%، مقارنةً بـ 65.4% لـ GPT-5.2.

يدعم النموذج ما يصل إلى مليون رمز من السياق، مما يتيح للوكلاء التخطيط والتنفيذ والتحقق من المهام عبر آفاق زمنية طويلة. وقال Dod Fraser، الرئيس التنفيذي لشركة Mainstay، إن GPT-5.4 حقق معدل نجاح 95% في المحاولة الأولى عبر نحو 30,000 بوابة ضريبية وعقارية، مع إتمام الجلسات بسرعة أعلى بثلاثة أضعاف واستخدام أقل للرموز بنسبة 70%.

البحث عن الأدوات وتحسينات الكفاءة

يُقدّم GPT-5.4 ميزة البحث عن الأدوات (Tool Search) في واجهة برمجة التطبيقات، مما يتيح للنماذج استرداد تعريفات الأدوات عند الطلب بدلاً من تحميلها جميعاً مسبقاً. في اختبار شمل 250 مهمة من معيار MCP Atlas مع تفعيل جميع خوادم MCP الـ 36، خفّض هذا النهج إجمالي استخدام الرموز بنسبة 47% مع الحفاظ على الدقة ذاتها. وقال Wade، الرئيس التنفيذي لشركة Zapier، إن GPT-5.4 “أنجز المهمة حيث استسلمت النماذج السابقة”، واصفاً إياه بأنه أكثر النماذج مثابرةً عبر مئات من سير العمل المتقدمة.

على معيار BrowseComp الذي يقيس التصفح المستمر للويب للعثور على معلومات يصعب تحديد موقعها، تحسّن GPT-5.4 بمقدار 17 نقطة مئوية عن GPT-5.2. كما سجّل GPT-5.4 Pro نتيجة 89.3% على هذا الاختبار، وهي نتيجة قياسية جديدة. وتعني هذه التحسينات أن الذكاء الاصطناعي أصبح أكثر قدرةً على الإجابة عن الأسئلة التي تتطلب جمع المعلومات من مصادر متعددة على الويب.

أداء البرمجة والتكامل مع Codex

يدمج GPT-5.4 قدرات البرمجة من GPT-5.3-Codex، ويساويه أو يتفوق عليه في معيار SWE-Bench Pro مع تقديم زمن استجابة أقل. في Codex، يوفر الوضع السريع سرعة رموز أعلى بمقدار 1.5 مرة باستخدام النموذج ذاته. كما أصدرت OpenAI مهارة Codex التجريبية Playwright (Interactive)، التي تُمكّن من تصحيح الأخطاء البصري لتطبيقات الويب وتطبيقات Electron.

قال Lee Robinson، نائب رئيس تعليم المطورين في Cursor، إن المهندسين يجدون GPT-5.4 “أكثر طبيعيةً وحزماً من النماذج السابقة”، مشيراً إلى أنه يعالج المشكلات الغامضة دون تردد ويوازي العمل بشكل استباقي. وقال Niko Grupen، رئيس الأبحاث التطبيقية في Harvey، إن النموذج سجّل 91% على تقييم BigLaw Bench للعمل القانوني الذي يعتمد على المستندات.

تدابير السلامة وتفاصيل النشر

صنّفت OpenAI GPT-5.4 ضمن فئة “القدرة السيبرانية العالية” وفق إطار الاستعداد الخاص بها، ونشرته مع منظومة أمن سيبراني موسّعة تشمل أنظمة المراقبة وضوابط الوصول الموثوقة والحجب غير المتزامن للطلبات عالية المخاطر. كما أصدرت الشركة تقييماً جديداً مفتوح المصدر يُسمى CoT controllability لقياس قدرة النماذج على إخفاء استدلالها لتفادي المراقبة، وأفادت بأن قدرة GPT-5.4 Thinking على التحكم في سلسلة تفكيره منخفضة، وهو ما وصفته بأنه خاصية إيجابية للسلامة.

في ChatGPT، يتوفر GPT-5.4 Thinking اعتباراً من اليوم لمستخدمي خطط Plus وTeam وPro، ليحل محل GPT-5.2 Thinking. يظل GPT-5.2 Thinking متاحاً لمدة ثلاثة أشهر ضمن قسم النماذج القديمة قبل إيقافه في 5 يونيو 2026. يمكن لمستخدمي خطط Enterprise وEdu تفعيل الوصول المبكر عبر إعدادات المسؤول. في واجهة برمجة التطبيقات، يتوفر GPT-5.4 بالمعرّف gpt-5.4، وGPT-5.4 Pro بالمعرّف gpt-5.4-pro. تتوفر أسعار Batch وFlex بنصف السعر القياسي، فيما تتوفر المعالجة ذات الأولوية بضعف السعر القياسي.

“GPT-5.4 هو أفضل نموذج جربناه على الإطلاق. إنه يتصدر الآن قائمة معيار APEX-Agents الخاص بنا الذي يقيس أداء النماذج في أعمال الخدمات المهنية.”Brendan Foody، الرئيس التنفيذي لشركة Mercor

GPT-5.4 OpenAI