عقدت شركة OpenAI مؤتمرها الأول للمطورين OpenAI DevDay، والذي كشفت خلاله عن إصدار مطور من نماذج الذكاء الاصطناعي التوليدي للتعامل مع النصوص GPT-4 Turbo، كما طرحت الواجهة البرمجية لمنصة إنشاء الصور الذكية DALL-E 3، بجانب إتاحة أدوات تسمح لأي شخص بتطوير روبوتات برمجية خاصة بهم.
وأعلنت الشركة وصول معدل استخدام منصتها الذكية ChatGPT، إلى 100 مليون مستخدم حول العالم أسبوعياً، لتحافظ بذلك المنصة على لقب الخدمة الأسرع نمواً على الإطلاق، بحسب بيان رسمي.
كذلك تخطى عدد المطورين، الذين يستخدمون واجهاتها البرمجية لنماذجها الذكية ChatGPT، وWhisper داخل تطبيقاتها، حاجز المليوني مطور، 92% منهم شركات على قائمة Fortune 500 العالمية، بحسب بيان الشركة.
إصدار GPT-4 Turbo
وكشفت OpenAI الستار، عن إصدار GPT-4 Turbo الأكثر تطوراً من الجيل السابق GPT-4، إذ يقدم إمكانيات أقوى بتكلفة أقل.
وسيأتي الجيل الجديد في نسختين، النسخة الأولى ستكون مختصة بتحليل النصوص والتعامل مع معها والإجابة عن الاستفسارات النصية فقط، بينما النسخة الثانية ستكون قادرة على تحليل كل من النصوص والصور.
وأصبحت النسخة الخاصة بالتعامل مع النصوص متاحة للمطورين عبر الواجهة البرمجية، وستصل لعموم المستخدمين خلال الأسابيع المقبلة، بحسب الشركة.
وأوضحت الشركة أنها خفضت تكلفة المدخلات النصية بمعدل 3 مرات أقل، وتكلفة المخرجات النصية بمعدل مرتين، مقارنة بتكلفة الإصدار الأول من GPT-4.
الإصدار الجديد مُدرب على بيانات من مواقع الويب مُحدثة حتى أبريل 2023، وذلك يعد تطوراً كبيراً مقارنة بأن آخر تاريخ تحديث لبيانات تدريب الجيل الأول كان سبتمبر 2021.
وضاعفت الشركة من حجم النصوص التي يمكن للمستخدم إدخالها للنموذج الذكي، حيث وصل إلى حوالي 128 ألف توكين، أي 100 ألف كلمة أو 300 صفحة ويب، وهو يعد 4 أضعاف المتاح حاليا في GPT-4، وكذلك يفوق جميع النماذج المنافسة المتاحة تجارياً.
كذلك قدمت OpenAI تحديثاً جديداً لإصدار GPT-4 من خلال إتاحة نسخة جديدة منه تسمح بتعديله وملاءمته لتلبية احتياجات مستخدميه، وهي عملية تُعرف باسم Fine-Tunning.
وضاعفت الشركة حجم التوكين، المتاحة على متن GPT-4 للمشتركين في خدمتها المدفوعة، بنفس الأسعار القديمة.
واجهات برمجية جديدة
وأتاحت الشركة واجهات برمجية جديدة خلال مؤتمرها الأول للمطورين، بحيث يمكن لمطوري التطبيقات ومواقع الويب والخدمات الإلكترونية استخدام نماذج الشركة الذكية لتقديم خدمات ومزايا متنوعة للمستخدمين.
وجاءت على قمة الواجهات البرمجية الجديدة واجهة نموذج DALL-E 3، وهو الإصدار الأحدث من منصة إنشاء الصور بالذكاء الاصطناعي عبر الأوامر النصية التي يُدخلها المستخدم للمنصة.
الواجهة الجديدة تتيح للمطورين الاستفادة منها داخل تطبيقاتهم وخدماتهم، مقابل تكلفة مالية تبدأ من 0.04 دولار، ويتفاوت المبلغ حسب جودة الصور، والتي تتراوح بين 1024x1024 بيكسل وحتى 1792x1024 بيكسل.
وتعد واجهة نموذج DALL-E 3، محدودة الإمكانيات بعض الشيء مقارنة بواجهة الجيل السابق من النموذج، حيث أن الواجهة الجديدة لا تسمح بتعديل الصور وإنتاج إصدارات جديدة منها، أو تعديل أجزاء معينة منها.
الواجهة البرمجية ستحمل في طياتها إجراءات تقنية مطورة من جانب الشركة، لضمان عدم إساءة استخدام قدرات نموذج DALL-E 3 من جانب المستخدمين.
وفتحت الشركة واجهة برمجية Audio API، لنموذجها المتخصص في تحويل النصوص إلى أصوات مسموعة، وذلك في صورة 6 أصوات جاهزة، وسيكون متاحاً عبر نموذجين للذكاء الاصطناعي التوليدي.
وأكدت الشركة أن تلك الواجهة البرمجية ستفتح المجال أمام المطورين لتقديم تجارب أكثر تفاعلية مع خدمات مختلفة معتمدة على الصوت، مثل المساعد الذكي وتعلم اللغات.
وعلى عكس بقية خدمات إنشاء الأصوات الرقمية، فإن واجهة OpenAI الجديدة لن توفر إمكانية التحكم في المشاعر التي تظهر عبر التسجيلات الصوتية المُنشأة بالذكاء الاصطناعي.
وأعلنت OpenAI أنها ستُلزم المطورين، عند استخدامهم الواجهة الجديدة، بأنه يجب وضع توضيح صريح على كل مقطع صوتي يتم إنتاجه بخدماتهم، بأنه تم إنشاؤه عبر الذكاء الاصطناعي.
روبوتات GPTs
الشركة الواعدة في سوق الذكاء الاصطناعي أطلقت متجرها الخاص بروبوتات برمجية من تطوير المستخدمين، وسيحمل اسم GPT Store، وتلك الروبوتات ستُطلق عليها اسم GPTs.
تتيح أوبن إيه آي أدوات متنوعة للمستخدمين كي يتمكنوا من بناء روبوتاتهم البرمجية للمحادثات، تسمح لهم بتحديد اللغة المستخدمة وأسلوب الكتابة وطريقة الصياغة، وبعد ذلك يكون متاحاً للمستخدم تسمية الروبوت ووصف طبيعة إمكانياته ومهامه التي من الممكن يمكنه أداؤها.
كذلك يمكن للمستخدم تزويد الروبوتات الجديدة بقاعدة بيانات مرجعية، في صورة ملفات معلوماتية يمكن للروبوتات استخدامها في الإجابة عن تساؤلات المستخدمين، إضافة إلى أن المستخدم يستطيع التحكم في قدرات روبوتاته في تصفح الإنترنت وإنشاء الصور عبر الأوامر النصية اعتماداً على منصة DALL-E الذكية، وكذلك استخدام منصة المساعدة في كتابة الأكواد البرمجية Code Interpreter.
وأضافت OpenAI ميزة Actions داخل حزمة أدواتها لتطوير روبوتات برمجية، تسمح بإمكانية ربطها بخدمات رقمية خارجية، بحيث يمكن للمستخدم التعامل مع بيانات مختلفة، وإنشاء تقارير والحصول على إجابات مباشرة من المحتوى الذي يتضمن معلوماته الخاصة، والبداية ستكون مع تطبيقات Canva وZapier.
ووضعت الشركة مجموعة من الإجراءات المسبقة للحفاظ على خصوصية مستخدمي الروبوتات البرمجية المعروضة داخل "متجر جي بي تي"، إذ أن مطوري تلك الروبوتات لن يتمكنوا من الوصول لمحادثات مستخدميها.
كما ستجري OpenAI رقابة فورية مستمرة على جميع الروبوتات التي تدخل لمتجرها الجديد، وكافة المحادثات على متنها، لمنع استخدامها في عمليات الاحتيال وخطاب الكراهية والإباحية.
ستضع الشركة قيوداً مبدئية على من يمكنه إنشاء الروبوتات بأدواتها البرمجية وطرحها على متن متجرها، بحيث لن يتمكن من ذلك إلا من يقوم بتأكيد هويته الحقيقية.
الشركة أعلنت أنها ستشارك جزءاً من الأرباح التي تنتجها الروبوتات المتاحة عبر متجرها مع مطوريها، دون تحديد الحصة، إلى جانب أن الوصول إلى متجر GPT Sore، فور إطلاقه خلال الأسابيع المقبلة، سيكون متاحاً لمشتركي "شات جي بي تي بلس"، وكذلك مشتركي خدمة قطاع الأعمال "شات جي بي تي إنتربرايس".