تم إطلاق النموذج في دولة الإمارات، وهو أحدث نموذج لغوي كبير مفتوح المصدر ومتاح بتكلفة فعّالة،
يعزز تبادل المعرفة ويدعم البحث والتطوير ونقل التكنولوجيا في مجال الذكاء الاصطناعي التوليدي
أبوظبي، الإمارات العربية المتحدة، 30 مايو 2024: أعلنت جامعة محمد بن زايد للذكاء الاصطناعي، بالتعاون مع شركة "بيتووم" ومنصة LLM360، عن إطلاق نموذج K2-65B الجديد، وهو نموذج لغوي كبير رائد مفتوح المصدر يستند إلى 65 مليار مُعامِل. ويتميز هذا النموذج بأنه يرفع من مستوى معايير الشفافية والأداء في مجال الذكاء الاصطناعي مفتوح المصدر. إذ يوفر نهجاً محتملاً لتوثيق ودراسة دورة الحياة الكاملة للنماذج اللغوية الكبيرة، بما في ذلك جميع تفاصيل عملية الاستنساخ.
الجدير بالذكر أن منصة LLM360 توفر إطاراً لإصدار النماذج اللغوية الكبيرة يعزز جهود المجتمع التي تهدف إلى تحقيق رؤية الذكاء العام الاصطناعي، وذلك من خلال تمكين عمليات البحث والتطوير مفتوحة المصدر في مجال النماذج اللغوية الكبيرة، والتي تكون خاضعة لمراجعة النظراء، وتتسم بالشفافية وتكون قابلة للاستنساخ، كما تكون نتاج تعاون بين مختلف الأطراف المعنية. أما نموذج K2-65B فهو متاح مجاناً على مستوى العالم بموجب رخصة "أباتشي 2.0"، وهو النموذج اللغوي الكبير الوحيد القابل للاستنساخ من طرف ثالث، والذي يتفوق في الأداء على أهم النماذج اللغوية الكبيرة المتقدمة المتوفرة في القطاع الخاص، مثل نموذج "لاما 270B".
ولا بد من الإشارة إلى أنه تم تدريب نموذج K2 باستخدام 1.4 تريليون وحدة لغوية و480 وحدة معالجة رسومات من نوع A100 ضمن سحابة "دي جي أكس" الخاص بشركة "إنفيديا"، أي باستخدام موارد أقل بنسبة 35% من الموارد المستخدَمة لتدريب نموذج "لاما 270B"، مما يجعله واحداً من النماذج الأكثر استدامة في العالم ضمن فئته. هذا ويستطيع نموذج K2 أن ينافس نماذج أكبر بكثير، مثل "جي بي تي-4"، في بعض المجالات الاستراتيجية، مثل التفكير المتعلق بالرياضيات والمنطق.
لا شك في أن النماذج اللغوية الكبيرة قد أصبحت واحدة من أهم الأدوات في مجال معالجة اللغات الطبيعية، إذ إنها تُمكّن أجهزة الحاسوب من فهم النص وتوليده بطريقة تشبه إلى حد كبير التَواصل البشري. في هذا الإطار، أحرزت الشركات الإماراتية تقدماً هائلاً في هذا المجال في السنوات الأخيرة، لا سيما من خلال إطلاق "جيس"، وهو النموذج اللغوي الكبير الأكثر تقدمًا في العالم باللغة العربية، والذي يُعتبر ثمار التعاون الوثيق بين شركة "كور 42" وجامعة محمد بن زايد للذكاء الاصطناعي وشركة "سيريبراس سيستمز". وتأتي هذه الجهود لتدعم رؤية دولة الإمارات العربية المتحدة التي تقوم على تعزيز مكانها كوجهة رئيسية في مجال الذكاء الاصطناعي.
في هذا الصدد، قال رئيس جامعة محمد بن زايد للذكاء الاصطناعي البروفيسور إريك زينغ، الذي دعم تطوير نموذج K2، بالإضافة إلى غيره من أنظمة الذكاء الاصطناعي واسعة النطاق التي يعمل عليها معهد النماذج التأسيسية التابع للجامعة: "إن إطلاق نموذج K2-65B يُثبت كفاءة دولة الإمارات في تطوير النماذج اللغوية الكبيرة عالية المستوى، وهي كفاءة تزداد يوماً بعد يوم. ويجسّد هذا النموذج أهمية تبني نهج مفتوح يقوم على التعاون بين مختلف الأطراف بهدف إنشاء نماذج لغوية كبيرة تتميز بمستوى استثنائي من الأداء والكفاءة والقدرة على إحداث تغيير جذري في جميع القطاعات والمنظمات."
وقد تم تدريب نموذج K2-65B على مرحلتين، وخضع إلى 22 عملية تقييم صارمة وشاملة لتحديد مستوى أدائه في مختلف التخصصات، مثل الرياضيات والبرمجة والطب ومجالاتٍ أخرى، فتفوق هذا النموذج الجديد على نموذج "لاما 270B" في كل مجالٍ من هذه المجالات.
كما أظهر هذا النموذج مستويات أداء عالية حتى في المجالات التي يُعتبر التنافس فيها صعباً مع أفضل النماذج اللغوية الكبيرة المفتوحة. وقد تفوق نموذج الدردشة الخاص به على نموذج الدردشة الخاص بـ"لاما 270B" على جميع المستويات التي شملها التقييم، إذ أثبت قدرته على الفهم وتوليد إجابات شبيهة بإجابات الإنسان في مختلف السيناريوهات.
تعليقاً على إطلاق النموذج، قال هيكتور ليو، رئيس قسم الهندسة في شركة "بيتووم" والمطور الرئيسي للنموذج: "يشكل توفير مخططٍ لاستنساخ نموذج K2 عاملاً أساسياً لتعزيز المعرفة والقدرة البحثية وخيارات تطوير النماذج اللغوية الكبيرة على المستوى العالمي. وأنا على يقين بأن إصدار نموذج بهذا الحجم وبهذه الجودة سيؤثر بشكل إيجابي في منظومة المصادر المفتوحة، إذ سيتفاعل المجتمع مع النموذج ويستفيد من الحلول التي توصلنا إليها، على غرار ما شهدناه مع النماذج السابقة على منصة LLM360، مثل "أمبر" و"كريستال كودر"."
أما الخصائص الأخرى التي يتميّز نموذج K2-65B عن النماذج اللغوية الكبيرة المتوفرة حالياً، فهي تشمل الشفافية التامة التي يحققها من خلال توفير "مجموعات التدريب المسبق والتطوير" على منصة LLM360. فهو يضمن بذلك، ومن خلال التوجيهات التدريبية المفصلة، ومحطات التدقيق، ونتائج التقييم التي يوفرها، إمكانية الاستنساخ والتدقيق في جميع مراحل عملية تطويره.
إضافة إلى ذلك، يستخدم هذا النموذج قدرات حاسوبية أقل من تلك التي تستخدمها النماذج اللغوية الكبيرة المشابهة، فيدعم زيادة الكفاءة التشغيلية ويساهم في الحد من استهلاك الطاقة، مما يمكّن المستخدمين في جميع أنحاء العالم من الالتزام بممارسات الحوسبة المستدامة.
هذا وتقدّم "المجموعة البحثية" على منصةLLM360 للباحثين والمطورين مجموعة كبيرة من الأدوات التي يحتاجونها لدراسة ديناميكيات التدريب، مما يوفر لهم موارد مهمة جداً تساعدهم على التعمّق في أبحاثهم واستكشافاتهم.
الجدير بالذكر أن فريق العمل الذي طوّر هذا النموذج يدرس إمكانية إعداد النموذج لفهم الصور، إلى جانب المبادرات التي أطلقها لتطويره وتقييمه والتي تهدف إلى تحسين أداء النموذج بشكل مستمر وتعزيز استخداماته المتعددة.