تم الكشف عن نموذج جديد للذكاء الاصطناعي تم تطويره في أبو ظبي، بهدف دمج إحدى اللغات الأكثر استخدامًا في العالم في مجال الذكاء الاصطناعي السائد.
تم تطوير Jais، وهو نموذج مفتوح المصدر ثنائي اللغة العربية والإنجليزية، بواسطة Inception، وهي قسم من شركة أبو ظبي للذكاء الاصطناعي G42، وجامعة محمد بن زايد للذكاء الاصطناعي، وCerebras Systems ومقرها وادي السيليكون.
إنها أكثر دقة من غيرها من شهادات الماجستير في اللغة العربية، بما في ذلك Falcon من معهد الابتكار التكنولوجي في أبو ظبي، وMetaPlatforms، الشركة الأم لفيسبوك، وLlama 2 من Bloom، والتي تعد جزءًا من Big Science Workshop بواسطة منصة التعلم الآلي Hugging Face.
هذا المتصفح لا يدعم عنصر الفيديو.
وقال أندرو جاكسون، الرئيس التنفيذي لشركة Inception، إن إطلاق Jayce يعد خطوة أخرى في تشجيع مجتمعات العلوم والحوسبة على التركيز بشكل أكبر على ماجستير إدارة الأعمال غير الإنجليزية، على غرار المبادرات في اليابان والهند. وطني.
وقال: “نجد أن Zeiss مفيد حقًا في حالات الاستخدام المفيدة مثل إنشاء إجابات للأسئلة وإنشاء المستندات والترجمات وإنشاء رسائل البريد الإلكتروني وتقديم النصائح والتوصيات”.
وقالت الشركات إنه يلتقط الفروق اللغوية لمختلف اللهجات العربية ويمكنه فهم اللغة والسياق والإشارات الثقافية، مما يجعله “أكثر دقة وملاءمة للسياق من النماذج الأخرى”.
تم تطوير جيس – أعلى قمة في رأس الخيمة، الإمارات العربية المتحدة – للاستخدام الحكومي ولقطاعات التمويل والطاقة والمناخ والصحة. وهو متاح للتنزيل على Hacking Face.
وقد وقع عدد من الشركات العامة والخاصة في دولة الإمارات العربية المتحدة كشركاء لإطلاق جيس، بما في ذلك وزارة الخارجية، ووزارة الصناعة والتكنولوجيا المتقدمة، ودائرة الصحة – أبوظبي، وأدنوك، والاتحاد للطيران، وبنك أبوظبي الأول، وشركة e&, Technology. مشروع مشترك كان يعرف سابقاً باسم اتصالات.
وباستخدام 116 مليار رمز عربي و279 مليار رمز باللغة الإنجليزية، تدرب زايس على Condor Galaxy، “أكبر كمبيوتر فائق الذكاء الاصطناعي في العالم” أطلقته شركتا G42 وCerebras في يوليو. وقالت الشركات إنها مستمرة في التوسع مع جمع المزيد من المحتوى العربي لإنشاء مجموعات تعليمات جديدة.
الرموز هي اللبنات الأساسية للغة LLMوحدة أساسية من النص أو التعليمات البرمجية المستخدمة لمعالجة وإنشاء اللغة وأجزاء أخرى من التعليمات البرمجية.
تعتبر اللغة العربية من أكثر اللغات انتشارًا في العالم، حيث يتحدث بها أكثر من 400 مليون شخص، وفقًا للبيانات العالمية. إنها لغة رسمية في 22 دولة ويتحدث بها جزئيًا في 11 دولة. ومع ذلك، فإن تواجدها على الإنترنت لا يكاد يذكر، حيث يتوفر حوالي 1 بالمائة فقط من المحتوى العربي عبر الإنترنت، وفقًا للبيانات المقدمة من الشركات.
وقال السيد جاكسون إن عائلة Jaycees ستساعد في زيادة هذا العدد.
وقال جاكسون: “نحن نقود الجهود لجمع المزيد من البيانات العربية من مصادر غير متصلة بالإنترنت. لذا فقد بدأنا بالفعل بشكل جدي، وهذه هي الطريقة الأولى التي نستخدمها لتحسين اللغة العربية”.
“نحن نبحث عن طرق جديدة لدمج اللغة العربية وترجمة اللغة الإنجليزية الموجودة إلى اللغة العربية وتعزيز التحويل إلى اللغة العربية… لا يزال أمامنا طريق طويل، لكنني أعتقد أننا بحاجة إلى أن نكون متفائلين للغاية وأن ندفع الأمور إلى الأمام حقًا.”
تستخدم المؤسسات الذكاء الاصطناعي منذ فترة طويلة، لكنها اكتسبت زخمًا كبيرًا مع ظهور الذكاء الاصطناعي التوليدي الذي شاع بواسطة ChatGPT من OpenAI المدعوم من Microsoft.
بشكل عام، أدى هذا إلى خلق ساحة معركة جديدة في صناعة التكنولوجيا، حيث تتسابق الشركات للحصول على السبق وتوسيع نطاقها في مجال الذكاء الاصطناعي الإبداعي.
إن توفر LLMs سيساعد جهود الشركات، خاصة مع استمرار المطورين في صقل مهاراتهم في الذكاء الاصطناعي.
وقال جاكسون: “إن الأداء السريع مهم للمطورين لأنه يسمح لهم بتقديم نماذج جديدة للمجتمع أو للإنتاج أو التسويق بشكل أسرع، ولكنه يسمح أيضًا لعلماء البيانات وباحثي تعلم الآلة بإحضار نماذج مختلفة وتكرارها بسرعة”.
تم التحديث: 30 أغسطس 2023 الساعة 5:59 صباحًا
“مبشر الإنترنت. كاتب. مدمن كحول قوي. عاشق تلفزيوني. قارئ متطرف. مدمن قهوة. يسقط كثيرًا.”