Minufiyah.com

تقدم عرب نيوز الأخبار الإقليمية من أوروبا وأمريكا والهند وباكستان والفلبين ودول الشرق الأوسط الأخرى باللغة العربية لغير المتجانسين.

كيف أن النماذج اللغوية الكبيرة التي تم تطويرها في الخليج، مثل جايسي، تعمل على جلب اللغة العربية إلى مجال الذكاء الاصطناعي السائد؟

كيف أن النماذج اللغوية الكبيرة التي تم تطويرها في الخليج، مثل جايسي، تعمل على جلب اللغة العربية إلى مجال الذكاء الاصطناعي السائد؟

دبي: عندما ظهر ChatGPT لأول مرة في العام الماضي، أحدث مشروع الذكاء الاصطناعي ضجة عالمية حيث وجد المستخدمون أنفسهم يتفاعلون مع آلة يمكن أن تبدو وكأنها إنسان آخر.

ومع ذلك، فإن الحماس بين خبراء التكنولوجيا في العالم العربي قد تضاءل إلى حد ما بسبب الإقبال المحدود على اللغة العربية في ChatGPT، ويرجع ذلك جزئيًا إلى تعقيد اللغة وعلامات التشكيل والبنية التصريفية واللهجات الإقليمية.

يستطيع ChatGPT، استنادًا إلى نموذج لغة كبير أو LLM، فهم الاستفسارات وترجمتها إلى اللغة العربية، خاصة عند استخدام اللغة العربية الفصحى الحديثة، حيث يمكن أن تكون الإجابات غير طبيعية، في حين أن الترجمات المباشرة لا تنقل دائمًا الرسالة الصحيحة. .

لهذا السبب، تم إطلاق Jais، وهو برنامج LLM مصمم لدعم اللغة العربية، في يوليو، مما جعل الذكاء الاصطناعي الأكثر شهرة في العالم، وإن تم تجاهله في بعض الأحيان، في الاتجاه السائد.

جيس، وهو اسم يذكرنا بأعلى قمة في دولة الإمارات العربية المتحدة في رأس الخيمة، كان من بنات أفكار مجموعة من الأكاديميين والمهندسين الذين بدأوا المشروع لأنهم شعروا أن عدداً قليلاً جداً من حاملي شهادة الماجستير في القانون يتحدثون لغات متعددة بشكل موثوق.


روبوت Amecca ذو الشكل البشري يرحب بالزوار في متحف المستقبل في دبي. (فرانس برس)

يتوفر برنامج Zeiss للتنزيل على منصة التعلم الآلي Hugging Face، وهو نتيجة للتعاون بين Cerebras Systems وجامعة محمد بن زايد للذكاء الاصطناعي، أو MBZUAI، وشركة فرعية مقرها أبوظبي تابعة لشركة G42 تسمى Inception.

وقال آندي جاكسون، الرئيس التنفيذي لشركة Inception، لصحيفة عرب نيوز: “من المهم إنشاء نماذج لغوية كبيرة للغات غير الإنجليزية لضمان إتاحة الابتكار للجميع”.

“إن الحصول على شهادة LLM باللغة العربية ذات الجودة أمر مهم جدًا لجميع القطاعات والشركات والمنظمات وكذلك الأفراد. يزدهر الابتكار عندما نتعاون، ويضع جيس معيارًا جديدًا لتقدم الذكاء الاصطناعي في الشرق الأوسط، مما يضمن أن تجد اللغة العربية، بعمقها وتراثها، صوتها في مشهد الذكاء الاصطناعي.

“تُظهر Zice التزامنا بالتميز والتزامنا بإضفاء الطابع الديمقراطي على الذكاء الاصطناعي وقيادة الابتكار.”

LLMs هي نماذج وظيفية للتعلم الآلي تستخدم خوارزميات التعلم العميق لمعالجة وفهم اللغة البشرية الطبيعية. يتم تدريب هذه النماذج على كميات كبيرة من البيانات النصية لتعلم أنماط اللغة.

ومع انتشارها السريع في أعقاب نجاح ChatGPT، أصبحت هذه البرامج قادرة على إنشاء نصوص لمجموعة لا حصر لها من المواضيع، وإنشاء كل شيء بدءًا من الأوراق الأكاديمية وحتى الشعر.

وما يجذبهم بشكل خاص هو قدرتهم على توليد إجابات محددة لأسئلة تشبه الأسئلة التي يطرحها الإنسان بأي لغة، بما في ذلك البرمجة.

READ  شراكة Iveda مع المعهد العربي للتصنيع لجلب الجيل الخامس من المدن الذكية إلى مصر

ولكن لكي تكون هذه اللغات قوية، غالبًا ما يحتاج المبرمجون البشريون الناطقون بها إلى توفير سياق وفهم نقدي يمكن أن يحسن الدقة والموثوقية.

وقال جاكسون: “تم تصميم Jais للغة العربية ويتفوق في التقاط الفروق الدقيقة والفروق الدقيقة، مما يضمن استجابات دقيقة للغاية وحساسة للسياق – وهي ميزة واضحة على النماذج ذات الأغراض العامة”.


يمكن لبرامج الذكاء الاصطناعي المستجيبة للغة العربية توسيع نطاق الوصول إلى التكنولوجيا التحويلية الجديدة. (MBZUAI)

“تعد هذه الخبرة تطورًا رئيسيًا يفتح الفرص أمام الحكومات والصناعات والأفراد في جميع أنحاء العالم العربي لتسخير إمكانات الذكاء الاصطناعي التوليدي.”

قام زايس، الذي يعتبر حاليًا أحد الحاصلين على ماجستير إدارة الأعمال باللغة العربية الرائدة، بتدريب نموذج معلمة مكون من 13 مليارًا على مجموعة بيانات عربية وانجليزية تم إنشاؤها حديثًا بقيمة 395 مليار رمز على Condor Galaxy، أحد أكبر أجهزة الكمبيوتر السحابية العملاقة في العالم التي تعمل بالذكاء الاصطناعي والتي أطلقتها G42. واستخدمت Cerebros 116 مليار رمزًا عربيًا و279 مليار رمزًا إنجليزيًا في يوليو.

وقال بريسلاف ناكوف، أستاذ ونائب رئيس معالجة اللغات الطبيعية في MBZUAI، لصحيفة عرب نيوز: “ولد زايس في أبو ظبي ويقدم لأكثر من 400 مليون ناطق باللغة العربية الفرصة لاستخدام إمكانات الذكاء الاصطناعي”.

“وسوف تعمل على تسهيل وتسريع الابتكار، وتسليط الضوء على مكانة أبوظبي الرائدة كمركز للذكاء الاصطناعي والابتكار والحفاظ على الثقافة والتعاون الدولي.”

وباعتباره نموذجًا مفتوح المصدر، من المتوقع أن يقوم زايس بإشراك العلماء والأكاديميين والمطورين لتسريع تطوير نظام بيئي للذكاء الاصطناعي باللغة العربية. وسيكون أيضًا بمثابة نموذج للغات الأخرى التي أصبحت الآن ممثلة تمثيلاً ناقصًا في الذكاء الاصطناعي السائد.

أسرعحقائق

• نماذج اللغات الكبيرة، أو LLMs، هي نوع من الذكاء الاصطناعي الذي يحاكي الذكاء البشري.

• يتحدث اللغة العربية 400 مليون شخص، ولكنها تمثل 1% من إجمالي المحتوى العالمي عبر الإنترنت.

• تم تطوير Zeiss بواسطة Cerebras وMBZUAI وشركة تابعة لشركة G42 تسمى Inception.

وقال ناكوف: “إن زايس تتفوق على النماذج العربية الحالية بفارق كبير”. “على الرغم من تدريبه على بيانات أقل بكثير باللغة الإنجليزية، إلا أنه قادر على المنافسة مع نفس الحجم من عينات اللغة الإنجليزية.

“تظهر هذه النتيجة المثيرة أن المكون الإنجليزي للنموذج يمكنه التعلم من البيانات العربية والعكس، مما يفتح حقبة جديدة في تطوير وتدريب ماجستير إدارة الأعمال.”

READ  يعمل النساجون الساري الهنديون على إحياء التقاليد

في تطوير زايس، تم إيلاء اهتمام كبير للمعالجة المسبقة للنص العربي، وتحسين دعمه للميزات الفريدة للغة، بما في ذلك أسلوب الكتابة وترتيب الكلمات.

تحافظ Jais على تركيز متوازن على مجموعة البيانات العربية-الإنجليزية لتحقيق الأداء الأمثل، مما يوفر تحسينًا كبيرًا مقارنة بالنماذج ذات النص العربي المحدود.

ويزعم مطوروها أن زايس، على عكس النماذج الأخرى، يلتقط الفروق اللغوية ويفهم مختلف اللهجات العربية والإشارات الثقافية.

وقال جاكسون، الرئيس التنفيذي لشركة Inception: “يسهل Jayce التخصيص السريع لحالات استخدام محددة تتمحور حول العرب ويعالج المخاوف المتعلقة بملكية البيانات من خلال تواجده في دولة الإمارات العربية المتحدة، مما يوفر حلاً واعداً للشركات المحلية”.


LLMs هي نماذج وظيفية للتعلم الآلي تستخدم خوارزميات التعلم العميق لمعالجة وفهم اللغة البشرية الطبيعية. (متاح)

تخطط وزارة الخارجية الإماراتية ووزارة الصناعة والتكنولوجيا المتقدمة وشركة بترول أبوظبي الوطنية ووزارة الصحة والاتحاد للطيران وبنك أبوظبي الأول ومجموعة التكنولوجيا العالمية e& لاستخدام Jais لتقديم رؤى قيمة لتحسين النموذج. وتطبيقاتها في صناعاتها.

ومع جهود التحول الرقمي القوية التي تبذلها العديد من حكومات الخليج العربي، والاستثمارات الكبيرة في الصناعات ذات التقنية العالية والشركات الناشئة في مجال التكنولوجيا المحلية، يمكن لمشاريع الذكاء الاصطناعي المستجيبة للغة العربية توسيع الوصول إلى التكنولوجيا التحويلية الجديدة وتحدي الاحتكارات. مجموعة من شركات وادي السيليكون.

في الشهر الماضي، أصدر معهد الابتكار التكنولوجي، وهو مركز أبحاث إماراتي في أبو ظبي، صاروخ فالكون 180 بي، وهو نموذج أولي مفتوح المصدر للذكاء الاصطناعي. تأسست شركة TII في عام 2020، وأصدرت النسخة الأولى من نموذج الذكاء الاصطناعي الرائد مفتوح المصدر، Falcon 40b، في مايو من هذا العام، بعد إطلاق نموذج الذكاء الاصطناعي نور باللغة العربية العام الماضي.

وفقًا لتقرير في مجلة The Economist، فإن معهد دراسات الترجمة هو ذراع الأبحاث التطبيقية لمجلس أبحاث التكنولوجيا المتقدمة ويعمل به 800 موظف متعدد الجنسيات يعملون في موضوعات تتراوح من التكنولوجيا الحيوية والروبوتات إلى الحوسبة الكمومية.

وقال فيصل البناي، الأمين العام لـ ATRC، لصحيفة The Economist: “إننا ندخل اللعبة لتعطيل اللاعبين الرئيسيين”، مضيفًا أن معهد دراسات الترجمة سيطور نماذج وتطبيقات جديدة خاصة بمجالات محددة مثل الطب والقانون.

من جانبها، أطلقت المملكة العربية السعودية استراتيجيتها الوطنية للبيانات والذكاء الاصطناعي في أكتوبر 2020، بهدف أن تصبح رائدة عالميًا في هذا المجال حيث تسعى إلى جذب 20 مليار دولار من الاستثمارات الأجنبية والمحلية بحلول عام 2030.

وتلتزم المملكة أيضًا بتحصين قوتها العاملة في المستقبل من خلال التدريب الأول وتطوير مجموعة تضم 20 ألف خبير في الذكاء الاصطناعي والبيانات. وفي مايو من هذا العام، تم إطلاق شركة ديلويت للذكاء الاصطناعي رسميًا في مؤتمر تحليلات الخبرة في الرياض.

READ  أطلقت كوريا الشمالية صاروخًا متوسط ​​المدى على اليابان

أطلقت المملكة العربية السعودية الأسبوع الماضي أولمبياد وطني في البرمجة والذكاء الاصطناعي مفتوح لجميع طلاب المدارس المتوسطة والثانوية. ومن بين 3 ملايين مشارك، سيتم اختيار 300 ألف طالب للتدريب على البرمجة والذكاء الاصطناعي، بحسب تقارير إعلامية.


ونأمل أن يؤدي ظهور الذكاء الاصطناعي وأتمتة الترجمة السريعة إلى تغيير قواعد اللعبة بالنسبة للمحتوى العربي. (خطوة)

وهو مشروع مشترك بين الهيئة السعودية للبيانات والذكاء الاصطناعي، بالتعاون مع وزارة التعليم ومؤسسة الملك عبد العزيز ورجاله (موهبة).

ووفقاً لتقرير حديث صادر عن شركة الاستشارات العالمية برايس ووترهاوس كوبرز، من المتوقع أن تساهم الرقمنة في المملكة العربية السعودية واعتماد التقنيات الناشئة بنسبة 2.4 في المائة من الناتج المحلي الإجمالي بحلول عام 2030.

وأضاف تقرير برايس ووترهاوس كوبرز أنه بناءً على متوسط ​​النمو السنوي في مساهمة الذكاء الاصطناعي حسب المنطقة، من المتوقع أن تمثل المملكة العربية السعودية 31.3 بالمائة من توسع التكنولوجيا بين عامي 2018 و2030.

وقال ناكوف، من جامعة محمد بن زايد للذكاء الاصطناعي: “إن الذكاء الاصطناعي يتطور بسرعة، وسيكون تأثيره محسوساً أكثر فأكثر في جميع مجالات ومجالات الحياة”. “وفي هذا السياق، من المهم أن يتمكن العالم العربي من الوصول إلى ماجستير إدارة أعمال متقدم يمكن تكييفه وتطبيقه في جميع القطاعات.

“إن التقدم السريع في الذكاء الاصطناعي يعني أن الشركات التي تفشل في التكيف والبدء في استخدام الذكاء الاصطناعي سوف تتخلف عن الركب، مما يجعل الوصول إلى ماجستير إدارة الأعمال عالي الجودة أكثر إلحاحًا للعالم العربي.”

ولكن إلى جانب تطبيقاته التجارية، فإن الجانب الرئيسي لمشروع مثل JAYS هو قدرته على دعم اللغات المهملة، والحفاظ عليها في اقتصاد سريع التغير، وتعزيز الشمول الرقمي.

على الرغم من أن اللغة العربية هي لغة رسمية في 22 دولة ويتم التحدث بها إلى حد ما في 11 دولة أخرى، إلا أنها لا تمثل سوى 1% من إجمالي المحتوى العالمي عبر الإنترنت، وفقًا لمنشئي زايس. الأمل هو أن ظهور الذكاء الاصطناعي وأتمتة الترجمة السريعة سيغير قواعد اللعبة.

ومن خلال وضع اللغة في طليعة ثورة الذكاء الاصطناعي، يستطيع زايس وخلفاؤه المساعدة في الحفاظ على أهمية اللغة العربية العالمية وأهميتها الثقافية الفريدة في العصر الرقمي.