أعلنت مجموعة علي بابا إنترناشيونال للتجارة الرقمية، عن إطلاق نموذجها اللغوي الكبير، “ماركو – إم تي”، (Marco-MT)، الذي يعد ثورة جديدة في مجال الذكاء الاصطناعي. حيث تم تصميمه خصيصاً لإزالة الحواجز اللغوية بدقة وذكاء استثنائيين، عبر تعزيز الترجمة في مجال التجارة الإلكترونية.
ويعد “ماركو – إم تي”، (Marco-MT)، هو النموذج اللغوي الكبير الثوري الخاص بـ “علي بابا إنترناشيونال” (LLM)، حيث يعمل على ترجمة وتفسير المعاني والسياقات اللغوية بشكل دقيق جداً، ما يعزز دقة صياغة ووصف المنتجات والسلع وتطابقها مع الترجمة البشرية، مما يسهل تفاعل المستخدمين متعدد اللغات، ويوفر ترجمة دقيقة للمستندات.
ووفقاً لمؤشر (FLORES)، وهو معيار مرجعي لتقييم أداء أنظمة الترجمة الآلية القائمة على نماذج الذكاء الاصطناعي، فقد تفوق “ماركو – إم تي”، (Marco-MT)، على المنتجات العالمية الرائدة في مجال الترجمة المدعومة بالذكاء الاصطناعي من حيث نتائج تقييم (BLEU)، الذي يقيس مدى جودة الترجمة الآلية بناءً على مدى تطابقها مع الترجمة البشرية.
وتُظهر البيانات، تفوق لافت لــــ “ماركو – إم تي”، (Marco-MT)، في التقييمات المتعلقة بالترجمة من لغات أخرى إلى اللغة الإنجليزية والعكس.
يعمل “ماركو – إم تي”، (Marco-MT)، بانسيابية داخل أنظمة التجارة الإلكترونية، حيث يوفر خدمات ترجمة آلية للتجار والمستهلكين. وتتيح قدراته في تعديل المحتوى إلى لغة الأسواق المحلية ترجمة دقيقة وسليمة للمعلومات المنشورة عن المنتجات والسلع – بما في ذلك العناوين والوصف – إلى لغة السوق المستهدفة، مما يعزز كفاءة التواصل والوصول إلى المستهلكين بشكل كبير.
وعلى عكس الأنظمة الأخرى التي تتجاهل إحدى اللغات خلال سيناريو المحادثة المباشرة متعددة اللغات، يترجم “ماركو -MT “، كل اللغات بدقة وسلاسة إلى اللغة المُستهدفة.
يستفيد “ماركو – إم تي”، (Marco-MT)، من الخبرة الواسعة التي اكتسبتها مجموعة “علي بابا إنترناشيونال” عبر المنصات المُتعددة للتجارة الإلكترونية الدولية، حيث تمت معالجة المليارات من البيانات الخاصة بالتجارة الإلكترونية. ويعمل هذا الكم الهائل من البيانات، جنباً إلى جنب مع التقنيات المتقدمة في ترتيب البيانات وتنقيتها واختيارها، وتحديد اللغات، وتقييم مستوى الجودة، بما يُمكن “ماركو – إم تي”، (Marco-MT)، من التفوق في الأداء عبر مجموعة متنوعة من معايير تقييم جودة الترجمة الآلية، بما في ذلك معايير (BLEU)، و(COMET)، بالإضافة إلى التقييمات البشرية لبيان مدى دقتها وسلاستها، وتطابقها مع المعنى والسياق الأصلي، مما يجعله أكثر فعالية وموثوقية في تحديد جودة الترجمة.
كما تضمنت عملية تطوير “ماركو – إم تي”، (Marco-MT)، جانب التدريب على تعزيز اللغات المتعددة من خلال سلسلة نماذج اللغة الكبيرة “Qwen”، التي طورتها شركة Alibaba، وتستهدف تحسين أداء الترجمة الآلية والتطبيقات متعددة اللغات، مما يضمن إطاراً لغوياً متعدداً وقوياً.
وباستخدام ابتكارات مثل منهج مزيج الخبراء متعدد اللغات، المعروف بـــــ (MOE)، ومنهجيات توسيع المعاملات المعروف بـــ (parameter expansion methodologies)، يحافظ “ماركو – إم تي”، (Marco-MT)، على أداء متميز في اللغات الرئيسية، كما يعمل في الوقت نفسه على تعزيز إمكانيات اللغات الأخرى. ويعد هذا النموذج بأنه الأكثر كفاءة من حيث استخدام الموارد، حيث يتم تنشيط الأجزاء الضرورية فقط عند تشغيله واستخدامه، مما يقلل من استهلاك الطاقة والوقت اللازم للمعالجة.
بالإضافة إلى ذلك، ومن خلال استراتيجيات التحسين مثل تصغير النموذج (quantization)، والتسريع، وتقليل النماذج المتعددة، تمكنت “علي بابا” من خفض تكاليف الخدمة للنماذج الكبيرة بشكل كبير، مما يجعلها أكثر فعالية من حيث التكلفة مقارنة بالنماذج الأصغر.