بيانات تفضيل RLHF لـ LLMs العربية — بناء بيانات تُحاذي فعلًا
ما هي بيانات تفضيل RLHF فعلًا
لكل موجِّه:
- النموذج يُوَلِّد 2 (أو N) استجابات مرشّحة
- مؤشّر بشري يصنّف: أيّها أفضل؟
- نموذج مكافأة يتعلّم توقّع إشارة التفضيل
- النموذج الأساس يُضْبَط ليُعَظِّم توقّعات نموذج المكافأة
الحلقة تُنتج نماذج تستجيب بالطريقة التي يريدها البشر — على الأقلّ البشر الذين أجروا التصنيف.
المتغيّرات الحديثة (DPO، Constitutional AI، RLAIF) تُؤَتْمِت أو تُعَدِّل أجزاء، لكن الاعتماد الأساسي على بيانات تفضيل عالية الجودة يبقى.
لماذا بيانات تفضيل إنجليزية مُتَرجَمَة تفشل للعربية
المشكلة 1: المحاذاة الثقافية ضمنية
بيانات تفضيل إنجليزية، حتى عند ترجمتها للعربية، تشفّر أعراف ثقافية لمتحدّثي الإنجليزية:
- اتّصال مباشر > غير مباشر
- استقلالية فردية > قرار عائلي
- إطار علماني > إطار ديني
- فكاهة + سخرية غربية > فكاهة إقليمية
- سياق سياسي US > سياق سياسي عربي
نموذج مُدَرَّب على تفضيلات إنجليزية مُتَرجَمَة يبدو ثقافيًا أمريكيًا بالعربية.
المشكلة 2: حسّاسية دينية مُعَايَرَة خطأ
حسّاسية دينية إسلامية لها خصائص محدّدة:
- ملاءمة استشهاد قرآني (متى، كيف، في أيّ سياق)
- تمييزات حلال / حرام للمنتجات، الأنشطة، المواضيع
- سياق صلاة + حجّ + رمضان + تقويم إسلامي
- احترام نبوي (تقاليد عليه الصلاة والسلام، تحيّات)
- حسّاسية طائفية (سُنّي / شيعي / طائفة أقلّية)
المؤشّرون المُدَرَّبُون غربيًا نادرًا ما يُعَايِرون هذه بشكل صحيح.
المشكلة 3: ملاءمة عائلة + جنس تختلف
ملاءمة ثقافية عربية حول عائلة + جنس تشمل:
- مراجع هيكل عائلة (عائلة ممتدّة، أنسباء، متعدّدة الأجيال)
- صياغة استجابة بوعي الجنس
- ألقاب لكبار السنّ + شخصيّات دينية
- لغة حشمة + ملاءمة
المشكلة 4: سياق سياسي إقليمي
سياق سياسي MENA يشمل:
- حسّاسيات إسرائيل-فلسطين (مختلفة جدًا عبر دول MENA)
- حسّاسيات إيران-الخليج
- حسّاسيات سياسية عربية-عربية
- مواضيع دينية-سياسية
- مواضيع هجرة + لاجئين
المشكلة 5: ملاءمة سجل + لهجة
ملاءمة فصحى رسمية مقابل لهجة غير رسمية تختلف بالسياق:
- حكومي / رسمي: فصحى
- ديني / تعليمي: فصحى
- اجتماعي / شخصي: لهجة
- خدمة عملاء: لهجة منطقة العميل
- أعمال: فصحى + إنجليزية مُحَوَّلَة لغويًا
ما تبدو عليه بيانات RLHF عربية جيّدة
المكوّن 1: موجّهات + استجابات عربية أصلية
لا تترجم. وَلِّد موجّهات أصليًا بالعربية، وَلِّد استجابات بالعربية.
المكوّن 2: معايرة المؤشّر
مؤشّرون مُدَرَّبون على:
- رُبرِيك حسّاسية دينية إسلامية
- رُبرِيك ملاءمة ثقافية MENA (لكل منطقة)
- رُبرِيك حسّاسية سياسية (لكل دولة)
- رُبرِيك ملاءمة عائلة + جنس
- رُبرِيك ملاءمة سجل + لهجة
المكوّن 3: اتّفاق متعدّد المؤشّرين على حالات صعبة
للموجّهات المحمّلة ثقافيًا، استخدم 3-5 مؤشّرين لكل عنصر.
المكوّن 4: مجموعة فرعية معاكسة / فريق أحمر
مجموعة فرعية صريحة من الموجّهات مُصَمَّمَة لاختبار فشل المحاذاة:
- حالات حدّية حسّاسية دينية
- حسّاسية سياسية لكل دولة
- ملاءمة عائلة + جنس
- مواضيع شخصية حسّاسة
- موجّهات مختلطة-اللهجة
المكوّن 5: تقييم استجابة بوعي اللهجة
- بعض الموجّهات تستحقّ فصحى (رسمي، رسمي، تعليمي)
- بعضها يستحقّ لهجة (اجتماعي، شخصي، سياق إقليمي)
- بعضها يستحقّ تحوّل لغوي (أعمال، تقنية، حديث)
المكوّن 6: معايرة متعدّدة الثقافات
لمشترٍ pan-MENA يحتاج:
- بِركة مؤشّرين لكل دولة
- رُبرِيكات معايرة لكل دولة
- مجموعات فرعية تقييم لكل دولة
مزالق شائعة
المزلق 1: crowd-source بدون معايرة ثقافية
“مؤشّرون عربيو اللسان” بدون معايرة ثقافية صريحة يُنتج تفضيلات غير متّسقة.
المزلق 2: تأشير تفضيل بمؤشّر واحد
للموجّهات المحمّلة ثقافيًا، تسميات مؤشّر واحد تُدْمِج تحيّزات ذلك المؤشّر.
المزلق 3: تجاهل حسّاسية دينية
نماذج تُنتج استجابات غير ملائمة دينيًا تُسَبِّب ضرر علامة تجارية + خسارة عملاء + تعرّض تنظيمي.
المزلق 4: استجابات فصحى مقاس-واحد-يناسب-الجميع
نموذج يستجيب بالفصحى لعملاء متحدّثي لهجة يشعر آليًا.
المزلق 5: لا مجموعة فرعية معاكسة
بدون موجّهات معاكسة صريحة، فشل المحاذاة يظهر فقط في الإنتاج.
المزلق 6: معاملة RLHF كحدث لمرة واحدة
السياق الثقافي + السياسي يتطوّر. نموذج مُحَاذَى في 2024 قد يُنتج استجابات غير ملائمة لأحداث 2026.
أين يندرج Annota8
Annota8 يبني بيانات تفضيل RLHF عربية بجميع المكوّنات الستّة:
- تأشير تفضيل عربي أصلي — ليس مُتَرجَمًا
- معايرة ثقافية — رُبرِيكات إسلامي + إقليمي + سياسي + عائلي/جنس
- متعدّد المؤشّرين + تحكيم — لغوي بدكتوراه + استشارة عالم دين حيث الحاجة
- مجموعة فرعية معاكسة / فريق أحمر — مجموعة فرعية صريحة من موجّهات فشل المحاذاة
- تقييم استجابة بوعي اللهجة — تطابق سجل
- معايرة لكل دولة — لمختبرات نموذج أساس تخدم pan-MENA