كل المقالات

بيانات تفضيل RLHF لـ LLMs العربية — بناء بيانات تُحاذي فعلًا

ما هي بيانات تفضيل RLHF فعلًا

لكل موجِّه:

  1. النموذج يُوَلِّد 2 (أو N) استجابات مرشّحة
  2. مؤشّر بشري يصنّف: أيّها أفضل؟
  3. نموذج مكافأة يتعلّم توقّع إشارة التفضيل
  4. النموذج الأساس يُضْبَط ليُعَظِّم توقّعات نموذج المكافأة

الحلقة تُنتج نماذج تستجيب بالطريقة التي يريدها البشر — على الأقلّ البشر الذين أجروا التصنيف.

المتغيّرات الحديثة (DPO، Constitutional AI، RLAIF) تُؤَتْمِت أو تُعَدِّل أجزاء، لكن الاعتماد الأساسي على بيانات تفضيل عالية الجودة يبقى.

لماذا بيانات تفضيل إنجليزية مُتَرجَمَة تفشل للعربية

المشكلة 1: المحاذاة الثقافية ضمنية

بيانات تفضيل إنجليزية، حتى عند ترجمتها للعربية، تشفّر أعراف ثقافية لمتحدّثي الإنجليزية:

نموذج مُدَرَّب على تفضيلات إنجليزية مُتَرجَمَة يبدو ثقافيًا أمريكيًا بالعربية.

المشكلة 2: حسّاسية دينية مُعَايَرَة خطأ

حسّاسية دينية إسلامية لها خصائص محدّدة:

المؤشّرون المُدَرَّبُون غربيًا نادرًا ما يُعَايِرون هذه بشكل صحيح.

المشكلة 3: ملاءمة عائلة + جنس تختلف

ملاءمة ثقافية عربية حول عائلة + جنس تشمل:

المشكلة 4: سياق سياسي إقليمي

سياق سياسي MENA يشمل:

المشكلة 5: ملاءمة سجل + لهجة

ملاءمة فصحى رسمية مقابل لهجة غير رسمية تختلف بالسياق:

ما تبدو عليه بيانات RLHF عربية جيّدة

المكوّن 1: موجّهات + استجابات عربية أصلية

لا تترجم. وَلِّد موجّهات أصليًا بالعربية، وَلِّد استجابات بالعربية.

المكوّن 2: معايرة المؤشّر

مؤشّرون مُدَرَّبون على:

المكوّن 3: اتّفاق متعدّد المؤشّرين على حالات صعبة

للموجّهات المحمّلة ثقافيًا، استخدم 3-5 مؤشّرين لكل عنصر.

المكوّن 4: مجموعة فرعية معاكسة / فريق أحمر

مجموعة فرعية صريحة من الموجّهات مُصَمَّمَة لاختبار فشل المحاذاة:

المكوّن 5: تقييم استجابة بوعي اللهجة

المكوّن 6: معايرة متعدّدة الثقافات

لمشترٍ pan-MENA يحتاج:

مزالق شائعة

المزلق 1: crowd-source بدون معايرة ثقافية

“مؤشّرون عربيو اللسان” بدون معايرة ثقافية صريحة يُنتج تفضيلات غير متّسقة.

المزلق 2: تأشير تفضيل بمؤشّر واحد

للموجّهات المحمّلة ثقافيًا، تسميات مؤشّر واحد تُدْمِج تحيّزات ذلك المؤشّر.

المزلق 3: تجاهل حسّاسية دينية

نماذج تُنتج استجابات غير ملائمة دينيًا تُسَبِّب ضرر علامة تجارية + خسارة عملاء + تعرّض تنظيمي.

المزلق 4: استجابات فصحى مقاس-واحد-يناسب-الجميع

نموذج يستجيب بالفصحى لعملاء متحدّثي لهجة يشعر آليًا.

المزلق 5: لا مجموعة فرعية معاكسة

بدون موجّهات معاكسة صريحة، فشل المحاذاة يظهر فقط في الإنتاج.

المزلق 6: معاملة RLHF كحدث لمرة واحدة

السياق الثقافي + السياسي يتطوّر. نموذج مُحَاذَى في 2024 قد يُنتج استجابات غير ملائمة لأحداث 2026.

أين يندرج Annota8

Annota8 يبني بيانات تفضيل RLHF عربية بجميع المكوّنات الستّة:

ناقش بيانات RLHF عربي → جلسة 30 دقيقة اقرأ حلول نموذج الأساس