كل المقالات

RAG مقابل الضبط الدقيق للعربية: متى يفوز كلٌّ منهما (إطار قرار عملي)

لماذا هذا السؤال أصعب في العربية

في الإنجليزية، النقاش بين RAG والضبط الدقيق يدور غالبًا حول طزاجة البيانات وصيغة المخرَجات. في العربية، تظهر أربعة أبعاد إضافية قبل أن تصل إلى ذلك أصلًا: تغطية اللهجة في النموذج الأساس، التعامل مع السجل بين الفصحى ولغة المجال، معاملة المُجَزِّئ للصرف العربي والتشكيل، والتبديل اللغوي مع الإنجليزية أو الفرنسية في الجملة نفسها. RAG لا يصلح أيًّا من هذه الأمور. هي تعيش داخل أوزان النموذج أو داخل المُجَزِّئ، والطريق الوحيد لتغييرها هو الضبط الدقيق — أو اختيار أساس أفضل.

لذلك، قبل أن تقرّر بين RAG والضبط الدقيق للعربية، عليك الإجابة عن سؤال سابق: هل النموذج الأساس يقوم أصلًا بالعمل اللغوي الذي يحتاجه تطبيقك؟ إن نعم، RAG يكفي. إن لا، فأنت تضبط دقيقًا سواء أردت أم لا.

RAG في فقرة (النسخة التي يحتاجها CTO فعلًا)

الاسترجاع المعزَّز توليديًّا نمط، لا نموذج. تأخذ مدخل المستخدم، تسترجع قطعًا ذات صلة من مجموعة محتوى مستخدمًا التضمينات والمعيد ترتيب، تحقن تلك القطع في الموجِّه، وتترك LLM يؤلّف الجواب مستندًا إلى نصّ مسترجع. أوزان النموذج لا تتغيّر. مجموعة المحتوى خارجية — عادةً قاعدة متجهات مع إستراتيجية تشكيل قِطَع، وخطوة توسيع الاستعلام، وطبقة بحث هجين تجمع الاسترجاع المتباعد + الكثيف.

متى يفوز RAG:

الضبط الدقيق في فقرة

الضبط الدقيق يعني تحديث أوزان النموذج على بيانات مُشرَفة. الخيارات الخفيفة (SFT، مُكَيِّفات LoRA) تحدّث شريحة صغيرة؛ الخيارات الثقيلة (تدريب مسبق متواصل، SFT كامل المعاملات) تحدّث كل شيء. تقنيتا المحاذاة التي تلي SFT هما RLHF وDPO — كلتاهما تشكّلان سلوك النموذج باستخدام بيانات تفضيل بشريّة.

متى يفوز الضبط الدقيق:

معايير قرار خاصّة بالعربية (التي يغفلها النقاش العالمي)

هذا الجزء من الإطار غير موجود في محتوى RAG-مقابل-الضبط-الدقيق الإنجليزي. هذه ما نراه يحسم النتيجة فعلًا في نشريات العربية.

1. ملاءمة اللهجة — مال شديد نحو الضبط الدقيق

إن كان مستخدموك يتحدّثون المصرية أو الخليجية أو الشامية أو المغاربية في الإنتاج، وكان نموذجك الأساس مُدرَّبًا بأغلبية فصحى: اضبط دقيقًا. RAG لا يغيّر كيف يقرأ النموذج المدخل العامي، ولا كيف يولّد ردودًا ملائمة لهجيًّا. تحتاج بيانات SFT مُصَنَّفَة باللهجة، مكتوبة أصليًّا بقلم متحدّثي تلك اللهجة — لا مترجمة. راجع تحليل الشعور للهجة على تويتر مقابل الفصحى لتفهم لماذا تكون مجموعات التقييم المُصَنَّفَة باللهجة مهمّة حتى قبل التدريب.

2. محتوى متوافق مع الشريعة — الاثنان معًا، طبقات

للتمويل الإسلامي، شهادات الحلال، استشارة هيئة شرعية: اضبط الأساس دقيقًا للسجل والصوت وتقاليد الاستشهاد (أيّ علماء، أيّ مذهب، أيّ صيغة سابقة)؛ ثم ضع RAG لإجابات مُسنَدة من النصوص الأصلية. الضبط الدقيق يتولّى الصوت. RAG يتولّى الاستشهاد.

3. التشكيل والتنقيط — تقريبًا دائمًا ضبط دقيق

إن كان تطبيقك يُنتج مخرَجات تشكيل كاملة (محتوى تعليمي، تطبيقات قرآن، توليد شعر فصيح، محتوى أطفال منقَّط): مُجَزِّئك وبياناتك التدريبية يشكّلان هذا، لا موجّهك. RAG لا يستطيع إعادة كتابة قواعد التنقيط داخل النموذج. اضبط دقيقًا بمُجَزِّئ يتعامل مع الحركات، ومجموعة تمثّلها باتساق.

4. تحمّل التبديل اللغوي — ضبط دقيق، ببيانات غنيّة بالتبديل

تبديل عربي-إنجليزي في الخليج، عربي-فرنسي في المغرب، نصّ وسائط اجتماعية مختلَط النصّ. نموذج أساس مُدرَّب على فصحى ويكيبيديا نظيفة سيفشل أمام دور مستخدم واحد يخلط النصوص. الحلّ في بيانات التدريب، لا في الاسترجاع. راجع التبديل اللغوي.

5. بحث عن مصطلحات مجال — RAG قوي

تصنيف داخلي، كتالوج منتجات، سياسات داخلية، وثائق دعم. النموذج لا يحتاج “أن يفهم” التصنيف، يحتاج أن يسترجعه ويستشهد به. RAG مع إستراتيجية تشكيل قِطَع نظيفة وبحث هجين ومعيد ترتيب يتعامل مع الصرف العربي يفوز هنا.

6. بناء مجموعة التقييم — كلاهما يحتاجها، والضبط الدقيق أكثر

لـ RAG: مجموعة منسَّقة من ثلاثيّات سؤال-فقرة-جواب، بأنماط إسناد (هل كان الجواب أمينًا للفقرة المسترجَعة؟) وأنماط جودة استرجاع (هل استُرجعت الفقرة الصحيحة؟). للضبط الدقيق: أزواج SFT، أزواج تفضيل لـ RLHF/DPO، ومجموعة تقييم تطبيقية محتجَزَة. مجموعة التقييم هي ما يخبرك أن الضبط حرّك العقرب فعلًا. راجع بناء مجموعة التقييم.

النمط الهجين — كيف تبدو أغلب نشريات العربية الحقيقية

في كل نشر LLM عربي جدّي رأيته يصل إلى الإنتاج، البنية هجينة. هذا النمط يتكرّر:

  1. اضبط الأساس دقيقًا للعربية، ثم للسجل، ثم للهجة — في هذا الترتيب. كل طبقة تمرير SFT صغير على بيانات خاصّة بها. إن كان أساسك نموذجًا عالميًّا (Claude، GPT-4o، Llama 4) بعربية ضعيفة، فقد تُجري تدريبًا مسبقًا متواصلًا على محتوى عربي منسَّق قبل SFT.
  2. طبّق RLHF أو DPO بأزواج تفضيل معايَرَة ثقافيًّا. مهذَّب مقابل فظّ في السياق السعودي. رسمي مقابل عاميّ في السياق المصري. ملائم دينيًّا مقابل غير ملائم في كل مكان.
  3. ضع RAG فوق ذلك لإجابات مُسنَدة، استشهاد، طزاجة محتوى. النموذج المضبوط يتولّى الصوت واللهجة. RAG يتولّى الحقائق والاستشهاد.
  4. شغّل حلقة LLM-كحَكَم باستمرار في الإنتاج. سجِّل المخرَجات بناءً على الواقعيّة، الأمانة للفقرة المسترجَعة، ملاءمة السجل، صحّة اللهجة. عُد بالإخفاقات إلى دورة SFT أو DPO التالية.

هذه البنية الموجودة داخل أكوام خدمة العملاء، أدوات البحث القانوني، والمنصّات التعليميّة التي تصل إلى الإنتاج في MENA اليوم. RAG-الخالص والضبط-الخالص موجودان أيضًا، لكن في حالات استخدام ضيّقة.

مصفوفة تكلفة وتعقيد

البُعدRAGالضبط الدقيق
تكلفة بدايةمنخفضة (قاعدة متجهات + قِطَع + استرجاع)عالية (حوسبة، بيانات SFT/تفضيل مُؤشَّرة)
زمن أوّل جوابأيامأسابيع إلى أشهر
تكلفة تشغيل مستمرّةأعلى لكل استدعاء (استرجاع + سياق أكبر)أقل لكل استدعاء (استدلال مضغوط)
تكلفة تحديثمنخفضة (دفع فهرس جديد)عالية (إعادة تدريب على بيانات جديدة)
زمن الاستجابةأعلى (رحلة استرجاع + موجّه أكبر)أدنى (مرور واحد)
قابلية تنبّؤ المخرَجاتتعتمد على جودة الاسترجاعأعلى (الأوزان تُرَمِّز النمط)
مسار تدقيققوي (القِطَع المسترجَعة دليل)أضعف (يلزم تسجيل المدخلات/المخرَجات منفصلًا)
نمط الإخفاققطعة خاطئة مسترجَعة، تأليف توليفيمعرفة قديمة، انجراف صيغة، فرط ملاءمة
سقف التعقيدعالٍ جدًّا (تشكيل قِطَع، إعادة ترتيب، توسيع استعلام، بحث هجين، استرجاع متعدّد الخطوات)قابل للتنبّؤ (الخطّ مَعِيار)

الخلاصة التي تخفيها المصفوفة: RAG رخيص في البدء، معقّد في التحسين. الضبط الدقيق مكلف في البداية، منضبط في التشغيل. أغلب الفرق تقلّل من تقدير زمن الهندسة الذي سيلتهمه تحسين RAG بعد مرحلة العرض التوضيحي.

أيّ عمل تأشير يطلبه كلٌّ منهما

هنا يلتقي خيار البنية مباشرةً بعمل التأشير الذي ننفّذه في Annota8.

لـ RAG:

للضبط الدقيق:

كلاهما يستفيد أيضًا من بيانات تقييم LLM-كحَكَم مستمرّة، مع تدقيق بشريّ نقطيّ يُعَيِّر نموذج الحَكَم.

لرؤية أعمق لكيفية بناء بيانات المحاذاة لجمهور العربية، راجع محاذاة نماذج الأساس لجمهور العربية. وللمقايضة الأوسع بين المفتوح والمملوك وكيف تتفاعل مع هذا القرار، راجع مفتوح المصدر مقابل المملوك لنماذج LLM العربية 2026.

إفصاح صادق

تبني Annota8 بيانات تأشير للنمطين معًا. ليس لدينا سبب تجاري لدفعك نحو RAG أو نحو الضبط الدقيق. سبب أن هذا المنشور صادق هو نفس سبب أن الإطار مفيد: اختيار البنية الخطأ يُهدر ميزانية التأشير. إن ضبطت دقيقًا حين كان عليك أن تستخدم RAG، أنفقت ستة أرقام USD على ما كانت قاعدة متجهات لتعالجه. إن استخدمت RAG حين كان عليك أن تضبط دقيقًا، شحنت منتجًا لا يتكلّم لهجة عملائك ولن يصلح تلك الفجوة أبدًا.

إطار القرار أعلاه هو ما نخوض فيه مع مختبرات FM وعملاء المؤسسات في MENA قبل أن نضع نطاق مشروع تأشير. قرار البنية يخصّك؛ تصميم التأشير يتبع منه.

كيف تقرّر لتطبيقك — قائمة فحص

اِمشِ على هذه بالترتيب. أوّل “نعم” يحسم البنية عادةً.

  1. هل تتغيّر مجموعة محتواك أسبوعيًّا أو أسرع، والاستشهاد بالمصدر مطلوب؟ ← RAG أوّلًا.
  2. هل يكتب مستخدموك أساسًا بلهجة لا يتعامل معها نموذجك الأساس أصليًّا؟ ← ضبط دقيق أوّلًا.
  3. هل مخرجاتك مخطّط JSON صارم، استدعاء دالّة، أو استخراج مهيكل؟ ← ضبط دقيق أوّلًا.
  4. هل سجلّ تطبيقك (قانوني، طبي، شرعي، مصرفي) يختلف جوهريًّا عن الفصحى العامة؟ ← اضبط طبقة السجل دقيقًا، ثم ضع RAG.
  5. هل تتحمّل ميزانية زمن الاستجابة لديك رحلة استرجاع؟ ← إن لا، اضبط دقيقًا. إن نعم، RAG في اللعب.
  6. هل لديك بيانات SFT مُؤشَّرة، أم فقط مستندات؟ ← إن فقط مستندات، ابدأ بـ RAG؛ وابنِ بيانات SFT لتمرير ضبط لاحق.
  7. هل نموذجك الأساس مختصّ لغويًّا لمهمّتك (فصحى جيّدة، تغطية لهجة مقبولة، مُجَزِّئ واعٍ بالعربية)؟ ← إن نعم، RAG يصلح. إن لا، اضبط دقيقًا أوّلًا أو غيّر الأساس.

أغلب التطبيقات الحقيقيّة تنتهي بأن تحقّق صناديق متعدّدة — وهذا لماذا النمط الهجين هو نقطة الانتهاء الافتراضيّة لأنظمة LLM العربية الإنتاجيّة.

تحدّث معنا عن تأشير RAG + الضبط الدقيق ← مكالمة 30 دقيقة اقرأ صفحة حلول نماذج الأساس