٢٣ مايو ٢٠٢٦ RAG مقابل الضبط الدقيق العربية

RAG مقابل الضبط الدقيق للعربية: متى يفوز كلٌّ منهما (إطار قرار عملي)

TL;DR

الجواب الصادق: لا أحد يفوز افتراضيًّا. RAG يفوز حين تتغيّر مجموعة المحتوى أسرع من قدرتك على إعادة التدريب، وحين يحتاج المستخدم إجابات مستندة إلى مصدر مع مسار تدقيق، وحين يتقن نموذجك الأساسي اللغة العربية الفصحى (MSA) أصلًا ولديه مُجَزِّئ (tokenizer) واعٍ بالعربية. الضبط الدقيق يفوز حين تعبر انزياح سجل (قانوني، طبي، مصرفي)، أو تتعمّق في لهجة واحدة (نشر إنتاجي مصري أو خليجي)، أو تفرض صيغة مخرَجات مهيكلة كـ JSON، أو تصطدم بميزانية زمن استجابة لا يستطيع RAG الوفاء بها. أغلب نشريات الإنتاج الحقيقية هجينة: نضبط الأساس دقيقًا للسجل واللهجة، ثم نضع RAG لإجابات مُسنَدة، ثم نشغّل حلقة “LLM-كحَكَم” للتقييم المستمر. RAG رخيص في البدء ومعقّد في التحسين. الضبط الدقيق مكلف في البداية ومنضبط في التشغيل. تبني Annota8 بيانات تأشير للنمطين معًا — تشكيل قِطَع + استرجاع + إسناد لـ RAG، وأزواج SFT + تفضيل RLHF + مجموعات تقييم للضبط الدقيق — ونحن محايدون تجاريًّا تجاه اختيار البنية.

لماذا هذا السؤال أصعب في العربية

في الإنجليزية، النقاش بين RAG والضبط الدقيق يدور غالبًا حول طزاجة البيانات وصيغة المخرَجات. في العربية، تظهر أربعة أبعاد إضافية قبل أن تصل إلى ذلك أصلًا: تغطية اللهجة في النموذج الأساس، التعامل مع السجل بين الفصحى ولغة المجال، معاملة المُجَزِّئ للصرف العربي والتشكيل، والتبديل اللغوي مع الإنجليزية أو الفرنسية في الجملة نفسها. RAG لا يصلح أيًّا من هذه الأمور. هي تعيش داخل أوزان النموذج أو داخل المُجَزِّئ، والطريق الوحيد لتغييرها هو الضبط الدقيق — أو اختيار أساس أفضل.

لذلك، قبل أن تقرّر بين RAG والضبط الدقيق للعربية، عليك الإجابة عن سؤال سابق: هل النموذج الأساس يقوم أصلًا بالعمل اللغوي الذي يحتاجه تطبيقك؟ إن نعم، RAG يكفي. إن لا، فأنت تضبط دقيقًا سواء أردت أم لا.

RAG في فقرة (النسخة التي يحتاجها CTO فعلًا)

الاسترجاع المعزَّز توليديًّا نمط، لا نموذج. تأخذ مدخل المستخدم، تسترجع قطعًا ذات صلة من مجموعة محتوى مستخدمًا التضمينات والمعيد ترتيب، تحقن تلك القطع في الموجِّه، وتترك LLM يؤلّف الجواب مستندًا إلى نصّ مسترجع. أوزان النموذج لا تتغيّر. مجموعة المحتوى خارجية — عادةً قاعدة متجهات مع إستراتيجية تشكيل قِطَع، وخطوة توسيع الاستعلام، وطبقة بحث هجين تجمع الاسترجاع المتباعد + الكثيف.

متى يفوز RAG:

مجموعة محتواك تتغيّر أسرع من قدرتك على التدريب. تحديثات تنظيمية، تحديث كتالوج منتجات، تنقيحات أسئلة العملاء الشائعة، تعديلات سياسات داخلية. دفع فهرس متجهات جديد في ساعة أرخص تشغيليًّا من إعادة تدريب نموذج في أسبوع.
المستخدم يحتاج إجابات مُسنَدة بمصدر مع مسار تدقيق. روبوتات استشارة قانونية، مساعدات مرجع طبي، خدمة عملاء يجب أن تستشهد ببند. القِطَع المسترجَعة تصير دليلًا.
نموذجك الأساس مختصّ لغويًّا للمهمّة أصلًا. يتعامل مع الفصحى في سجلّك، خليط لهجاتك سطحي، لا حاجة لمخطط مخرَجات خاص.
بحث عن مصطلحات مجال، لا تفكير في المجال. “ماذا يعني هذا المصطلح في سياستنا الداخلية؟” — RAG.
بداية باردة: لديك مستندات لا أزواج تدريب. RAG يعمل يوم أن يُفهرَس المحتوى. الضبط الدقيق يحتاج بيانات SFT مُؤشَّرة أولًا.

الضبط الدقيق في فقرة

الضبط الدقيق يعني تحديث أوزان النموذج على بيانات مُشرَفة. الخيارات الخفيفة (SFT، مُكَيِّفات LoRA) تحدّث شريحة صغيرة؛ الخيارات الثقيلة (تدريب مسبق متواصل، SFT كامل المعاملات) تحدّث كل شيء. تقنيتا المحاذاة التي تلي SFT هما RLHF وDPO — كلتاهما تشكّلان سلوك النموذج باستخدام بيانات تفضيل بشريّة.

متى يفوز الضبط الدقيق:

انزياح السجل. عربية قانونية، عربية مصرفية، عربية سريرية، عربية تمويل إسلامي متوافق مع الشريعة — لكلٍّ منها أنماط رسمية ومصطلحات وتقاليد بلاغية ينتجها LLM عام بأسلوب متيبّس. RAG لا يصلح السجل لأن النموذج ما زال يكتب بصوته المدرَّب.
ملاءمة لهجة بعمق. إن كنت تنشر وكيل مركز اتصال مصريًّا، أو مساعد تجزئة خليجيًّا، أو تطبيق مستهلك شامي، فعلى نموذجك الأساس أن يفهم وينتج تلك اللهجة أصليًّا. لا قدر من الاسترجاع يفيد إن لم يفهم النموذج اللهجة التي كتب بها المستخدم.
صيغة مخرَجات خاصّة بالمهمّة. التزام بمخطط JSON، موثوقية استدعاء الدوال، استخراج مهيكل، إجابة اختيار من متعدد بنمط اختباري. SFT على أمثلة صحيحة الصيغة يرفع نسبة الالتزام أسرع من هندسة الموجّهات.
إنتاج حسّاس لزمن الاستجابة. RAG يضيف رحلة استرجاع (غالبًا 100-400ms قبل أن يبدأ LLM فك التشفير). الاستدلال أحادي-المرور للنموذج المضبوط أسرع وأكثر قابلية للتنبّؤ.
أنماط موجّهات متكرّرة تصير مكلفة. إن كنت تحقن 3000 رمز سياق نظام في كل استدعاء، فضبط ذلك السياق دقيقًا داخل الأوزان يخفض الكلفة لكل استدعاء بعد استهلاك تكلفة التدريب.

معايير قرار خاصّة بالعربية (التي يغفلها النقاش العالمي)

هذا الجزء من الإطار غير موجود في محتوى RAG-مقابل-الضبط-الدقيق الإنجليزي. هذه ما نراه يحسم النتيجة فعلًا في نشريات العربية.

1. ملاءمة اللهجة — مال شديد نحو الضبط الدقيق

إن كان مستخدموك يتحدّثون المصرية أو الخليجية أو الشامية أو المغاربية في الإنتاج، وكان نموذجك الأساس مُدرَّبًا بأغلبية فصحى: اضبط دقيقًا. RAG لا يغيّر كيف يقرأ النموذج المدخل العامي، ولا كيف يولّد ردودًا ملائمة لهجيًّا. تحتاج بيانات SFT مُصَنَّفَة باللهجة، مكتوبة أصليًّا بقلم متحدّثي تلك اللهجة — لا مترجمة. راجع تحليل الشعور للهجة على تويتر مقابل الفصحى لتفهم لماذا تكون مجموعات التقييم المُصَنَّفَة باللهجة مهمّة حتى قبل التدريب.

2. محتوى متوافق مع الشريعة — الاثنان معًا، طبقات

للتمويل الإسلامي، شهادات الحلال، استشارة هيئة شرعية: اضبط الأساس دقيقًا للسجل والصوت وتقاليد الاستشهاد (أيّ علماء، أيّ مذهب، أيّ صيغة سابقة)؛ ثم ضع RAG لإجابات مُسنَدة من النصوص الأصلية. الضبط الدقيق يتولّى الصوت. RAG يتولّى الاستشهاد.

3. التشكيل والتنقيط — تقريبًا دائمًا ضبط دقيق

إن كان تطبيقك يُنتج مخرَجات تشكيل كاملة (محتوى تعليمي، تطبيقات قرآن، توليد شعر فصيح، محتوى أطفال منقَّط): مُجَزِّئك وبياناتك التدريبية يشكّلان هذا، لا موجّهك. RAG لا يستطيع إعادة كتابة قواعد التنقيط داخل النموذج. اضبط دقيقًا بمُجَزِّئ يتعامل مع الحركات، ومجموعة تمثّلها باتساق.

4. تحمّل التبديل اللغوي — ضبط دقيق، ببيانات غنيّة بالتبديل

تبديل عربي-إنجليزي في الخليج، عربي-فرنسي في المغرب، نصّ وسائط اجتماعية مختلَط النصّ. نموذج أساس مُدرَّب على فصحى ويكيبيديا نظيفة سيفشل أمام دور مستخدم واحد يخلط النصوص. الحلّ في بيانات التدريب، لا في الاسترجاع. راجع التبديل اللغوي.

5. بحث عن مصطلحات مجال — RAG قوي

تصنيف داخلي، كتالوج منتجات، سياسات داخلية، وثائق دعم. النموذج لا يحتاج “أن يفهم” التصنيف، يحتاج أن يسترجعه ويستشهد به. RAG مع إستراتيجية تشكيل قِطَع نظيفة وبحث هجين ومعيد ترتيب يتعامل مع الصرف العربي يفوز هنا.

6. بناء مجموعة التقييم — كلاهما يحتاجها، والضبط الدقيق أكثر

لـ RAG: مجموعة منسَّقة من ثلاثيّات سؤال-فقرة-جواب، بأنماط إسناد (هل كان الجواب أمينًا للفقرة المسترجَعة؟) وأنماط جودة استرجاع (هل استُرجعت الفقرة الصحيحة؟). للضبط الدقيق: أزواج SFT، أزواج تفضيل لـ RLHF/DPO، ومجموعة تقييم تطبيقية محتجَزَة. مجموعة التقييم هي ما يخبرك أن الضبط حرّك العقرب فعلًا. راجع بناء مجموعة التقييم.

النمط الهجين — كيف تبدو أغلب نشريات العربية الحقيقية

في كل نشر LLM عربي جدّي رأيته يصل إلى الإنتاج، البنية هجينة. هذا النمط يتكرّر:

اضبط الأساس دقيقًا للعربية، ثم للسجل، ثم للهجة — في هذا الترتيب. كل طبقة تمرير SFT صغير على بيانات خاصّة بها. إن كان أساسك نموذجًا عالميًّا (Claude، GPT-4o، Llama 4) بعربية ضعيفة، فقد تُجري تدريبًا مسبقًا متواصلًا على محتوى عربي منسَّق قبل SFT.
طبّق RLHF أو DPO بأزواج تفضيل معايَرَة ثقافيًّا. مهذَّب مقابل فظّ في السياق السعودي. رسمي مقابل عاميّ في السياق المصري. ملائم دينيًّا مقابل غير ملائم في كل مكان.
ضع RAG فوق ذلك لإجابات مُسنَدة، استشهاد، طزاجة محتوى. النموذج المضبوط يتولّى الصوت واللهجة. RAG يتولّى الحقائق والاستشهاد.
شغّل حلقة LLM-كحَكَم باستمرار في الإنتاج. سجِّل المخرَجات بناءً على الواقعيّة، الأمانة للفقرة المسترجَعة، ملاءمة السجل، صحّة اللهجة. عُد بالإخفاقات إلى دورة SFT أو DPO التالية.

هذه البنية الموجودة داخل أكوام خدمة العملاء، أدوات البحث القانوني، والمنصّات التعليميّة التي تصل إلى الإنتاج في MENA اليوم. RAG-الخالص والضبط-الخالص موجودان أيضًا، لكن في حالات استخدام ضيّقة.

مصفوفة تكلفة وتعقيد

البُعد	RAG	الضبط الدقيق
تكلفة بداية	منخفضة (قاعدة متجهات + قِطَع + استرجاع)	عالية (حوسبة، بيانات SFT/تفضيل مُؤشَّرة)
زمن أوّل جواب	أيام	أسابيع إلى أشهر
تكلفة تشغيل مستمرّة	أعلى لكل استدعاء (استرجاع + سياق أكبر)	أقل لكل استدعاء (استدلال مضغوط)
تكلفة تحديث	منخفضة (دفع فهرس جديد)	عالية (إعادة تدريب على بيانات جديدة)
زمن الاستجابة	أعلى (رحلة استرجاع + موجّه أكبر)	أدنى (مرور واحد)
قابلية تنبّؤ المخرَجات	تعتمد على جودة الاسترجاع	أعلى (الأوزان تُرَمِّز النمط)
مسار تدقيق	قوي (القِطَع المسترجَعة دليل)	أضعف (يلزم تسجيل المدخلات/المخرَجات منفصلًا)
نمط الإخفاق	قطعة خاطئة مسترجَعة، تأليف توليفي	معرفة قديمة، انجراف صيغة، فرط ملاءمة
سقف التعقيد	عالٍ جدًّا (تشكيل قِطَع، إعادة ترتيب، توسيع استعلام، بحث هجين، استرجاع متعدّد الخطوات)	قابل للتنبّؤ (الخطّ مَعِيار)

الخلاصة التي تخفيها المصفوفة: RAG رخيص في البدء، معقّد في التحسين. الضبط الدقيق مكلف في البداية، منضبط في التشغيل. أغلب الفرق تقلّل من تقدير زمن الهندسة الذي سيلتهمه تحسين RAG بعد مرحلة العرض التوضيحي.

أيّ عمل تأشير يطلبه كلٌّ منهما

هنا يلتقي خيار البنية مباشرةً بعمل التأشير الذي ننفّذه في Annota8.

لـ RAG:

أنماط جودة قطعة (هل القطعة وحدة دلالية مكتفيّة بذاتها؟).
أنماط تقييم استرجاع (للسؤال س، هل استُرجعت الفقرة ف؟ هل كانت الأفضل؟ هل كان الترتيب صحيحًا؟).
أنماط إسناد (هل استخدم النموذج الفقرة المسترجَعة بأمانة؟ أم ألّف؟).
أنماط إعادة صياغة استعلام (هل كان الاستعلام المُعاد كتابته أفضل من الأصلي؟).
مجموعات تقييم بثلاثيّات س-ج-فقرة لقياس الاسترجاع + التوليد معًا.

للضبط الدقيق:

أزواج SFT مكتوبة أصليًّا بأيدي لغويّين عرب مُدرَّبين على المجال (قانوني، طبي، مالي، لهجي — حسب الطبقة).
أزواج تفضيل لـ RLHF أو DPO — أزواج مخرَجات نموذج مرتَّبة بشريًّا من حيث الأدب، الواقعيّة، ملاءمة السجل، صحّة اللهجة، الملاءمة الدينيّة.
مجموعات تقييم مُصَنَّفَة باللهجة بأهداف تغطية صريحة.
بيانات خصمٍ / red-team لمقاومة الإفلات في العربية — راجع لِم هذا فجوة بحثيّة في تشخيص فشل LLM العربي تجاريًّا.

كلاهما يستفيد أيضًا من بيانات تقييم LLM-كحَكَم مستمرّة، مع تدقيق بشريّ نقطيّ يُعَيِّر نموذج الحَكَم.

لرؤية أعمق لكيفية بناء بيانات المحاذاة لجمهور العربية، راجع محاذاة نماذج الأساس لجمهور العربية. وللمقايضة الأوسع بين المفتوح والمملوك وكيف تتفاعل مع هذا القرار، راجع مفتوح المصدر مقابل المملوك لنماذج LLM العربية 2026.

إفصاح صادق

تبني Annota8 بيانات تأشير للنمطين معًا. ليس لدينا سبب تجاري لدفعك نحو RAG أو نحو الضبط الدقيق. سبب أن هذا المنشور صادق هو نفس سبب أن الإطار مفيد: اختيار البنية الخطأ يُهدر ميزانية التأشير. إن ضبطت دقيقًا حين كان عليك أن تستخدم RAG، أنفقت ستة أرقام USD على ما كانت قاعدة متجهات لتعالجه. إن استخدمت RAG حين كان عليك أن تضبط دقيقًا، شحنت منتجًا لا يتكلّم لهجة عملائك ولن يصلح تلك الفجوة أبدًا.

إطار القرار أعلاه هو ما نخوض فيه مع مختبرات FM وعملاء المؤسسات في MENA قبل أن نضع نطاق مشروع تأشير. قرار البنية يخصّك؛ تصميم التأشير يتبع منه.

كيف تقرّر لتطبيقك — قائمة فحص

اِمشِ على هذه بالترتيب. أوّل “نعم” يحسم البنية عادةً.

هل تتغيّر مجموعة محتواك أسبوعيًّا أو أسرع، والاستشهاد بالمصدر مطلوب؟ ← RAG أوّلًا.
هل يكتب مستخدموك أساسًا بلهجة لا يتعامل معها نموذجك الأساس أصليًّا؟ ← ضبط دقيق أوّلًا.
هل مخرجاتك مخطّط JSON صارم، استدعاء دالّة، أو استخراج مهيكل؟ ← ضبط دقيق أوّلًا.
هل سجلّ تطبيقك (قانوني، طبي، شرعي، مصرفي) يختلف جوهريًّا عن الفصحى العامة؟ ← اضبط طبقة السجل دقيقًا، ثم ضع RAG.
هل تتحمّل ميزانية زمن الاستجابة لديك رحلة استرجاع؟ ← إن لا، اضبط دقيقًا. إن نعم، RAG في اللعب.
هل لديك بيانات SFT مُؤشَّرة، أم فقط مستندات؟ ← إن فقط مستندات، ابدأ بـ RAG؛ وابنِ بيانات SFT لتمرير ضبط لاحق.
هل نموذجك الأساس مختصّ لغويًّا لمهمّتك (فصحى جيّدة، تغطية لهجة مقبولة، مُجَزِّئ واعٍ بالعربية)؟ ← إن نعم، RAG يصلح. إن لا، اضبط دقيقًا أوّلًا أو غيّر الأساس.

أغلب التطبيقات الحقيقيّة تنتهي بأن تحقّق صناديق متعدّدة — وهذا لماذا النمط الهجين هو نقطة الانتهاء الافتراضيّة لأنظمة LLM العربية الإنتاجيّة.

تحدّث معنا عن تأشير RAG + الضبط الدقيق ← مكالمة 30 دقيقة اقرأ صفحة حلول نماذج الأساس

القيود وإخلاء المسؤوليّة

قيود هذا التحليل. يَعكِس هذا المقال قراءة Annota8 للأدلّة المتاحة علنًا حتّى تاريخ آخر تعديل له. مواقع المورّدين، الأطر التنظيميّة، أرقام المقاييس ونطاق البرامج يمكن أن تتغيّر دون إشعار. حيث تُذكر نطاقات عدديّة، تلك الأرقام قابلة للتحقّق من المصدر المرتبط في قسم المراجع داخل المقال — لم تُعِد Annota8 إجراء المقاييس بنفسها ما لم يُذكر ذلك صراحةً في المقال.

الموقف القانوني والخصوصيّة. Annota8 شركة عمليّات بيانات ذكاء اصطناعي في مرحلة مبكّرة في إطلاق ناعم. لا نَملِك حاليًّا شهادة SOC 2، أو ISO 27001، أو شهادة PDPL، أو أيّ شهادة أمن أو خصوصيّة من طرف ثالث. نُصمِّم وَفقًا لمبادئ PDPL ونَقدِر على توقيع DPA مَبنيّة على نموذج SCC الأوروبي. الموقف التوافقي المحدّد لارتباطك متاح عند الطلب من [email protected].

لا شيء في هذا المقال يُمثِّل استشارة قانونيّة أو ضريبيّة أو استثماريّة. الاستشهادات التنظيميّة يجب التحقّق منها مع مستشار قانوني في ولايتك القضائيّة. أسماء المورّدين المذكورة في هذا المقال مرجَّعة كسياق مشهد صناعي فحسب — Annota8 لا تَدَّعِي ادّعاءً تنافسيًّا للمنتج، ولا علاقة عملاء، ولا أيّ ارتباط آخر مع أيّ من المنصّات المذكورة، ما لم يُذكر ذلك صراحةً.

تواصَل مع الفريق:[email protected] · annota8.ai