كل المقالات

محاكاة المركبات ذاتية القيادة في الطرق السعودية: عواصف الرمل وسيناريوهات الحج

لماذا أَكتُب هذا الآن

قَضَيت السنة الماضية في حوارات متَعَدِّدَة مع فِرَق المركبات ذاتية القيادة العاملة على المشاريع السعوديّة الكُبرى — NEOM وTHE LINE تَحديدًا، إضافة إلى برامج التنقّل في Diriyah Gate وعدد من تَطبيقات النقل العام في الرياض. الشكوى المتكرّرة: “نَستَخدِم CARLA أو NVIDIA DRIVE Sim أو Applied Intuition، لكنّ السيناريوهات الجاهزة لا تَعكِس ما نَراه فعلًا على الأرض.” والإجابة لم تكن دائمًا واضحة، لأنّ المحاكيات نفسها قويّة جدًا — لكنّ مكتباتها الجاهزة مَبنيّة على بيانات سان فرانسيسكو وميونيخ وستوكهولم.

التَحَدّي السعودي مختلف ليس بشكل تَجميلي، بل بشكل فيزيائي وإحصائي. أَجواء قاسيّة على المُستَشعِرات، كثافات بشريّة لا تُرى في أيّ دولة OECD، إشاريّات طَريق ثُنائيّة الكتابة، ولباس تَقليدي يَخلِق مشكلات تَجزِئَة (segmentation) لم تَتَدَرَّب عليها النماذج الأساسيّة.

هذا المنشور خريطة لِما يَنقُص، ولما يَحتاجه كلّ سيناريو من تأليف + تأشير. ليست هذه إعلانًا عن منتج Annota8 — بل قراءة عمليّة للمشهد التي سأَستَخدِمها أنا لو كنت أَقود برنامج AV في NEOM اليوم.

السيناريو الأوّل: عواصف الرمل — التَحَدّي الفيزيائي على المُستَشعِرات

عاصفة الرمل ليست مجرّد “مَطَر بلون مُختَلِف”. إنّها بيئة فيزيائيّة تُؤَثِّر على كلّ مُستَشعِر بطريقة مختلفة:

LiDAR. جسيمات الغبار في الهواء تَمتَصّ وتَنشُر الأشعّة في الطول الموجي 905nm و1550nm. النتيجة: تَوهين شديد للمدى الفعلي، وعَوائد مَزيَّفَة من الجسيمات نفسها (false returns). نموذج AV مُدَرَّب على LiDAR صافٍ سيَرى “أجسامًا” حيث لا أجسام، أو سيَفقِد سيّارة على بُعد 50 مترًا تَظهَر بوضوح في كاميرا الإنسان.

الكاميرا. تَراكُم الغبار التَدريجي على العدسة على مدى ساعات. هذا ليس حَدثًا فَوريًا، بل تَدَهوُر مُستَمِرّ. النموذج يَحتاج أن يَتَعَرَّف على أنّ “صور هذه الكاميرا تَزداد ضبابيّة” وأن يُقَلِّل ثقته فيها تَدريجيًا.

Radar. الأقلّ تأثُّرًا، لكنّ كثافة الجسيمات الشديدة قد تَكشِف عَوائد طُيُوف.

GPS. الجسيمات لا تُؤَثِّر مباشرة، لكنّ العواصف الرمليّة الكبيرة في المنطقة الشرقيّة والربع الخالي مَصحوبة بظواهر اضطراب أيونوسفيري تُزيد انجراف GPS بشكل مُلاحَظ. نَموذج التموضع الذي يَعتَمِد على GPS-only يَخسَر دقّته أمتارًا.

ما يَحتاجه هذا السيناريو من تأليف محاكاة. CARLA لديه نظام طقس محدود — يَدعَم المطر والضباب لكنّ “عاصفة الرمل” ليست بدائيّة في المحاكي. تَحتاج إلى ملحقات تَفصيل خصائص التَشَتُّت الضوئي + تَوهين LiDAR + نموذج تَراكُم الغبار على الكاميرا كدالّة زمنيّة. NVIDIA DRIVE Sim أفضل في تمثيل الجسيمات الجَوّيّة، لكنّ معلمات العاصفة الرمليّة الإقليميّة تَحتاج معايرة بقياسات ميدانيّة.

ما يَحتاجه من تأشير على بيانات حقيقيّة. صور وسحب نقاط LiDAR من عواصف فعليّة، مع علامات: (1) شدّة العاصفة المُقَدَّرَة بصريًا، (2) مدى كاميرا فعلي، (3) جودة عَوائد LiDAR، (4) أجسام مَرئيّة فعلًا للإنسان لكنّها مفقودة في المُستَشعِرات. هذه طبقة تأشير تَأسيسيّة — لا توجد في مكتبات COCO أو nuScenes أو Waymo Open.

السيناريو الثاني: كثافات الحجّ — تَفاعُل المُشاة مع المرور

موسم الحجّ يَخلِق ظاهرة لا توجد في أيّ مدينة OECD: مناطق تَصِل فيها كثافة المُشاة إلى 6-9 أشخاص/م² في ساعات الذروة، مع تَدفّق مَركَبات مَستَمِرّ على الحوافّ. أيّ نَموذج تَنبُّؤ حركة مَبني على بيانات سان فرانسيسكو سيَفشَل هنا — نَماذج التَدَفّق الذي يَفتَرِض “مُشاة عند الإشارة، طريق فارغ من المُشاة في الكتلة” غير مَوجود.

التَحَدّي النموذجي: كاشفات الأجسام التي تَتَعامَل مع المُشاة كحالات مَعزولة (single-pedestrian bounding boxes) تَنهار. الحاجة هي إلى نَماذج كثافة (density-based models) تَتَعامَل مع البَشَر كحقل مُستَمِرّ، مع تَتَبُّع تَدفّقات تجمّعات (group-level tracking)، وتَنبُّؤ بسلوك تَجَمُّع لا بسلوك فرد.

التَحَدّي السلوكي: السلوك المتوقّع للمُشاة في تَجَمُّع الحجّ يَختَلِف نوعيًا عن المُشاة الفرديّين. النمَط هو حركة جماعيّة بطيئة، تَوقّفات مُفاجِئَة لمجموعات بأكمَلِها، خطوط مَسير غير مَحَدَّدَة، وتَفاعُل قَرار جماعي مع المركبات. نَماذج Social Force تَحتاج إعادة معايرة جذريّة.

ما يَحتاجه هذا السيناريو من تأليف محاكاة. Applied Intuition قويّ في تأليف سيناريوهات تَفاعُل، لكن مَكتبته الافتراضيّة تَتَوَقَّف عند ~50 مُشاة في المشهد. الحاجة هي إلى تَوسيع المحاكي ليَدعَم آلاف الأشخاص في الإطار، مع نَماذج سلوكيّة جماعيّة تَحاكي حركة الحشد الفعليّة. هذا عمل هندسي ثَقيل — لا يَحدُث من خلال إعدادات GUI.

ما يَحتاجه من تأشير على بيانات حقيقيّة. لقطات فيديو ميدانيّة من مناطق المشاعر المقدّسة + المطاف + مسارات الحافلات في موسم الحجّ. التأشير اللازم: (1) كثافة مُقَدَّرَة بمنطقة من المشهد، (2) تَجزئَة أَفراد عند الحوافّ والكاشفات (حيث الكثافة قابلة للتأشير الفردي)، (3) تَتَبُّع تَدفّقات تَجَمُّعات، (4) أحداث “تَوقّف جماعي” و”تَحَرُّك جماعي”. هذا تأشير مُتَخَصِّص يَحتاج فِرَق مُدَرَّبَة على الكثافات العالية.

ملاحظة: السلطات السعوديّة حسّاسة جدًا لتَصوير المشاعر المقدّسة. أيّ برنامج تأشير لهذا السيناريو يَحتاج إذنًا واضحًا، وغالبًا يُفَضَّل العمل على بيانات الحافلات والمسارات الخارجيّة بدل التَّصوير المُباشر داخل المطاف.

السيناريو الثالث: اللافتات ثُنائيّة الكتابة

الطرق السريعة في السعوديّة تَعرِض اللافتات بالعربيّة والإنجليزيّة معًا — وهذا واضح. الأقلّ وُضوحًا هو أنّ الأرقام نفسها تَظهَر أحيانًا بالشكل العربي (الهندي) ١٢٣٤٥ وأحيانًا بالشكل اللاتيني 12345 — على نفس اللوحة أحيانًا. ولوحات السرعة تَختَلِف باختلاف عُمر الطريق.

التَحَدّي: نَماذج OCR للمَشاهد الطبيعيّة (scene text recognition) المُدَرَّبَة على ICDAR وCOCO-Text تَكاد تَكون كلّها مَركَّزَة على النصّ اللاتيني. الإصدارات العربيّة تَنقُصها تَنَوُّع الخطوط الفعليّة على الطرق السعوديّة، وتَنقُصها معالجة الأرقام الهنديّة. السيارة التي تُسيء قراءة “حدّ السرعة ١٢٠” يَنتُج عنها قَرار قيادة خاطئ.

التَحَدّي الإضافي: لافتات NEOM وTHE HEART OF NEOM وTHE LINE تَستَخدِم خطوطًا مُخَصَّصَة لم يَرَها أيّ نموذج تَجاري. هذه نوعيّة الإشاريّات التي ستَزداد عَدديًا في السنوات الخمس القادمة.

ما يَحتاجه هذا السيناريو من تأليف محاكاة. CARLA يَدعَم استبدال أصول اللافتات لكنّه يَفتَرِض نصًا لاتينيًا. الحاجة إلى مكتبة أصول لافتات سعوديّة مَوثوقَة — تَشمَل اللافتات الرسميّة من وزارة النقل + لافتات المدن الجديدة + لافتات الطرق التَجاريّة. وهذه يَجِب أن تَتَضَمَّن متغيّرات إضاءة، تَدَهوُر، تَلَوُّن.

ما يَحتاجه من تأشير على بيانات حقيقيّة. لقطات قيادة فعليّة على طرق الرياض-جدّة-الدمّام-تبوك، مع تأشير: (1) إطار إحاطة لكلّ لافتة، (2) نَصّ العربيّة المُحَوَّل، (3) نَصّ الإنجليزيّة المُحَوَّل، (4) شكل الأرقام (هندي/لاتيني)، (5) نوع اللافتة (سرعة/توجيه/تحذير/خدميّة). هذا يَتَطَلَّب مُؤَشِّرين عرب مَهَرَة لُغويًا.

السيناريو الرابع: الظِلّ التقليدي — تَحَدّي كشف المُشاة

نَماذج تَجزِئَة المُشاة (pedestrian segmentation) الأساسيّة في YOLO + Mask R-CNN + ما يَتبَعها من تَطَوُّرات مُدَرَّبَة على صور غالبيّتها مُشاة بلباس غربي — بناطيل، تَنّورات قَصيرة، مَعاطف. الظِلّ المُجَمَّع للنموذج “هذا إنسان” يَتَوَقَّع رَأسًا فوق جذع فوق ساقَين مَفصولتَين قابلتَين للتَمييز.

الثوب السعودي الأبيض الطَويل يَخلِق ظِلًّا عَموديًا مُستَمِرًّا. الساقان غير مَفصولتَين بصريًا. لون أبيض على خلفيّة فاتحة في الظهر شِبه مَنعَدِم التَبايُن. العباءة السوداء عند المرأة تَخلِق ظِلًّا أَسوَد كَتلَويًا، خاصّة في صور ليليّة أو في مَناطق ذات إضاءة ضعيفة. مَناطق الرأس مَغطّاة، مَلامح الوجه غير مَرئيّة لكاشفات الوجه.

التَحَدّي القياسي: نَماذج الكشف يَنخَفِض أداؤها بنسبة قابلة للقياس على هذه الظِلّيّات. لا يَعني هذا فَشَلًا كامِلًا — بل ثقة أَدنى، إطارات إحاطة أقلّ دقّة، وتَأخّر في التَعَرُّف على المُشاة. للقيادة الذاتيّة هذا فَرق بين قَرار آمن وقَرار خاطئ.

ما يَحتاجه هذا السيناريو من تأليف محاكاة. أَصول مُشاة بالثوب والعباءة في كلّ من CARLA وNVIDIA DRIVE Sim. هذه ليست متَوَفِّرَة بشكل افتراضي. الحاجة إلى مكتبة شخصيّات تَتَضَمَّن تَنَوُّع الألوان (ثوب أبيض، أزرق فاتح، رمادي)، تَنَوُّع طَول العباءة، وضع غُطاء الرأس، تَنَوُّع الأَعمار.

ما يَحتاجه من تأشير على بيانات حقيقيّة. صور قيادة من شَوارع الرياض وجدّة والخُبَر، مع: (1) تأشير دقيق لكلّ مُشاة باللباس التَقليدي، (2) ملاحظة شُروط الإضاءة (نَهار/ليل/أضواء شارع)، (3) تَبايُن الخلفيّة (المُشاة بثوب أبيض أمام جدار أبيض حالة حَرِجَة)، (4) وَضعيّات نَموذجيّة (السير، الوقوف، التَجَمُّع).

السيناريو الخامس: الإيجابيّات الكاذبة من النخيل والصحراء

النَخلَة لها هَيكَل عَمودي + كُتلَة وَرَقيّة ذات تَبايُن داكن. كاشفات الأجسام تُسيء كثيرًا تَصنيفها — أحيانًا كأَعمدة إنارة، أحيانًا كأشخاص بَعيدين، أحيانًا كأجسام غير مَعروفة. عَلى طريق سَريع تَكتَنِفه أَشجار النخيل من الجانبَين، يَصبَح هذا مَشكلة سلامة.

خلفيّة الصحراء الرمليّة تَفتَقِر إلى السمات البصريّة (low texture). هذا يُربِك خوارزميّات تَدَفّق بصري (optical flow) المُستَخدَمَة في تَقدير الحَركة الذاتيّة (ego-motion estimation). والظِلال طَويلة وحادّة في ساعات الصباح والمساء، تَخلُق “أجسامًا” زائفة على الأرض.

ما يَحتاجه هذا السيناريو من تأليف محاكاة. مكتبة أصول نباتيّة إقليميّة — نخيل بأَعمار وأَنواع مُختَلِفَة، أَثَل، شُجَيرات صحراويّة. ومَناطق صحراويّة مُحَدَّدَة الإضاءة بأَوقات اليَوم — هذا يَختَلِف عن صحراء نيفادا فيزيائيًا في زاوية الشمس وكثافة الغبار الجوّي.

ما يَحتاجه من تأشير على بيانات حقيقيّة. لقطات من طريق الرياض-الدمّام ومن أَطراف مَكّة في ساعات الفَجر والغُروب، مع تأشير دقيق لكلّ شَجَرة نَخل وكلّ كُتلَة ظِلّيّة على الأرض. الفائدة المباشرة: تَدريب الكاشفات على رَفض هذه الأنماط كأجسام مَتحَرِّكَة.

ربط مع برامج التنقّل السعوديّة

NEOM وTHE LINE تَستَهدِفان أن تَكونا أوّل مدينتَين قائمتَين على نَموذج التنقّل التلقائي بالكامل. Diriyah Gate تَدمُج عناصر AV في برنامج تَنقّل تاريخي ثَقافي. كلّ من هذه المشاريع سيَواجه السيناريوهات الخمسة أعلاه بدرجات مُتَفاوِتَة — NEOM أكثر تَعَرُّضًا لِظَواهر الصحراء (السيناريو الخامس) ولِعَواصف الرمل القاسيّة (السيناريو الأوّل)، بينما الرياض وجدّة تَتَعامَلان مع كَثافة بشريّة عالية في موسم الحجّ والعمرة (السيناريو الثاني) واللافتات الإشاريّة (السيناريو الثالث) واللباس التقليدي (السيناريو الرابع).

النَموذج المُدَرَّب على بيانات أمريكا الشمالية + مَكتبة سيناريوهات CARLA الافتراضيّة لن يَكون آمنًا في هذه البيئات. ليس لأنّ النَموذج “سيّء”، بل لأنّ التوزيع الإحصائي (statistical distribution) للبيانات التَدريبيّة لا يَشمَل هذه الحالات. وهذا فَرق نَوعي.

ماذا يَفعَل فريق AV عَمَليًا

لو كنت أَقود برنامج AV في NEOM أو في وزارة النقل السعوديّة اليَوم، الترتيب الذي سأَتَّبِعه:

  1. حصر السيناريوهات الإقليميّة في عَدد قابل للإدارة. الخمسة أعلاه ليسَت قائمة شاملة، لكنّها نُقطَة بداية. أَضِف سيناريوهات الطرق الجبليّة في عَسير وأَجواء الرطوبة العالية على ساحل البحر الأَحمر، وتَكون لديك تَغطية أَوسَع.

  2. بَدء جَمع بيانات ميدانيّة موجّهة. لكلّ سيناريو، ساعات قيادة مَخطَّط لها لجَمع بيانات الحالات الحَرِجَة. هذا أَهَمّ من شراء بيانات تَجاريّة جاهزة — لأنّ البيانات الإقليميّة قليلة الجَودة في السوق التَجاري.

  3. تأشير عَميق وليس تأشيرًا رَخيصًا. أَخطر قَرار في هذه المرحلة هو الذَّهاب إلى مُزَوِّد تأشير عام، أَجنبي، يُؤَشِّر الصور بأَيدي مُؤَشِّرين لم يَرَوا المنطقة. النتيجة: تَأشيرات سَطحيّة، حالات حرِجَة مُفَوَّتَة، وبَيانات تَدريب تَزيد المشكلة بدلًا من حَلّها.

  4. تأليف سيناريوهات محاكاة موازي للبيانات الحقيقيّة. المحاكاة وحدها لا تَكفي، البيانات الحقيقيّة وحدها لا تَكفي. اللازم: تَوليف. سيناريوهات محاكاة مُعايَرَة بالبيانات الحقيقيّة، ثم اختبار النموذج على بيانات حقيقيّة مَحفوظة (held-out).

  5. حلقة تَحَقّق مَفتوحة مع المُنَظِّم. برامج AV في المملكة تَخضَع لإشراف هيئة النقل + CST في جوانب الاتصالات. التواصل المُبَكِّر — قبل سَنَتَين من النَشر — يُجَنِّب مَفاجآت تَنظيميّة.

الفجوة الحقيقيّة

ليست الفجوة في القدرات التقنيّة. CARLA + NVIDIA DRIVE Sim + Applied Intuition أَدوات قويّة. الفجوة في البيانات ومكتبات الأصول الإقليميّة، وفي وُجود فِرَق تَأشير قادرة لُغويًا وثَقافيًا على فَهم ما يَنبَغي تأشيره. هذه فَجوة قابلة للسَدّ، لكنّها تَتَطَلَّب اعتراف الفريق أنّ “السيناريوهات الجاهزة” ليست كافيّة.

من جانب Annota8، نَعمَل اليَوم على تأشير حالات استخدام AV إقليميّة لعدد من الفِرَق — لا نَكشِف عن الأَسماء، لكنّ المنهجيّة قابلة للنَقل. ولو كنت تُريد محادَثَة عَمَليّة حول سيناريو مُعَيَّن من السيناريوهات الخَمسَة أعلاه، تَواصَل مَعنا.

ربط مع بقيّة المنظومة

كَلِمة أَخيرة: المركبات ذاتيّة القيادة ستَصِل إلى الطرق السعوديّة. السؤال ليس “متى” بل “بأيّ بَيانات تَدرَّبَت قبل أن تَصِل”. الفِرَق التي تَستَثمِر اليَوم في بَيانات إقليميّة عَميقة ستَصِل بنماذج آمنة. الذين يَفتَرِضون أنّ بَيانات Waymo Open مَكانها كافٍ سيَكتَشِفون الفَرق في أَوّل عاصفة رَمليّة.

تحدّث إلى فريق AV لدينا اقرأ منهجيّة تأليف السيناريوهات

Annota8 في مرحلة مبكرة من التشغيل ولا تحمل شهادات اعتماد رسمية في الامتثال. التصريحات حول النهج التنظيمي تعكس النية التصميمية الداخلية لا الحالة المعتمدة. استعن بمستشار قانوني محلي مؤهل لأي مسعى تجاري نشط.


المصادر، الحدود، وإخلاء المسؤولية

هذا المقال تعليق تحريري من فريق Annota8 مبني على مصادر عامة كانت متاحة وقت الكتابة. تم التحقق من الوقائع المحدّدة (التنظيمات، الأسعار، إصدارات النماذج، أسماء الجهات، أحجام السوق، الإعلانات) مقابل المصدر الأصلي للجهة المنظِّمة أو إعلان المورّد أو البيان الصحفي الرسمي أو الورقة المُحكَّمة عند الإمكان. المصادر العامة تتغيّر باستمرار — تتعدّل الأنظمة، وتتغيّر الأسعار، وتغيّر الشركات اسمها التجاري أو توجّهها، وتتجاوز إصدارات النماذج بعضها بعضًا — ولهذا:

أرسل التصحيحات أو روابط المصادر أو الاعتراضات على الوقائع إلى [email protected] — التصحيحات تُطبَّق فورًا.