ما الذي ستشتريه HUMAIN في 2026: قراءة عملية للمخصّصات
لماذا هذا التحليل، ومن أين يَأتي
HUMAIN أُعلِنَ عنها رسميًا في مايو 2025 كشركة ذكاء اصطناعي مَملوكَة بالكامل لصندوق الاستثمارات العامّة (PIF) السعودي. خلال السنة الأولى، أصدرت سلسلة إعلانات شراكة تَستَحِقّ القراءة الحرفيّة: Nvidia لإمداد الرقائق، AMD وCerebras كموردين تكميليّين، Cisco للبنية التحتية للشبكات، وتطوير ALLaM v2 كنموذج لغوي عربي أساسي. مَملَكَتُها الميدانية تَشمَل سحابة سيادية، مراكز بيانات داخل المملكة، وفِرق بحث ذكاء اصطناعي مُوَزَّعَة بين الرياض ومراكز عالمية.
السؤال الذي يَطرَحه كلّ بائع تأشير إقليمي اليوم: “أين أَدخُل؟” والإجابة الصادقة تَتَطَلَّب التمييز بين ثلاث شرائح إنفاق مختلفة جذريًا. هذا المنشور يَفصِل بينها — من الخارج للداخل، مبنيًّا على إعلانات عامّة وحوارات تنفيذية منشورة فقط. لست داخل دورة المشتريات. Annota8 ليست بائعًا مُعتَمَدًا لـ HUMAIN. أَكتُب هذا لأنّ قراءة عمليّة بنزاهة أنفع لقارئ يَبحَث عن خريطة من ادّعاء بِمَعرِفَة لا أَملِكها.
شرائح إنفاق HUMAIN الثلاث
| الشريحة | حجم تقديري 2026-2027 | مَن يَأخُذها | هل يَدخُل بائع تأشير إقليمي؟ |
|---|---|---|---|
| بناء مراكز بيانات + رقائق + بنية تحتية | عشرات المليارات USD متعدّدة السنوات | Nvidia، AMD، Cerebras، Cisco، مقاولو إنشاء سعوديّون | لا — هذه ليست لعبتنا |
| بيانات تدريب + تنسيق لـ ALLaM v2/v3 | منتصف إلى أعلى 8 خانات USD سنويًا | مزوّدو بيانات + تأشير + تنسيق | نعم، شريحة قابلة للوصول |
| تقييم سلامة + الفِرَق الحمراء + تأشير سلوك | منتصف 8 خانات إلى منخفض 9 خانات USD على ~24 شهرًا | بيوت تقييم متخصّصة + خبراء سلامة + مؤلّفو تنبيهات | نعم، شريحة عالية القيمة |
| شراكات نشر مؤسّسي للذكاء الاصطناعي | OpEx مُوَزَّع، CapEx منخفض | مُدمِجو نظم + شركاء تحوّل رقمي | جزئيًّا — كشريك تأشير، ليس كمُدمِج |
| توظيف باحثين + بنية بحثية | عشرات الملايين USD سنويًا | مواهب بحث NLP عربي + شركاء أكاديميون | لا — هذه بنية داخلية |
هذه أرقام تقديرية مبنيّة على نسب صناعية مَعقُولة لشركة بهذا الطموح، وليست إفصاحًا. خَطؤها على الجانب الحذر؛ احتمال أن تكون الأعداد الفعلية أكبر يَفُوق احتمال أن تكون أصغر.
شريحة 1: بناء مراكز البيانات والرقائق — ليست لعبتنا
الإنفاق الأكبر بفارق ضخم سيَذهب إلى البنية التحتية للحوسبة. شراكة Nvidia المُعلَنَة وحدها تَستَوْعِب كميّات GPU من فئة قابلة للمقارنة مع كبار المُشغِّلين العالميّين. شراكات AMD وCerebras كمصادر تَنَوُّع لتقليل خطر المورد الواحد، وشراكة Cisco لشبكات مراكز البيانات. أضِف إنفاق البناء الفعلي لمنشآت مراكز البيانات داخل المملكة، أنظمة التبريد، الطاقة، أنظمة الأمن المادي — والحديث عن عشرات المليارات USD على مدى سنوات.
أيّ بائع تأشير بيانات إقليمي يَدَّعِي القُدرَة على الوصول لهذه الشريحة يُمارِس خداعًا أو سوء فهم. هذا ليس مَجال عمل تأشير البيانات. الموردون لهذه الشريحة هم مُصَنِّعو الرقائق، مُكامِلو البنية التحتية الفائقة، ومقاولو الإنشاء السعوديّون. النقطة المهمّة لنا: حجم هذه الشريحة لا يَعنِي أنّ هناك “فُتاتًا” متاحًا لنا فيها — يَعنِي أنّ تركيز HUMAIN التنفيذي والإداري في 2026 سيَكون منصبًّا على تنفيذ هذه البنية، ممّا يَجعَل دورات المشتريات لشرائح أصغر أكثر منهجيّة لا أقلّ.
شريحة 2: بيانات تدريب ALLaM v2/v3 — هنا نَدخُل
ALLaM هو النموذج اللغوي العربي الأساسي الذي تَبنِيه HUMAIN (بعد أن طوّرته SDAIA في إصداراته الأولى). الإصدار v2 — بناءً على تَتَبُّعنا للإعلانات العامّة — يَتَطَلَّب توسيع كبير في بيانات التدريب، وv3 سيَتَطَلَّب أكثر. هذا ينقسم عمليًّا لثلاث طبقات:
أوّلًا، بيانات ما قبل التدريب (pre-training) — كَمّيّات هائلة من النصّ العربي المُنَظَّف، مَعَ تغطية لهجيّة شاملة، تَنوُّع جنس النصّ (أخبار، أدب، رسمي، حوار، فنّي، علمي)، ومُعالَجَة جودة عميقة. هذه الشريحة كبيرة الحجم لكنّ هامش التأشير المتخصّص فيها منخفض نسبيًّا؛ الجزء الأكبر هو تنسيق بيانات + تنظيف + إزالة تكرار.
ثانيًا، بيانات الضبط الإشرافي (Supervised Fine-Tuning — SFT) — أزواج تعليمات-استجابة عالية الجودة، صناعة يَدويّة، تَتَطَلَّب باحثين لغويين بمستوى أكاديمي. هذه الشريحة أصغر حجمًا بكثير لكنّ هامش القيمة لكلّ عيّنة أعلى بمراتب. هنا تَتَفَوَّق فِرق القاهرة ذات العمق الأكاديمي.
ثالثًا، بيانات تفضيل RLHF (تعزيز التعلّم من ردّ الإنسان) — أزواج استجابة A/B مع تَفضيل بشري مَدروس. هذه الشريحة هي التي تَصنَع شخصيّة النموذج وأمانه ودبلوماسيّته الثقافية. لـ نموذج عربي بمستوى ALLaM، الفروق الثقافية واللهجية في تَفضيلات RLHF حاسمة بطريقة لا تَنطَبِق على نموذج إنجليزي.
ما يُمكِن لبائع تأشير إقليمي أن يُقَدِّمَه هنا فعلًا: تنسيق بيانات pre-training بحجم، أزواج SFT بمستوى QA دكتوراه، عيّنات RLHF بتَغطِيَة لهجيّة. حجم الإنفاق المُحتَمَل في هذه الشريحة منتصف إلى أعلى 8 خانات USD سنويًّا — معقول، يتطلّب موزّعين متعدّدين، ويُكافِئ البائعين الذين يَستَطِيعون تَجاوز اختبارات الجودة الصارمة.
اقرأ المزيد عن حلول نماذج الأساس لدينا وعن بيانات تدريب ALLaM. تَفصيلات SFT وRLHF في القاموس.
شريحة 3: تقييم السلامة والفِرَق الحمراء — الشريحة الأعلى قيمة لكلّ عيّنة
أيّ نموذج لغوي ذو طموح إنتاجي بمستوى ALLaM يَحتَاج طبقة تقييم سلامة عميقة قبل النشر. هذا يَشمَل عدّة فئات عمل:
- بناء مجموعة تقييم (eval set construction) — أسئلة + سيناريوهات تقيس قُدرات محدّدة (استدلال، فَهم لغوي، معرفة ثقافية، اتّباع تعليمات)
- تأليف تنبيهات الفريق الأحمر (jailbreak red team labeling) — محاولات منهجية لإيقاع النموذج في إخراج ضارّ أو غير مُتَوَائِم، مَعَ تأشير ما إذا كان النموذج قاوَم أو سَقَط
- تقييم سلوك ثقافي — هل النموذج يَتَعامَل بشكل مناسب مع مَوضوعات حسّاسة في السياق السعودي والإسلامي والعربي بشكل عامّ
- تقييم لهجي — هل النموذج يَفهَم ويُجِيب بشكل مَقبول في لهجات مَختلفة دون انحياز للفصحى
هذه الشريحة أصغر حجمًا مَن شريحة بيانات التدريب لكنّها تَتَطَلَّب طبقة نُخبَوية من العاملين: خبراء لغة، خبراء ثقافة وإسلاميّات، خبراء أمن سيبراني، خبراء قانون. الإنفاق المُحتَمَل على مدى ~24 شهرًا منتصف 8 خانات إلى منخفض 9 خانات USD. الهامش لكلّ ساعة عمل أعلى من شرائح التأشير القياسية بفارق كبير.
تَفصيلات بناء مجموعة التقييم وتأشير الفريق الأحمر (jailbreak) في القاموس.
شريحة 4: نشر مؤسّسي للذكاء الاصطناعي — جزئيًّا متاحة
HUMAIN تَطمَح لأن تَكون مُحَرِّكًا لنشر الذكاء الاصطناعي في القطاعات الحكومية والمؤسّسية السعودية. هذا يَخلُق سلسلة من المشاريع التطبيقية: ذكاء اصطناعي للصحّة، التعليم، الخدمات الحكومية، الطاقة، الخدمات المالية. لكلّ مشروع تطبيقي، هناك سلسلة قيمة:
- مُدمِج النظم (system integrator) الذي يُوَصِّل ALLaM بأنظمة العميل
- مُكَيِّف النموذج (model adapter) الذي يُنَفِّذ ضبطًا دقيقًا حسب القطاع
- مُزَوِّد البيانات الذي يُسَلِّم بيانات تدريب أو ضبط متخصّصة بالقطاع
بائع تأشير إقليمي يَدخُل غالبًا كمُزَوِّد بيانات للطبقة الثالثة، أحيانًا كشريك ضبط للطبقة الثانية. الدخول كمُدمِج نظم في الطبقة الأولى يَتَطَلَّب قُدرَات هندسة برمجيات وإدارة مشاريع لا تَملِكها معظم بيوت التأشير. النموذج العملي: شراكة مع مُدمِجي نظم سعوديّين (Elm، Solutions by STC، NTGI) لتقديم طبقة البيانات للمشاريع التي يَقُودونها، بدلًا من المنافسة مَعَهم على دور المُدمِج.
شريحة 5: التوظيف الداخلي + البحث — ليست متاحة
HUMAIN تَستَقطِب باحثين في NLP العربي وعلوم البيانات وهندسة التعلّم الآلي بقوّة. هذا ليس فُرصَة بائع — هذا تنافس على المواهب. أيّ بائع إقليمي بَنَى طبقة باحثين مَتينة سيَفقُد جزءًا منهم لـ HUMAIN في 2026-2027 برواتب أعلى وحوافز سيادية. هذا واقع يَجِب التَّعامُل مَعَه بقَبول وبناء طبقة قيادة عميقة، ليس بإنكار.
واقعية المشتريات: ما يُلزِمه HUMAIN من بائعيه
HUMAIN ككيان مُعَيَّن سعوديًّا يَعمَل تحت قَيود مشتريات حكومية شبه رسمية، حتّى إن كانت شركة مستقلّة قانونيًّا. ما يَنتُج عن ذلك عمليًّا:
- ترخيص MISA: البائع الأجنبي يَحتَاج ترخيص استثمار من وزارة الاستثمار للتعاقد بحجم ذي معنى
- تَفضيل الكادر السعودي (Saudization): كل تعاقد متوسّط أو كبير يَأخُذ بعين الاعتبار نسبة الكادر السعودي للبائع، حسب نِطاق Nitaqat
- اختيارية IKTVA: برنامج القيمة المضافة محلّيًا الذي بَدَأ في قطاع الطاقة بدأ يَنتَشِر كمَعيار تَفضيلي في قطاعات أخرى. البائعون الذين يُوَطِّنون الإنفاق يَكسَبون نقاطًا في التقييم.
- NSDAI (الاستراتيجية الوطنية للبيانات والذكاء الاصطناعي): HUMAIN كذراع تنفيذي لجزء من NSDAI تَحمِل توجّهات الاستراتيجية بشأن السيادة، المواهب الوطنية، والقيمة المضافة المحلّية.
- معالجة داخل المملكة: بيانات HUMAIN الحسّاسة، تَقريبًا بالتعريف، لن تَخرُج من المملكة. بائع التأشير الذي يَطمَح للعمل مَعَ HUMAIN يَحتَاج قُدرَة معالجة فعلية داخل KSA، ليس مجرّد مكتب تمثيلي.
ماذا لا يَنبَغِي على بائع تأشير صغير أو متوسّط أن يَدَّعِيَه
نزاهة الادّعاء جزء مَن البقاء التجاري طويل الأمد. ما لا يَنبَغِي على بائع بحجمنا أن يَدَّعِيَه أمام HUMAIN أو أمام السوق:
- لسنا hyperscaler. لن نُقَدِّم بنية تحتية حوسبة.
- لسنا شركاء رقائق. لن نَتَنافس مَع Nvidia أو AMD أو Cerebras على أيّ شيء.
- لسنا مُدمِجو نظم بحجم Elm أو Solutions by STC أو NTGI. لن نَقُود مشاريع تحوّل رقمي مؤسّسية كاملة.
- لسنا مختبر بحث نماذج أساس. لن نَبنِي ALLaM v4. لن نُصَمِّم بِنيات نموذجية جديدة.
- لسنا مُورِّد كادر سعودي بآلاف الموظّفين. شركاتنا الزميلة في KSA تَنمو لكن لسنا حلًّا لتوظيف الكادر السعودي بحجم استراتيجي.
ماذا يُمكِن لبائع بحجمنا أن يُقَدِّمَه بمصداقية
ما نُقَدِّمه فعلًا وما يَدخُل ضمن نطاق طموح Annota8:
- بيانات عربية أوّلًا، ليست عربية كاحتياط: نَموذج عملنا بُنِيَ حَول العربية بفروقها اللهجية والثقافية، وليس كتَوسِيع لخطّ إنتاج إنجليزي
- QA على مستوى لغوي دكتوراه: فِرَق القاهرة لدينا تَحتَوي على باحثين بمستوى أكاديمي يَستَطِيعون مراجعة جودة عيّنات SFT وRLHF بمعايير أكاديمية
- تَغطِيَة لهجية شاملة: مصرية، شامية، خليجية (سعودية + إماراتية + كويتية + قطرية + بحرينية + عُمانية)، مغاربية، سودانية، يَمَنية
- تأليف تقييم سلامة: قُدرَة على بناء مجموعات تقييم وعيّنات فريق أحمر مَع وعي ثقافي حقيقي للسياق السعودي والإسلامي والعربي
- بيانات تفضيل RLHF: آليات تَفضيل بشري مَدروسة مَع توثيق قواعد الحُكم، قابلة للتدقيق
- معالجة داخل KSA لأحمال السيادة: عبر هيكلنا الهجين الذي يَستَوْعِب قَيد المعالجة المحلّية حين يَلزَم
اقرأ بنية القوى العاملة لدينا ومنهجية تنسيق البيانات.
الخلاصة الصادقة
HUMAIN في 2026 ستُنفِق غالبيّة ميزانيّتها على البنية التحتية والرقائق، وهذه شريحة لا يَدخُلها أيّ بائع تأشير. الشرائح المُتَاحَة لنا — بيانات تدريب ALLaM، تقييم سلامة، RLHF بوعي ثقافي — أصغر بكثير لكنّها حقيقية، وهامش القيمة لكلّ ساعة عمل فيها مُرتَفِع. البائع الذي يَدخُل بادّعاءات متواضعة، مَعَ شفافية بشأن ما لا يَفعَله، يَبنِي ثقة طويلة الأمد. البائع الذي يَدَّعِي قُدرَات hyperscaler يَفقُد مصداقيّته في المُحادثة الأولى.
تَكرارًا: Annota8 ليست بائعًا مُعتَمَدًا لـ HUMAIN حتّى اليوم. هذا تحليل عامّ من خارج دورة المشتريات، مبنيّ على إعلانات منشورة. أنشُرُه لأنّ تحليلًا نزيهًا أنفع للقارئ من ادّعاء معرفة لا أَملِكها. إن كانت لديك معلومات تَدحَض أيّ شيء في هذا المنشور، أُرَحِّب بالتصحيح.