كل المقالات

ما الذي ستشتريه HUMAIN في 2026: قراءة عملية للمخصّصات

لماذا هذا التحليل، ومن أين يَأتي

HUMAIN أُعلِنَ عنها رسميًا في مايو 2025 كشركة ذكاء اصطناعي مَملوكَة بالكامل لصندوق الاستثمارات العامّة (PIF) السعودي. خلال السنة الأولى، أصدرت سلسلة إعلانات شراكة تَستَحِقّ القراءة الحرفيّة: Nvidia لإمداد الرقائق، AMD وCerebras كموردين تكميليّين، Cisco للبنية التحتية للشبكات، وتطوير ALLaM v2 كنموذج لغوي عربي أساسي. مَملَكَتُها الميدانية تَشمَل سحابة سيادية، مراكز بيانات داخل المملكة، وفِرق بحث ذكاء اصطناعي مُوَزَّعَة بين الرياض ومراكز عالمية.

السؤال الذي يَطرَحه كلّ بائع تأشير إقليمي اليوم: “أين أَدخُل؟” والإجابة الصادقة تَتَطَلَّب التمييز بين ثلاث شرائح إنفاق مختلفة جذريًا. هذا المنشور يَفصِل بينها — من الخارج للداخل، مبنيًّا على إعلانات عامّة وحوارات تنفيذية منشورة فقط. لست داخل دورة المشتريات. Annota8 ليست بائعًا مُعتَمَدًا لـ HUMAIN. أَكتُب هذا لأنّ قراءة عمليّة بنزاهة أنفع لقارئ يَبحَث عن خريطة من ادّعاء بِمَعرِفَة لا أَملِكها.

شرائح إنفاق HUMAIN الثلاث

الشريحةحجم تقديري 2026-2027مَن يَأخُذهاهل يَدخُل بائع تأشير إقليمي؟
بناء مراكز بيانات + رقائق + بنية تحتيةعشرات المليارات USD متعدّدة السنواتNvidia، AMD، Cerebras، Cisco، مقاولو إنشاء سعوديّونلا — هذه ليست لعبتنا
بيانات تدريب + تنسيق لـ ALLaM v2/v3منتصف إلى أعلى 8 خانات USD سنويًامزوّدو بيانات + تأشير + تنسيقنعم، شريحة قابلة للوصول
تقييم سلامة + الفِرَق الحمراء + تأشير سلوكمنتصف 8 خانات إلى منخفض 9 خانات USD على ~24 شهرًابيوت تقييم متخصّصة + خبراء سلامة + مؤلّفو تنبيهاتنعم، شريحة عالية القيمة
شراكات نشر مؤسّسي للذكاء الاصطناعيOpEx مُوَزَّع، CapEx منخفضمُدمِجو نظم + شركاء تحوّل رقميجزئيًّا — كشريك تأشير، ليس كمُدمِج
توظيف باحثين + بنية بحثيةعشرات الملايين USD سنويًامواهب بحث NLP عربي + شركاء أكاديميونلا — هذه بنية داخلية

هذه أرقام تقديرية مبنيّة على نسب صناعية مَعقُولة لشركة بهذا الطموح، وليست إفصاحًا. خَطؤها على الجانب الحذر؛ احتمال أن تكون الأعداد الفعلية أكبر يَفُوق احتمال أن تكون أصغر.

شريحة 1: بناء مراكز البيانات والرقائق — ليست لعبتنا

الإنفاق الأكبر بفارق ضخم سيَذهب إلى البنية التحتية للحوسبة. شراكة Nvidia المُعلَنَة وحدها تَستَوْعِب كميّات GPU من فئة قابلة للمقارنة مع كبار المُشغِّلين العالميّين. شراكات AMD وCerebras كمصادر تَنَوُّع لتقليل خطر المورد الواحد، وشراكة Cisco لشبكات مراكز البيانات. أضِف إنفاق البناء الفعلي لمنشآت مراكز البيانات داخل المملكة، أنظمة التبريد، الطاقة، أنظمة الأمن المادي — والحديث عن عشرات المليارات USD على مدى سنوات.

أيّ بائع تأشير بيانات إقليمي يَدَّعِي القُدرَة على الوصول لهذه الشريحة يُمارِس خداعًا أو سوء فهم. هذا ليس مَجال عمل تأشير البيانات. الموردون لهذه الشريحة هم مُصَنِّعو الرقائق، مُكامِلو البنية التحتية الفائقة، ومقاولو الإنشاء السعوديّون. النقطة المهمّة لنا: حجم هذه الشريحة لا يَعنِي أنّ هناك “فُتاتًا” متاحًا لنا فيها — يَعنِي أنّ تركيز HUMAIN التنفيذي والإداري في 2026 سيَكون منصبًّا على تنفيذ هذه البنية، ممّا يَجعَل دورات المشتريات لشرائح أصغر أكثر منهجيّة لا أقلّ.

شريحة 2: بيانات تدريب ALLaM v2/v3 — هنا نَدخُل

ALLaM هو النموذج اللغوي العربي الأساسي الذي تَبنِيه HUMAIN (بعد أن طوّرته SDAIA في إصداراته الأولى). الإصدار v2 — بناءً على تَتَبُّعنا للإعلانات العامّة — يَتَطَلَّب توسيع كبير في بيانات التدريب، وv3 سيَتَطَلَّب أكثر. هذا ينقسم عمليًّا لثلاث طبقات:

أوّلًا، بيانات ما قبل التدريب (pre-training) — كَمّيّات هائلة من النصّ العربي المُنَظَّف، مَعَ تغطية لهجيّة شاملة، تَنوُّع جنس النصّ (أخبار، أدب، رسمي، حوار، فنّي، علمي)، ومُعالَجَة جودة عميقة. هذه الشريحة كبيرة الحجم لكنّ هامش التأشير المتخصّص فيها منخفض نسبيًّا؛ الجزء الأكبر هو تنسيق بيانات + تنظيف + إزالة تكرار.

ثانيًا، بيانات الضبط الإشرافي (Supervised Fine-Tuning — SFT) — أزواج تعليمات-استجابة عالية الجودة، صناعة يَدويّة، تَتَطَلَّب باحثين لغويين بمستوى أكاديمي. هذه الشريحة أصغر حجمًا بكثير لكنّ هامش القيمة لكلّ عيّنة أعلى بمراتب. هنا تَتَفَوَّق فِرق القاهرة ذات العمق الأكاديمي.

ثالثًا، بيانات تفضيل RLHF (تعزيز التعلّم من ردّ الإنسان) — أزواج استجابة A/B مع تَفضيل بشري مَدروس. هذه الشريحة هي التي تَصنَع شخصيّة النموذج وأمانه ودبلوماسيّته الثقافية. لـ نموذج عربي بمستوى ALLaM، الفروق الثقافية واللهجية في تَفضيلات RLHF حاسمة بطريقة لا تَنطَبِق على نموذج إنجليزي.

ما يُمكِن لبائع تأشير إقليمي أن يُقَدِّمَه هنا فعلًا: تنسيق بيانات pre-training بحجم، أزواج SFT بمستوى QA دكتوراه، عيّنات RLHF بتَغطِيَة لهجيّة. حجم الإنفاق المُحتَمَل في هذه الشريحة منتصف إلى أعلى 8 خانات USD سنويًّا — معقول، يتطلّب موزّعين متعدّدين، ويُكافِئ البائعين الذين يَستَطِيعون تَجاوز اختبارات الجودة الصارمة.

اقرأ المزيد عن حلول نماذج الأساس لدينا وعن بيانات تدريب ALLaM. تَفصيلات SFT وRLHF في القاموس.

شريحة 3: تقييم السلامة والفِرَق الحمراء — الشريحة الأعلى قيمة لكلّ عيّنة

أيّ نموذج لغوي ذو طموح إنتاجي بمستوى ALLaM يَحتَاج طبقة تقييم سلامة عميقة قبل النشر. هذا يَشمَل عدّة فئات عمل:

هذه الشريحة أصغر حجمًا مَن شريحة بيانات التدريب لكنّها تَتَطَلَّب طبقة نُخبَوية من العاملين: خبراء لغة، خبراء ثقافة وإسلاميّات، خبراء أمن سيبراني، خبراء قانون. الإنفاق المُحتَمَل على مدى ~24 شهرًا منتصف 8 خانات إلى منخفض 9 خانات USD. الهامش لكلّ ساعة عمل أعلى من شرائح التأشير القياسية بفارق كبير.

تَفصيلات بناء مجموعة التقييم وتأشير الفريق الأحمر (jailbreak) في القاموس.

شريحة 4: نشر مؤسّسي للذكاء الاصطناعي — جزئيًّا متاحة

HUMAIN تَطمَح لأن تَكون مُحَرِّكًا لنشر الذكاء الاصطناعي في القطاعات الحكومية والمؤسّسية السعودية. هذا يَخلُق سلسلة من المشاريع التطبيقية: ذكاء اصطناعي للصحّة، التعليم، الخدمات الحكومية، الطاقة، الخدمات المالية. لكلّ مشروع تطبيقي، هناك سلسلة قيمة:

بائع تأشير إقليمي يَدخُل غالبًا كمُزَوِّد بيانات للطبقة الثالثة، أحيانًا كشريك ضبط للطبقة الثانية. الدخول كمُدمِج نظم في الطبقة الأولى يَتَطَلَّب قُدرَات هندسة برمجيات وإدارة مشاريع لا تَملِكها معظم بيوت التأشير. النموذج العملي: شراكة مع مُدمِجي نظم سعوديّين (Elm، Solutions by STC، NTGI) لتقديم طبقة البيانات للمشاريع التي يَقُودونها، بدلًا من المنافسة مَعَهم على دور المُدمِج.

شريحة 5: التوظيف الداخلي + البحث — ليست متاحة

HUMAIN تَستَقطِب باحثين في NLP العربي وعلوم البيانات وهندسة التعلّم الآلي بقوّة. هذا ليس فُرصَة بائع — هذا تنافس على المواهب. أيّ بائع إقليمي بَنَى طبقة باحثين مَتينة سيَفقُد جزءًا منهم لـ HUMAIN في 2026-2027 برواتب أعلى وحوافز سيادية. هذا واقع يَجِب التَّعامُل مَعَه بقَبول وبناء طبقة قيادة عميقة، ليس بإنكار.

واقعية المشتريات: ما يُلزِمه HUMAIN من بائعيه

HUMAIN ككيان مُعَيَّن سعوديًّا يَعمَل تحت قَيود مشتريات حكومية شبه رسمية، حتّى إن كانت شركة مستقلّة قانونيًّا. ما يَنتُج عن ذلك عمليًّا:

ماذا لا يَنبَغِي على بائع تأشير صغير أو متوسّط أن يَدَّعِيَه

نزاهة الادّعاء جزء مَن البقاء التجاري طويل الأمد. ما لا يَنبَغِي على بائع بحجمنا أن يَدَّعِيَه أمام HUMAIN أو أمام السوق:

ماذا يُمكِن لبائع بحجمنا أن يُقَدِّمَه بمصداقية

ما نُقَدِّمه فعلًا وما يَدخُل ضمن نطاق طموح Annota8:

اقرأ بنية القوى العاملة لدينا ومنهجية تنسيق البيانات.

الخلاصة الصادقة

HUMAIN في 2026 ستُنفِق غالبيّة ميزانيّتها على البنية التحتية والرقائق، وهذه شريحة لا يَدخُلها أيّ بائع تأشير. الشرائح المُتَاحَة لنا — بيانات تدريب ALLaM، تقييم سلامة، RLHF بوعي ثقافي — أصغر بكثير لكنّها حقيقية، وهامش القيمة لكلّ ساعة عمل فيها مُرتَفِع. البائع الذي يَدخُل بادّعاءات متواضعة، مَعَ شفافية بشأن ما لا يَفعَله، يَبنِي ثقة طويلة الأمد. البائع الذي يَدَّعِي قُدرَات hyperscaler يَفقُد مصداقيّته في المُحادثة الأولى.

تَكرارًا: Annota8 ليست بائعًا مُعتَمَدًا لـ HUMAIN حتّى اليوم. هذا تحليل عامّ من خارج دورة المشتريات، مبنيّ على إعلانات منشورة. أنشُرُه لأنّ تحليلًا نزيهًا أنفع للقارئ من ادّعاء معرفة لا أَملِكها. إن كانت لديك معلومات تَدحَض أيّ شيء في هذا المنشور، أُرَحِّب بالتصحيح.

ناقش طبقة تأشير لمشروع نموذج عربي → جلسة 30 دقيقة اقرأ موارد ALLaM لدينا