sahab. SYSTEMS
ذكاء التوزيع واللوجستيات
العدد 01 · Engineering
→ English
منظومة السحاب · الهندسة

لماذا يتجاهل المندوبون المسار الأمثل — وما علّمته إيّانا 1.4 مليون عملية تسليم

محرّك المسار يقول يسارًا. المندوب ينعطف يمينًا. دراسة على 1.4 مليون عملية تسليم تشرح السبب — ولماذا الحلّ ليس خوارزمية أفضل بل خوارزمية أكثر تواضعًا.

الخلاصة
المندوبون يفضّلون باطّراد المحطة الأقرب على المسار الأمثل زمنيًا. هذا الانحراف ليس ضوضاء — إنه تفضيل.

يأتي كلّ نظام إرسال محمّلًا بعقيدة: المُحسِّن يعرف الأفضل. أمدِدْه بالمحطات وحركة المرور والنوافذ الزمنية، فيعيد إليك المسار الذي يقلّل إجمالي زمن السفر. ومهمّة المندوب أن يتبعه. وحين لا يفعل، نسمّي ذلك انحرافًا — كلمة مهذّبة لقول «الإنسان أخطأ».

تشير دراسة على 1.4 مليون عملية تسليم طرود في شنغهاي إلى أنّنا فهمنا الخطأ مقلوبًا. المندوبون لا يفشلون في اتّباع الأمثل، بل يُحسّنون شيئًا لم تكن الخوارزمية تحسبه.

01

النتيجة

كان لدى الباحثين الحقيقة الأرضية التي نادرًا ما تراها فرق المسارات: لا المسار الذي أوصى به المحرّك، بل المسار الذي قاده المندوب فعلًا، عبر أكثر من مليون عملية تسليم حقيقية. وكان النمط متّسقًا ومُقلِقًا بعض الشيء: المندوبون يفضّلون عمومًا المسافات الأقصر على المسارات الأكفأ زمنيًا. فحين يُخيَّرون بين محطة أقرب ومحطة يقول النموذج إنها تُبقي المسار الكلّي أسرع، يذهبون إلى الأقرب.

ويشتدّ الانجذاب نحو القُرب تحديدًا حيث تأمل أن تتولّى الخوارزمية الأمر — «في ظروف التوجيه المعقّدة أو ساعات الذروة المرورية». فحين يكون الموقف أصعب ما يكون، يثق المندوبون بما يرونه (المحطة التالية هناك مباشرة) على ما يؤكّده النموذج (ثِق بي، القفزة الأطول تُؤتي ثمارها لاحقًا).

وهنا الجزء الذي يعقّد الاستنتاج السهل: هذه الانحرافات تكلّف فعلًا شيئًا. فقد جاءت المسارات وأزمنة السفر الفعلية أطول من الأمثل المتوقَّع، وكانت الفجوة أسوأ لدى السائقين قليلي الخبرة وفي المسارات الطويلة. فالإنسان ليس ببساطة على صواب والآلة على خطأ. كلاهما محقّ جزئيًّا، والهندسة المثيرة تعيش في الفجوة بينهما.

02

لماذا يفوز القُرب

ضَع نفسك في مقعد المندوب يكفّ التفضيل عن الظهور كأنه غير عقلاني. المسار الأمثل زمنيًا ادّعاءٌ عن المستقبل — «تجاوز هذه المحطة القريبة الآن، وسيصبح التسلسل أسرع في المحصّلة بنهاية الوردية». وهو يتوقّف على أن تتصرّف حركة المرور كما تُنبَّأ، وألّا تطول أيّ محطة، وأن تصمد تقديرات النموذج لزمن السفر. كلّ واحد من هذه رهانٌ صغير.

أما المحطة القريبة فهي، على النقيض، يقين. إنها هناك. الذهاب إليها يضمن تقدّمًا مؤكّدًا ويُزيل متغيّرًا واحدًا من وردية مليئة بالمتغيّرات. والمندوبون، خصوصًا تحت الضغط، يفعلون ما يفعله أيّ فاعل رشيد في ظلّ عدم اليقين: يخصمون تنبّؤ النموذج الواثق ويأخذون المؤكّد. هذا ليس فشلًا في الانضباط، بل إدارة مخاطر بمقود.

وتخبرنا بيانات التكلفة أنّ النموذج ليس مخطئًا — فأمثله أسرع فعلًا حين تصمد فرضيّاته. ويخبرنا السلوك أنّ الفرضيّات لا تصمد بما يكفي ليثق بها المندوبون. وكلتا الحقيقتين صحيحة في آنٍ واحد.

03

الحلّ الخطأ والحلّ الصحيح

ردّ الفعل الغريزي هو الضغط أكثر على الالتزام: توجيه أدقّ، ومقاييس امتثال أصرم، ونُخَزٌ للالتزام بالخطّ. هذا يعامل الانحراف بوصفه المشكلة. لكن إن كان مليون مندوب يرتكبون باطّراد «الخطأ» نفسه، فالفرضية الأرخص هي أنّ المسار، لا المندوب، هو المُحدَّد خطأً.

استنتاج الدراسة نفسه يشير إلى الاتجاه الآخر — نحو الحاجة إلى مواءمة خوارزميات التوجيه مع تفضيلات المندوبين. لا للاستسلام للإنسان، بل لإعادة طيّ معلومة الإنسان داخل النموذج. وعمليًّا، يعني هذا أمورًا قليلة لكلّ من يبني نظام إرسال:

عاقِب الأمثلة الهشّة. المسار الذي تتبخّر ميزته إذا اختلّت فرضية واحدة يستحقّ أقلّ مما يوحي به زمنه المتوقَّع. والترجيح نحو المسارات المتينة — تلك التي تبقى جيّدة حين تسيء حركة المرور التصرّف — يُغلق كثيرًا من الفجوة مع ما يفعله المندوبون فعلًا، لأنّ المتانة هي بالضبط ما يطاردونه.

عامِل القُرب بوصفه ميزة لا عِلّة. إن كان المندوبون يثمّنون باطّراد المحطة القريبة، فينبغي للنموذج أن يُسعّر هذا التفضيل بدل مقاومته — وأن يحفظ قفزاته من نوع «ثِق بي» للحالات التي يكون فيها العائد كبيرًا والفرضيّات صلبة.

جزّئ بحسب الخبرة. تركّزت تكلفة الانحراف بين السائقين قليلي الخبرة والمسارات الطويلة. وهذه إشارة استهداف: الأشخاص والمسارات التي يساعد فيها التوجيه أكثر قابلة للتحديد سلفًا، فيمكن توجيه الدعم والترتيب الأدقّ إلى حيث يُؤتي ثماره فعلًا، بدل رشّه على الجميع.

04

الدرس الأوسع

ثمّة نمط هنا يتجاوز بكثير توجيه الميل الأخير. نميل إلى نشر التحسين بوصفه عرّافًا — يحسب الجواب، وينفّذه البشر — ونعامل أيّ تباين بوصفه خطأً بشريًّا يجب استئصاله. لكنّ الإنسان في الميدان يُشغّل نموذجًا أيضًا، نموذجًا دُرِّب على ظروف لا تراها الخوارزمية كاملةً قطّ. وحين يختلف نموذجه ونموذجنا مليون مرّة في الاتجاه نفسه، فتلك ليست ضوضاء تُكبَت. إنها مجموعة بيانات مجانية ومُعنونة تخبرنا أين يخطئ نموذجنا.

أفضل أنظمة الإرسال لن تكون تلك التي تُجبر المندوبين على الخطّ، بل تلك المتواضعة بما يكفي لتسأل لماذا يُتجاهَل الخطّ باستمرار — ولتُحدّث نفسها.

المراجع
  • Martínez-de-Albéniz, V., & Krigul, C. (2025). Human agency in last-mile delivery (working paper). IESE Business School.
  • Vancil, E. (2025). AI route optimization cuts fleet costs by 20%. Fuel Logic.
  • Zhang, F., & Zhao, C. (2026). A last-mile delivery path optimization method aiming at solving the cold start of new users. Multimedia Systems, 32, 216. doi:10.1007/s00530-026-02258-1.