
يُظهر نموذج الذكاء الاصطناعي الجديد قدرة غير مسبوقة على توقع تصرفات الإنسان من خلال تفسير الإشارات المرئية والسياقية في الوقت الفعلي. وبدلاً من مجرد الاستجابة للحركة، يفكر النظام في ما يحتمل أن يفعله الأشخاص بعد ذلك.
الباحثون من كلية الهندسة بجامعة تكساس ايه اند ام وقد أدخل المعهد الكوري المتقدم للعلوم والتكنولوجيا نظامًا جديدًا الذكاء الاصطناعي نظام (AI) يسمى OmniPredict، مصمم لتحسين سلامة السيارات ذاتية القيادة.
OmniPredict هو أول نظام يستخدم نموذج اللغة الكبير متعدد الوسائط (MLLM) للتنبؤ بكيفية تصرف المشاة. إنه يعتمد على نفس النوع من التكنولوجيا الأساسية المستخدمة في برامج الدردشة المتقدمة والتعرف على الصور، ولكن هدفه مختلف. ومن خلال ربط ما يراه بالتفاصيل السياقية، يهدف النظام إلى التنبؤ، في الوقت الفعلي، بما من المحتمل أن يفعله الشخص بعد ذلك.
لقد جذبت الاختبارات المبكرة الاهتمام، مما يشير إلى أن OmniPredict يمكن أن يحقق نتائج عالية بشكل ملحوظ دقة حتى بدون تدريب متخصص.
وقال الدكتور سرينكانث ساريبالي، الباحث الرئيسي في المشروع ومدير مركز المركبات ذاتية القيادة وأنظمة الاستشعار: “المدن لا يمكن التنبؤ بها. ويمكن أن يكون من الصعب التنبؤ بالمشاة”. “إن نموذجلا الجديد هو لمحة عن المستقبل حيث لا ترى الآلات ما يحدث فحسب، بل تتوقع ما من المحتمل أن يفعله البشر أيضًا.”
نوع جديد من “ذكاء الشارع”
بينما يسعى المطورون لجعل القيادة الذاتية أكثر أمانًا، تضيف OmniPredict طبقة جديدة من الوعي بالشارع تقترب من الحدس البشري.
فبدلاً من الاستجابة فقط للحركة الحالية للمشاة، فإنها تحاول توقع ما سيفعله هذا الشخص بعد ذلك. إذا نجح الأمر على النحو المنشود، فقد يؤثر هذا النهج على كيفية عمل المركبات ذاتية القيادة في المناطق الحضرية الكثيفة والتنقل في الشوارع المزدحمة بسلاسة أكبر.
وقال ساريبالي: “إنه يفتح الأبواب أمام تشغيل أكثر أمانًا للمركبات ذاتية القيادة، وتقليل عدد الحوادث المتعلقة بالمشاة، والتحول من الاستجابة إلى منع الخطر بشكل استباقي”.
ومن الممكن أن يتغير المشهد النفسي أيضًا.
تخيل أنك تقف عند ممر للمشاة، وبدلاً من أن تراقب سائقًا بشريًا، تعلم أن مركبة تعمل بالذكاء الاصطناعي تتتبع موقعك وتخطط لحركتك المحتملة التالية.
وقال ساريبالي: “مواجهات أقل توتراً. عدد أقل من الحوادث الوشيكة. قد تتدفق الشوارع بحرية أكبر. كل ذلك لأن المركبات لا تفهم الحركة فحسب، بل الأهم من ذلك، أنها تفهم الدوافع”.
ما وراء ممرات المشاة: قراءة السلوك البشري في البيئات المعقدة
تمتد آثار OmniPredict إلى ما هو أبعد من شوارع المدينة الصاخبة، أو التقاطعات الفوضوية، أو ممرات المشاة المزدحمة.
وقال ساريبالي: “نحن نفتح الباب أمام التطبيقات المثيرة”. “على سبيل المثال، فإن إمكانية وجود آلة قادرة على اكتشاف نتائج شخص يظهر إشارات تهديد والتعرف عليها والتنبؤ بها يمكن أن يكون لها آثار مهمة.”
بشكل عام، يمكن لنظام الذكاء الاصطناعي الذي يقرأ تغيرات الوضعية أو التردد أو اتجاه الجسم أو علامات التوتر أن يغير قواعد اللعبة بالنسبة للأفراد المشاركين في العمليات العسكرية وعمليات الطوارئ.
وقال ساريبالي: “يمكن أن يساعد ذلك في تحديد المؤشرات المبكرة للمخاطر وتنبيهها، أو حتى توفير طبقة إضافية من الوعي الظرفي”.
في هذه السيناريوهات، قد يمنح النهج الجديد الموظفين القدرة على تفسير البيئات المعقدة بسرعة واتخاذ قرارات أسرع وأكثر استنارة.
وقال ساريبالي: “إن هدفنا في المشروع ليس استبدال البشر، بل المساعدة في تعزيزهم بشريك أكثر ذكاءً”.
وضعه على المحك
تعتمد أنظمة القيادة الذاتية التقليدية على نماذج الرؤية الحاسوبية المدربة على آلاف مجموعات البيانات والصور. وعلى الرغم من قوتها، فإن هذه النماذج تكافح من أجل التكيف مع الظروف المتغيرة.
وقال ساريبالي: “تغيرات الطقس، وتصرفات الناس بشكل غير متوقع، والأحداث النادرة، والعناصر الفوضوية في شوارع المدينة، كلها يمكن أن تؤثر حتى على أنظمة الرؤية الأكثر تطوراً”.
يأخذ OmniPredict نهجا مختلفا.
والنتيجة هي ذكاء اصطناعي لا يرى مجرد مشهد؛ فهو يفسرها ويتوقع كيف يمكن أن يتحرك كل عنصر، ويضبطه في الوقت الفعلي.
اختبر الفريق OmniPredict مقابل اثنين من أصعب المعايير للمشاة – مجموعات بيانات JAAD وWiDEVIEW – أبحاث السلوك، دون إجراء أي تدريب متخصص مسبق.
النتائج التي نشرت في أجهزة الكمبيوتر والهندسة، ذكرت أن OmniPredict قدمت دقة مذهلة بنسبة 67%، متفوقة على أحدث النماذج بنسبة 10%.
حتى أنها حافظت على الأداء عندما أضاف الباحثون معلومات سياقية، مثل المشاة المختبئين جزئيًا أو الأشخاص الذين ينظرون نحو السيارة.
أظهر الذكاء الاصطناعي أيضًا سرعات استجابة أسرع، وتعميمًا أقوى عبر سياقات الطرق المختلفة، واتخاذ قرارات أكثر قوة من الأنظمة التقليدية – وهي علامات مشجعة للنشر في العالم الحقيقي في المستقبل.
وقال ساريبالي: “إن أداء OmniPredict مثير، وتشير مرونته إلى إمكانيات أوسع بكثير في العالم الحقيقي”.
تحول زاوية الحكم الذاتي والترقب
في حين أنه لا يزال نموذجًا بحثيًا وليس نظامًا جاهزًا للطرق، يشير OmniPredict إلى مستقبل تعتمد فيه المركبات ذاتية القيادة بشكل أقل على التعلم البصري للقوة الغاشمة وأكثر على التفكير السلوكي.
من خلال الجمع بين التفكير والإدراك، يفتح النظام ويمكّن نوعًا جديدًا من الذكاء المشترك – حيث لا يصبح العالم آليًا فحسب، بل يصبح أكثر بديهية بشكل عميق.
وقال ساريبالي: “لا يرى OmniPredict ما نقوم به فحسب، بل إنه يفهم سبب قيامنا بذلك ويمكنه الآن التنبؤ بالوقت الذي من المحتمل أن نقوم فيه بعمل ما”.
إذا تمكنت السيارات التي تعمل بالذكاء الاصطناعي من قراءة خطوتنا التالية، فإن الطريق أمامنا أصبح أكثر ذكاءً.
المرجع: “فهم متعدد الوسائط مع GPT-4o لتعزيز التنبؤ العام بسلوك المشاة” بقلم جي سيوك هام، وجيا هوانغ، وبنغ جيانغ، وجينيونغ مون، ويونغجين كوون، وسريكانث ساريبالي، وتشانجيك كيم، 18 أكتوبر 2025، الحاسبات والهندسة الكهربائية.
دوى: 10.1016/j.compeleceng.2025.110741
لا تفوت أي اختراق: انضم إلى النشرة الإخبارية SciTechDaily.
تابعونا على جوجل و أخبار جوجل.
تنويه من موقعنا
تم جلب هذا المحتوى بشكل آلي من المصدر:
yalebnan.org
بتاريخ: 2025-12-17 05:33:00.
الآراء والمعلومات الواردة في هذا المقال لا تعبر بالضرورة عن رأي موقعنا والمسؤولية الكاملة تقع على عاتق المصدر الأصلي.
ملاحظة: قد يتم استخدام الترجمة الآلية في بعض الأحيان لتوفير هذا المحتوى.
