تخيل أن تسأل مساعداً ذكياً عن الطقس، ثم تغير رأيك في منتصف الجملة، وفجأة يقاطعك قائلاً: ‘لاحظت أنك تنظر إلى النافذة، هل تريد مقارنة درجة الحرارة الفعلية بتوقعات التطبيق؟’ هذا ليس خيالاً علمياً، بل هو بالضبط ما تعد به شركة Thinking Machines، التي أعلنت عنها ميرا موراتي، الرئيسة التقنية السابقة لـ OpenAI، الإثنين الماضي. الشركة لا تكتفي ببناء نموذج لغوي ضخم آخر، بل تعيد تعريف طريقة تفاعل البشر مع الآلات من خلال ما تسميه ‘النماذج التفاعلية’ (Interaction Models).
في عالم يموج بـ ChatGPT وGemini وClaude، حيث كل شركة تسعى لبناء ‘أذكى’ نموذج، تأتي موراتي بفلسفة مختلفة: الذكاء ليس في حجم المعرفة فقط، بل في جودة الحوار. النماذج الحالية، كما تصفها الشركة، تعيش في خيط زمني واحد: تنتظر حتى تنتهي من الكتابة أو الكلام، ثم ترد. وأثناء الرد، تتجمد قدرتها على الإدراك. هذا يشبه محادثة هاتفية حيث يضع أحد الطرفين السماعة جانياً بينما يتحدث الآخر. النموذج التفاعلي يغير هذا تماماً: الآلة تستمع، ترى، وتستشعر طوال الوقت.
لماذا ‘النماذج التفاعلية’ ليست مجرد تحديث برمجي؟
لنفهم عمق الابتكار، علينا أن ننظر إلى القيود الحالية. عندما تتفاعل مع ChatGPT، فإن النموذج يعالج كل جلسة كصورة ثابتة. بمجرد أن تضغط Enter، تتحول كل كلماتك إلى ‘سياق’ مجمد. النموذج لا يعلم أنك تبتسم بسخرية، أو أنك تمسك بهاتفك بيد مرتجفة، أو أنك نظرت إلى الساعة قبل أن تسأل عن الوقت. النماذج التفاعلية تهدف إلى كسر هذا الجمود.
كيف تعمل النماذج التفاعلية تقنياً؟
بدلاً من معالجة النص ككتلة واحدة، تتبنى Thinking Machines بنية تدفق مستمر (continuous streaming architecture). هذا يسمح للنموذج بتحديث ‘حالته الذهنية’ في الوقت الفعلي مع كل إشارة جديدة: حركة عين، تغيير في نبرة الصوت، أو حتى توقف مؤقت في الكتابة. النتيجة؟ حوار يشبه التفاعل البشري الحقيقي، حيث يقرأ الطرفان لغة الجسد ونبرة الصوت.
ثورة في واجهات المستخدم: من الأوامر إلى المحادثة الحية
هذا التوجه يغير مفهوم ‘واجهة المستخدم’ بالكامل. اليوم، نتعامل مع الذكاء الاصطناعي كآلة بيع: نضغط زراً، نحصل على نتيجة. غداً، سيكون الذكاء الاصطناعي مثل زميل عمل يجلس أمامك، يراقب تعابير وجهك، ويسأل: ‘هل أنت متأكد من هذا الخيار؟’ تطبيقات ذلك هائلة: من المساعدين الصحيين الذين يكتشفون التردد في صوت المريض، إلى أدوات التعليم التي تتكيف مع لحظة تشتت انتباه الطالب.
لكن النجاح يتوقف على أمرين: قوة النموذج في فهم الإشارات غير اللفظية، وسرعة معالجتها دون تأخير مزعج. هنا تكمن التحديات الهندسية الحقيقية. التفاعل في الوقت الفعلي يتطلب موارد حسابية هائلة، ويحتاج إلى نماذج خفيفة قادرة على العمل على الأجهزة المحلية، وليس فقط في السحابة.
ماذا يعني هذا للسوق العربي والخليجي؟
المنطقة العربية، وخاصة الخليج، تستثمر مليارات الدولارات في الذكاء الاصطناعي، لكن التركيز ينصب غالباً على ‘المحتوى العربي’ أو ‘النماذج اللغوية’. ما تقدمه موراتي يفتح باباً جديداً: الذكاء الاصطناعي الحواري الحساس ثقافياً. تخيل تطبيقاً مصرفياً سعودياً يلاحظ تردد العميل قبل أن يوقع على عقد تمويل، فيقدم له شرحاً إضافياً بصوت هادئ. أو منصة تعليمية إماراتية تكتشف أن الطالب يشعر بالإحباط من مسألة رياضية، فتغير طريقة شرحها فوراً.
الفرصة الأكبر تكمن في قطاع الخدمات: مراكز الاتصال، الرعاية الصحية عن بُعد، والتعليم الإلكتروني. هذه القطاعات تعاني اليوم من تفاعلات روبوتية باردة تدفع العملاء للهروب. النماذج التفاعلية يمكن أن تحول تجربة العميل إلى حوار إنساني حقيقي. لكن التحدي سيكون في تدريب هذه النماذج على فهم الإشارات الثقافية العربية: تعابير الوجه، نبرات الصوت، وحتى الصمت الذي قد يعني احتراماً في ثقافة وتردداً في أخرى.
مقارنة: ماذا تملك جوجل وأوبن إيه آي في هذا المجال؟
جوجل DeepMind لديها مشاريع مثل ‘Gato’ و’Sparrow’ التي تتعلم من التفاعل البشري، لكنها لم تطرح نموذجاً تفاعلياً جاهزاً للسوق. OpenAI، التي غادرتها موراتي، تركز على ‘المساعد الشخصي’ عبر تقنية Voice Mode، لكنه لا يزال يعمل ضمن نموذج ‘إرسال واستقبال’ تقليدي. الفرق الجوهري: Thinking Machines لا تكتفي بتحسين سرعة الرد، بل تعيد تعريف طبيعة الإدراك الآلي.
مع ذلك، يجب أن نكون واقعيين. الإعلان الأولي للشركة يفتقر إلى التفاصيل التقنية الدقيقة. هل النموذج قادر على التعامل مع آلاف المستخدمين في وقت واحد؟ كيف يتعامل مع الخصوصية عندما ‘يراك’ طوال الوقت؟ هذه أسئلة لم تُجب بعد. موراتي معروفة بدقتها، لكن الطريق من المفهوم إلى المنتج التجاري طويل ومليء بالعقبات.
الخلاصة: هل نحن أمام ‘آيفون’ الذكاء الاصطناعي؟
ما تقدمه ميرا موراتي ليس مجرد تحسين تدريجي، بل نقلة نوعية في فلسفة التفاعل بين الإنسان والآلة. إذا نجحت Thinking Machines في تحويل النماذج التفاعلية إلى منتج عملي، فقد ننظر إلى ChatGPT بعد سنوات كما ننظر اليوم إلى الهواتف ذات الأزرار: أداة مفيدة لكنها بدائية. السؤال الأهم للمستخدم العربي: هل سنكون مجرد مستهلكين لهذه التقنية، أم أن لدينا الاستعداد لبناء نماذج تفاعلية تفهم لهجتنا، ثقافتنا، وحتى صمتنا؟ أترك لكم النقاش: هل تثق في ذكاء اصطناعي يراقب ردود فعلك طوال الوقت، أم أن هذا يخيفك؟

