طوّر مجموعة من الباحثين في "جامعة ستانفورد" الأميركية، نظارة ذكية جديدة باستخدام نموذج GPT-4 للذكاء الاصطناعي، وتم تسميتها باسم "rizzGPT".
وستكون هذه النظارة قادرة على التقاط الحديث الموجه إلى مستخدميها، وعرض الردود المكتوبة أمام أعينهم.
وأفاد أحد أعضاء الفريق، بأن النظارة الذكية تتضمن في المقام الأول عدسة متطورة للواقع المعزز Monocle AR، والتي تمكّن المستخدم من رؤية الردود النصية أمام عينيه.
كما يتم استخدام منصة Whisper المملوكة لـ"أوبن إيه آي" لتحويل الكلام إلى نصوص، ومن ثم يتم إدخالها إلى نموذج اللغة المتطور GPT-4 للحصول على الردود المعروضة في العدسة، والتي يمكن تثبيتها على أي نظارة.
وتم تصميم العدسة الذكية بواسطة Brilliant Labs، وهي تشتمل على شاشة Micro LED وكاميرا بدقة 720p، وميكروفون لالتقاط الأصوات، وتتميز بتقنية بلوتوث 5.0.
ويعتمد استخدام العدسة الذكية بشكل رئيسي على الهاتف المحمول، حيث يتم توصيلها لاسلكياً بالهاتف، ويتم استخدام منصة Whisper لتحويل الكلام إلى نصوص مكتوبة، بالإضافة إلى استخدام منصة GPT-4 للنماذج اللغوية الذكية.
ويتم تمرير البيانات بين الهاتف والعدسة بشكل مباشر وسريع، لتحقيق تجربة سلسة واستقرار الاتصال.
وأظهر المقطع المصور الذي نشره أحد الباحثين، وجود بطء طفيف في عرض الردود أمام المستخدمين، وكذلك عدم وضوح النصوص داخل العدسة، مما قد يؤدي إلى تأخر في استجابة المستخدمين، حيث يتعين عليهم الانتظار حتى تظهر الردود أو محاولة قراءة ما يظهر على العدسة بشكل أفضل.
وأشار الباحثون إلى أن النظارة الجديدة لا تزال في مرحلتها التجريبية، ولكنهم يعملون حالياً على تحسينها لجعلها أكثر فاعلية.
ومن بين استخداماتها المقترحة، استخدامها في مقابلات العمل لمساعدة المتقدمين في الإجابة عن أسئلة المقابلة بأفضل طريقة ممكنة. كما يتوقع الباحثون أن تساعد هذه النظارة المستخدمين في التفاعل مع أجهزتهم الذكية بطريقة أسهل وأسرع من الطرق التقليدية المعتمدة على الرسوميات والأزرار والشاشات القابلة للمس، وذلك باستخدام الأوامر الصوتية بدلاً من ذلك.
وأوضح بريان بينج، أحد أعضاء الفريق البحثي، أن خطة تطوير النظارة الجديدة ستشمل في المستقبل تحسين عملية تحويل الأحاديث النطقية إلى نصوص مكتوبة، حيث ستتم هذه العملية بالكامل على هاتف المستخدم دون الحاجة للاتصال بخوادم "أوبن إيه آي" السحابية، وذلك لتحقيق السرعة والحفاظ على خصوصية المستخدمين.
كما يرغب الفريق في تطوير النظارة لتعتمد نموذج ذكاء اصطناعي متعدد الإمكانيات Multi-Modal Large Language Model، إذ يمكن للنظارة استخدام الكاميرا الموجودة في العدسة الذكية لإدراك العناصر الموجودة حول المستخدم، وتوفير مساعدة له في النظر وليس فقط الاستماع إلى الأحاديث.