تدرس شركة جوجل تطوير روبوت محادثة جديد قادر على سرد قصة حياة المستخدم بناءً على صوره وسجل البحث الخاص به، وفقًا لتقرير حديث لشبكة CNBC. يمكن لعملاق البحث استخدام نماذج لغوية كبيرة (LLMs)، مثل نموذج Gemini متعدد الوسائط الذي تم الكشف عنه مؤخرًا، كجزء من مشروع جديد للذكاء الاصطناعي. يتم الترويج لـ Gemini للتنافس مع نموذج GPT-4 الخاص بـ OpenAI، وتدعي Google أن نموذجها الأفضل يتفوق على أقرب منافس لها في بعض المعايير.
يشير تقرير CNBC الذي يستشهد بالوثائق الداخلية إلى أن أحد فرق الذكاء الاصطناعي في Google اقترح أن تقوم الشركة بتطوير تقنية قائمة على الذكاء الاصطناعي لاستخدام البيانات من الهواتف الذكية للمستخدمين – بما في ذلك الصور ونشاط البحث الخاص بهم – والتي سيتم استهلاكها بواسطة روبوت الدردشة الذي يعمل بالذكاء الاصطناعي. . ويمكن للمشروع، الذي يطلق عليه اسم مشروع إيلمان، بعد ذلك استخدام المعلومات لتقديم إجابات على “الأسئلة المستحيلة سابقًا”، وفقًا للتقرير.
بدلاً من الاعتماد ببساطة على “وحدات البكسل التي تحتوي على تسميات وبيانات وصفية فقط”، سيحاول مشروع Ellman اكتشاف الأنماط في صور المستخدم، ودراسة الصور والذكريات قبل الصورة وبعدها للحصول على السياق، وفقًا للتقرير. وتنص الوثيقة الداخلية للشركة أيضًا على أن تصبح “Ellman Chat” “راوي قصة حياتك”.
تقوم Google حاليًا بجمع صور المستخدم المخزنة على خوادم الشركة كجزء من ميزة النسخ الاحتياطي والمزامنة لصور Google. ولم تحدد الشركة ما إذا كان مصدر البيانات سيكون من صور Google التي تمت مزامنتها مع السحابة، أو ما إذا كانت الصور ستتم معالجتها على جهاز المستخدم.
“لقد كان هذا استكشافًا داخليًا مبكرًا، وكما هو الحال دائمًا، إذا قررنا طرح ميزات جديدة، فسوف نأخذ الوقت اللازم للتأكد من أنها مفيدة للأشخاص، وأنها مصممة لحماية خصوصية المستخدمين وسلامتهم باعتبارها أولويتنا القصوى”. وقال متحدث باسم الشركة للنشر.
ليس من الواضح ما إذا كانت جوجل تعمل بنشاط على إضافة دعم لمثل هذا الروبوت المخصص للدردشة المدعم بالذكاء الاصطناعي والذي يعتمد على نماذج Gemini AI الجديدة، والتي كشفت عنها الشركة الأسبوع الماضي. لن يكون أقوى نموذج من Google – Gemini Ultra – متاحًا حتى العام المقبل وهو قادر على التفوق على نموذج OpenAI’s GPT-4 في بعض الاختبارات، وفقًا لـ Google.