تقنية وإنترنت

Elon Musk’s xAI يكشف النقاب عن نموذج Grok 1.5 Vision AI في المعاينة، للتنافس مع GPT-4 Vision وGemini Pro 1.5


كشفت شركة الذكاء الاصطناعي (AI) التابعة لشركة Elon Musk عن نموذج جديد للذكاء الاصطناعي يطلق عليه اسم Grok 1.5 Vision. يعد نموذج اللغة الكبير هذا (LLM) نسخة محسنة من نموذج Grok 1.5 الذي تم إصداره مؤخرًا. مع هذه الترقية، أصبح نموذج الذكاء الاصطناعي الآن مزودًا برؤية الكمبيوتر، مما يجعله قادرًا على قبول الوسائط المرئية كمدخلات. يمكنه معالجة الصور والإجابة على الأسئلة المتعلقة بها. والجدير بالذكر أن هذا الإعلان جاء بعد أيام قليلة من تقديم OpenAI لنموذج GPT-4 الذي يعمل برؤية الكمبيوتر.

تم الإعلان عن ذلك عبر حساب X الرسمي (المعروف سابقًا باسم Twitter) لـ xAI. شاركت الشركة منشور مدونة يوضح بالتفصيل نموذج الذكاء الاصطناعي الجديد وشاركت بعضًا من نتائجها المعيارية. ومنذ إضافة قدرات الرؤية إلى طراز Grok 1.5 الذي تم الكشف عنه مؤخرًا، ظلت معظم التفاصيل كما هي. لديها نفس نافذة السياق التي تبلغ 1,28,000 رمزًا ومن المرجح أيضًا أن تظل النتائج القياسية العامة كما هي.

شاركت xAI أيضًا النتائج القياسية لـ Grok 1.5 Vision التي تم اختبارها وفقًا للمعايير التي طورتها الشركة. تطلق عليه شركة الذكاء الاصطناعي اسم RealWorldQA وهو يقيس “الفهم المكاني في العالم الحقيقي”. كما تم اختبار النموذج في العديد من المعايير الأخرى مثل MMMU وMathvista وChartQA والمزيد. بينما تفوق Grok على GPT-4 الخاص بـ OpenAI مع Vision وGemini 1.5 Pro في RealWorldQA، فقد سجل نقاطًا أقل في MMMU وChartQA.

بالنسبة إلى غير العالمين، تعد رؤية الكمبيوتر فرعًا من علوم الكمبيوتر يتعامل مع تجهيز أجهزة الكمبيوتر (ونماذج الذكاء الاصطناعي) بالقدرة على تحديد وفهم الأشياء في العالم الحقيقي باستخدام الصور ومقاطع الفيديو. تم تصميم هذا لمساعدة أجهزة الكمبيوتر على رؤية الإشارات المرئية ومعالجتها بالطريقة التي يفعلها البشر. ومع ظهور نماذج الذكاء الاصطناعي المتعددة الوسائط، تركز العديد من الشركات الآن على تطوير نماذج تركز على الرؤية. يتمتع كل من Google Gemini 1.5 Pro وGPT-4 من OpenAI مع Vision بهذه الإمكانية.

توفر هذه التقنية أيضًا مجموعة واسعة من التطبيقات. أضافت منصة تتبع السعرات الحرارية الهندية وملاحظات التغذية Healthify مؤخرًا ميزة تسمى Snap حيث يمكن للمستخدمين النقر على صورة عنصر غذائي أو مطبخ، ويقترح GPT-4 مع برنامج الدردشة الآلي الذي يعمل بالذكاء الاصطناعي والمدعوم بالرؤية كيف يمكن جعل الوصفة أكثر صحة، ومدى نجاحها. ممارسة يحتاج المرء إلى القيام به لحرق السعرات الحرارية الزائدة. وفي المستقبل، يمكن لنماذج الذكاء الاصطناعي ذات الرؤية الحاسوبية أن تساعد في تشخيص الأمراض، وبناء السيارات ذاتية القيادة، وغير ذلك الكثير.


قد يتم إنشاء الروابط التابعة تلقائيًا – راجع بيان الأخلاقيات الخاص بنا للحصول على التفاصيل.

تعليقات

للحصول على أحدث الأخبار والمراجعات التقنية، تابع Gadgets 360 على Xوالفيسبوك والواتس اب والخيوط وأخبار جوجل. للحصول على أحدث مقاطع الفيديو حول الأدوات والتكنولوجيا، اشترك في قناتنا على YouTube. إذا كنت تريد معرفة كل شيء عن أهم الشخصيات المؤثرة، فاتبع تطبيق Who’sThat360 الداخلي لدينا على Instagram وYouTube.

تهدف Square Enix إلى إطلاق اللعبة الثالثة في ثلاثية Final Fantasy 7 Remake بحلول عام 2027


أبل تخسر مركزها كأفضل صانع للهواتف لصالح سامسونج مع انخفاض شحنات iPhone، بحسب IDC



اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى