پاسخ ایلان ماسک به ChatGPT دریافت بهروزرسانی برای بهتر کردن آن در ریاضیات، کدنویسی و موارد دیگر است. xAI ماسک Grok-1.5 را با «قابلیتها و استدلال بهبودیافته» و توانایی پردازش زمینههای طولانیتر برای آزمایشکنندگان اولیه راهاندازی کرده است. این شرکت ادعا می کند که اکنون در چندین زمینه با GPT-4، Gemini Pro 1.5 و Claude 3 Opus مقابله می کند.
با توجه به اعداد xAI، به نظر می رسد Grok-1.5 پیشرفت بزرگی نسبت به Grok-1 باشد. در معیار ریاضی به 50.6 درصد رسید که بیش از دو برابر امتیاز قبلی است. همچنین در GSM8K (مشکلات کلمات ریاضی) و HumanEval (کدگذاری) به ترتیب به 90 درصد و 74.1 درصد در مقایسه با 62.9 درصد و 63.2 درصد قبل صعود کرد. این اعداد در فاصلهای از Gemini Pro 1.5، GPT-4 و Claude 3 Opus قرار دارند – در واقع، امتیاز کدنویسی HumanEval همه رقبای خود را به جز Claude 3 Opus شکست میدهد.
همچنین میتواند زمینههای طولانی تا 128 هزار توکن را در پنجره زمینه خود پردازش کند، به این معنی که میتواند دادههای منابع بیشتری را برای درک یک موقعیت ترکیب کند. این شرکت میگوید: «این به Grok اجازه میدهد تا ۱۶ برابر طول زمینه قبلی، ظرفیت حافظه بیشتری داشته باشد، و آن را قادر میسازد از اطلاعات اسناد بسیار طولانیتر استفاده کند».
xAI جزئیات پیشرفت Grok را در سایر زمینهها بیان نکرد، جایی که ممکن است هنوز عقب باشد (نمرات تحصیلی، چندوجهی و موارد دیگر). و Grok-1.5 ممکن است موقعیت خود را برای مدت طولانی حفظ نکند. به گفته OpenAI، ChatGPT 5 قرار است در تابستان امسال عرضه شود، و نوید مجموعه ای از ویژگی هایی را می دهد که “این احساس را ایجاد می کند که شما با یک شخص به جای یک ماشین ارتباط برقرار می کنید.”
در حال حاضر، Grok فقط برای کاربران لایه Premium+ در X (توئیتر سابق) در دسترس است، اگرچه ایلان ماسک اخیراً قول داده است که آن را برای کاربران معمولی Premium X باز کند. این شرکت همچنین اخیراً پس از شکایت ماسک از OpenAI و Sam Altman به دلیل اینکه مأموریت غیرانتفاعی خود را رها کرده اند، چت ربات Grok خود را منبع باز کرد.