هوش مصنوعی Grok به روز شده ایلان ماسک ادعا می کند که در کدنویسی و ریاضی بهتر است

پاسخ ایلان ماسک به ChatGPT دریافت به‌روزرسانی برای بهتر کردن آن در ریاضیات، کدنویسی و موارد دیگر است. xAI ماسک Grok-1.5 را با «قابلیت‌ها و استدلال بهبودیافته» و توانایی پردازش زمینه‌های طولانی‌تر برای آزمایش‌کنندگان اولیه راه‌اندازی کرده است. این شرکت ادعا می کند که اکنون در چندین زمینه با GPT-4، Gemini Pro 1.5 و Claude 3 Opus مقابله می کند.

با توجه به اعداد xAI، به نظر می رسد Grok-1.5 پیشرفت بزرگی نسبت به Grok-1 باشد. در معیار ریاضی به 50.6 درصد رسید که بیش از دو برابر امتیاز قبلی است. همچنین در GSM8K (مشکلات کلمات ریاضی) و HumanEval (کدگذاری) به ترتیب به 90 درصد و 74.1 درصد در مقایسه با 62.9 درصد و 63.2 درصد قبل صعود کرد. این اعداد در فاصله‌ای از Gemini Pro 1.5، GPT-4 و Claude 3 Opus قرار دارند – در واقع، امتیاز کدنویسی HumanEval همه رقبای خود را به جز Claude 3 Opus شکست می‌دهد.

جدیدترین فناوری Grok AI ایلان ماسک، قابلیت‌های کدنویسی و ریاضی را افزایش می‌دهد — xAI

همچنین می‌تواند زمینه‌های طولانی تا 128 هزار توکن را در پنجره زمینه خود پردازش کند، به این معنی که می‌تواند داده‌های منابع بیشتری را برای درک یک موقعیت ترکیب کند. این شرکت می‌گوید: «این به Grok اجازه می‌دهد تا ۱۶ برابر طول زمینه قبلی، ظرفیت حافظه بیشتری داشته باشد، و آن را قادر می‌سازد از اطلاعات اسناد بسیار طولانی‌تر استفاده کند».

xAI جزئیات پیشرفت Grok را در سایر زمینه‌ها بیان نکرد، جایی که ممکن است هنوز عقب باشد (نمرات تحصیلی، چندوجهی و موارد دیگر). و Grok-1.5 ممکن است موقعیت خود را برای مدت طولانی حفظ نکند. به گفته OpenAI، ChatGPT 5 قرار است در تابستان امسال عرضه شود، و نوید مجموعه ای از ویژگی هایی را می دهد که “این احساس را ایجاد می کند که شما با یک شخص به جای یک ماشین ارتباط برقرار می کنید.”

در حال حاضر، Grok فقط برای کاربران لایه Premium+ در X (توئیتر سابق) در دسترس است، اگرچه ایلان ماسک اخیراً قول داده است که آن را برای کاربران معمولی Premium X باز کند. این شرکت همچنین اخیراً پس از شکایت ماسک از OpenAI و Sam Altman به دلیل اینکه مأموریت غیرانتفاعی خود را رها کرده اند، چت ربات Grok خود را منبع باز کرد.

منبع

Steve Dent