اگر پیگیر اخبار هوش مصنوعی هستید، امروز یه خبر فوقالعاده جذاب براتون داریم. شرکت OpenAI به تازگی از آپدیت چت جی بی تی 5.4 رونمایی کرده که قراره معادلات رو حسابی به هم بریزه. این مدل رو به عنوان کارآمدترین و قویترین مدل خودشون برای کارهای حرفهای معرفی کردن.
به گفته اوپنایآی، این نسخه بهترین پیشرفتها تو زمینه استدلال، کدنویسی و کار با نرمافزارها رو یکجا جمع کرده. یعنی حالا میتونید کارهای پیچیده واقعی مثل مدیریت فایلهای سنگین اکسل (اسپردشیتها)، ارائهها و اسناد رو با دقت بسیار بالا و سریع انجام بدید.
این مدل علاوه بر نسخه استاندارد، تو دو تا نسخه دیگه هم عرضه شده:
● نسخه Thinking: مخصوص استدلال و پردازشهای فکری پیچیده.
● نسخه Pro: بهینهسازی شده برای بالاترین سطح عملکرد حرفهای.
بزرگترین تغییر در آپدیت چت جی بی تی 5.4: حافظه یک میلیون توکنی!
شاید باورتون نشه، اما بزرگترین خبر در مورد این نسخه، پشتیبانی API این مدل از پنجره متنی به بزرگی 1,000,000 توکنه! این یعنی بزرگترین حافظه ورودی در لحظهای که اوپنایآی تا حالا ساخته. جالبتر اینجاست که در آپدیت چت جی بی تی 5.4، با وجود این حجم از ورودی، سیستم خیلی کارآمدتر شده و میتونه همون درخواستهای قبلی رو با توکنهای خیلی کمتری حل کنه.

دقیقتر، باهوشتر و با خطای کمتر
یکی از روی اعصابترین چیزها تو کار با هوش مصنوعی، همون «توهم» یا اطلاعات غلط دادن مدلهاست. اوپنایآی تو این آپدیت حسابی روی این نقطه ضعف کار کرده:
کاهش چشمگیر خطا در اپدیت چت جی بی تی 5.4
این مدل نسبت به نسخه ۵.۲ تا 33 درصد تو ادعاهای فردی کمتر اشتباه میکنه و احتمال وجود خطا تو جوابهای کلیش هم 18 درصد کمتر شده.
امتیازهای خیرهکننده: تو آزمونهای سنجش دانش مثل آزمون GDPval تونسته به امتیاز بیسابقه 83 درصد برسه و تو بنچمارکهای سختی مثل OSWorld-Verified و WebArena Verified هم ترکونده.
سیستم جدید Tool Search: سریعتر و ارزانتر
تو آپدیت چت جی بی تی 5.4 یه تغییر جذاب تو نحوه ارتباط مدل با برنامهها و ابزارهای بیرونی ایجاد شده. قبلاً وقتی مدل میخواست از ابزارهای بیرونی استفاده کنه، پیامهای سیستم باید همون اول توضیحات همه ابزارها رو بهش میدادن که اینطوری کلی توکن هدر میرفت.
اما الان با معرفی سیستم جدیدی به اسم Tool Search، مدل فقط وقتی به یه ابزار نیاز داره میره تعاریفش رو جستجو میکنه. نتیجه این کار چیه؟ پردازش درخواستها تو سیستمهایی که ابزارهای زیادی دارن، خیلی سریعتر و ارزونتر انجام میشه.
امنیت و شفافیت در فکر کردن
پژوهشگران همیشه نگران این بودن که مدلهای استدلالی ممکنه مسیر فکر کردنشون (زنجیره فکری) رو مخفی کنن یا ما رو فریب بدن. اوپنایآی یه سیستم ارزیابی ایمنی جدید برای بررسی این موضوع طراحی کرده. خبر خوب اینه که آزمایشها نشون میده احتمال فریبکاری تو نسخه Thinking این مدل خیلی کمه و این هوش مصنوعی نمیتونه استدلالهای خودش رو پنهان کنه؛ پس نظارت بر روی اون همچنان یک روش ایمنی مؤثر به حساب میاد.
متن این خبر با استفاده از گزارش رسانه زومیت آماده شد!
فراموش نکن میتونی از وبسایت رامون طالع اخبار روز هوش مصنوعی و یوتیوب رو دنبال کنی!