آنتروپیک نسخه جدید مدل پرچمدار خودش یعنی Claude Opus 4.8 را معرفی کرده؛ مدلی که طبق گزارش The New Stack، نسبت به نسخه قبلی یعنی Opus 4.7 پیشرفتهای مهمی داشته و حالا در بیشتر بنچمارکها از GPT-5.5 و Gemini 3.1 Pro جلو زده. البته در بخش کدنویسی ترمینالی ایجنتیک، مدل اوپنایآی هنوز برتری خودش را حفظ کرده.
نکته مهم اینجاست که Opus 4.8 با همان قیمت نسخه 4.7 عرضه شده، اما چند قابلیت تازه گرفته که میتونه برای توسعهدهندهها و کاربرهای حرفهای خیلی کاربردی باشه.

مهمترین تغییر Opus 4.8؛ حالا میتونی میزان تلاش Claude را تنظیم کنی
یکی از قابلیتهای جدیدی که آنتروپیک به Opus 4.8 اضافه کرده، امکان کنترل میزان تلاش مدل است. یعنی کاربرها حالا میتونن مشخص کنن Claude برای انجام یک کار چقدر انرژی و دقت صرف کنه.
اگر کسی بخواد پاسخ دقیقتر و عمیقتری بگیره، میتونه مدل را روی حالت پرتلاشتر قرار بده تا بیشتر فکر کنه و با جزئیات بیشتری جواب بده. از آن طرف، اگر سرعت مهمتر باشه، میشه تلاش مدل را کمتر کرد تا پاسخها سریعتر آماده بشن و Rate Limit هم دیرتر مصرف بشه.
این تغییر برای کاربرهایی که حس میکنن مدلهای هوش مصنوعی نسبت به قبل محدودتر یا کمجانتر شدن، میتونه خبر خوبی باشه.
Claude حالا از پس پروژههای بزرگتر کدنویسی هم برمیاد
آنتروپیک در Opus 4.8 یک قابلیت تازه به نام Dynamic Workflows هم اضافه کرده که فعلاً در حالت Research Preview قرار داره. این ویژگی به Claude Code کمک میکنه پروژههای خیلی بزرگتر و پیچیدهتر را مدیریت کنه.

Dynamic Workflows دقیقاً چه کاری میکنه؟
با این قابلیت، کاربر میتونه از Claude بخواد اول برای انجام کار برنامهریزی کنه و بعد صدها زیرایجنت را بهصورت همزمان در یک سشن اجرا کنه. بعد از آن هم مدل خروجیها را بررسی میکنه و نتیجه نهایی را تحویل میده.
آنتروپیک برای توضیح این قابلیت، مثال مهاجرت کدبیسهای بزرگ را زده؛ یعنی Claude Code با Opus 4.8 میتونه روی صدها هزار خط کد کار کنه و فرایند را از شروع تا ادغام نهایی جلو ببرد. این موضوع نشون میده آنتروپیک میخواد Claude را بیشتر از قبل وارد جریانهای کاری جدی و سازمانی کنه.
Fast Mode حالا خیلی ارزانتر شده
یکی دیگر از تغییرات مهم Opus 4.8 به Fast Mode مربوط میشه. این حالت که مدل را با سرعت ۲.۵ برابر نسبت به حالت عادی اجرا میکنه، حالا طبق گفته آنتروپیک سه برابر ارزانتر از قبل شده.
این یعنی اگر کسی بخواد پاسخ سریع بگیره، دیگر لازم نیست مثل قبل هزینه بالایی پرداخت کنه. برای توسعهدهندهها، تیمهای فنی و کسبوکارهایی که با حجم بالایی از درخواست سروکار دارن، این تغییر میتونه خیلی مهم باشه.
آنتروپیک میگه Opus 4.8 صادقتر شده و کمتر فریب میده
آنتروپیک فقط روی تواناییهای فنی Opus 4.8 تمرکز نکرده و میگه این مدل از نظر رفتاری هم بهتر شده. به گفته تیم Alignment این شرکت، Opus 4.8 در حمایت از استقلال کاربر و تصمیمگیری به نفع او عملکرد بهتری داره.
از طرف دیگر، آنتروپیک میگه نرخ فریبکاری و همکاری این مدل با سوءاستفاده، نسبت به نسخههای قبلی بهطور محسوسی پایینتر آمده. این یعنی مدل جدید قرار است هم مفیدتر باشه و هم از نظر ایمنی، قابل اعتمادتر عمل کنه.

Opus 4.8 در پیدا کردن ایرادهای کد هم بهتر شده
یکی دیگر از ادعاهای مهم آنتروپیک اینه که Opus 4.8 در زمان کدنویسی، صداقت بیشتری از خودش نشون میده. این شرکت میگه نسخه جدید حدود چهار برابر کمتر از نسخه قبلی اجازه میده ایرادهای کدی که خودش نوشته، بدون اشاره باقی بمونن.
تستکنندههای اولیه هم گفتهاند این مدل در انجام کارهای ایجنتیک، هم قابل اعتمادتر شده و هم قضاوت دقیقتری داره. برای کاربرهایی که از مدلهای هوش مصنوعی انتظار خروجی جدی و حرفهای دارن، این بخش میتونه یکی از مهمترین پیشرفتهای Opus 4.8 باشه.
عملکرد Claude Opus 4.8 در بنچمارکها چطور بوده؟
طبق اطلاعاتی که آنتروپیک منتشر کرده، Opus 4.8 تقریباً در همه بنچمارکها نسبت به Opus 4.7 بهتر عمل کرده و در چند شاخص مهم از GPT-5.5 و Gemini 3.1 Pro هم جلو افتاده.

مقایسه در کدنویسی ایجنتیک
در بخش Agentic Coding، Opus 4.8 امتیاز ۶۹.۲ درصد را ثبت کرده. این در حالی است که:
- Opus 4.7 امتیاز ۶۴.۳ درصد
- GPT-5.5 امتیاز ۵۸.۶۵ درصد
- Gemini 3.1 Pro امتیاز ۵۴.۲ درصد
را به دست آوردهاند.
مقایسه در استفاده ایجنتیک از محاسبات
در بخش Agentic Compute Use هم Opus 4.8 با امتیاز ۸۳.۴ درصد بالاتر از رقبایش قرار گرفته:
- GPT-5.5 با ۷۸.۷ درصد
- Gemini 3.1 Pro با ۷۶.۲ درصد
البته در بخش Agentic Terminal Coding، مدل اوپنایآی هنوز جلوتر است و Opus 4.8 در این قسمت حدود ۳.۶ درصد پایینتر از GPT-5.5 قرار گرفته.
مسیر پر فراز و نشیب سری Opus در یک سال گذشته
آنتروپیک در مه ۲۰۲۵ مدل Opus 4 را در رویداد Code with Claude معرفی کرد و آن زمان از آن بهعنوان «بهترین مدل کدنویسی جهان» یاد شد. بعد از آن، نسخههای Opus 4.1، Opus 4.5، Opus 4.6 و Opus 4.7 یکی بعد از دیگری منتشر شدند.
هرکدام از این نسخهها در بخشهایی مثل کدنویسی، استدلال، حافظه، درک بهتر دستورها و مدیریت وظایف پیچیده پیشرفتهایی داشتن. مثلاً Opus 4.6 با پنجره کانتکست یک میلیون توکنی معرفی شد و آنتروپیک روی آمادگی بیشتر آن برای استفاده در محیطهای واقعی و سازمانی تأکید داشت.
اما همه چیز هم برای آنتروپیک خوب پیش نرفت

در کنار این پیشرفتها، بعضی از نسخههای قبلی Opus با انتقادهایی هم روبهرو شدند. برای مثال، بعد از عرضه Opus 4.6 برخی کاربران از تغییرات قیمتگذاری در کانتکستهای طولانی ناراضی بودند. از آن طرف، Opus 4.7 هم با گزارشهایی درباره افت عملکرد و پاسخهای متناقض روبهرو شد.
حتی خود آنتروپیک هم گفته بود Opus 4.7 از نظر توانایی کلی، از Claude Mythos Preview ضعیفتر است. برای همین، معرفی Opus 4.8 را میشه تلاشی برای جبران بخشی از این انتقادها هم دانست.
بعد از Opus 4.8 نوبت به Sonnet 4.8 و Mythos 1 میرسه؟
جالب اینجاست که شایعههایی که پیش از معرفی Opus 4.8 منتشر شده بودند، زمان عرضه این مدل را درست پیشبینی کرده بودند. همان شایعهها حالا میگویند آنتروپیک احتمالاً بهزودی از Sonnet 4.8 و Mythos 1 هم رونمایی میکنه.
اگر این اتفاق بیفته، رقابت بین آنتروپیک، اوپنایآی و گوگل وارد مرحله تازهای میشه؛ مخصوصاً حالا که شرکتها بیشتر از همیشه روی مدلهای سریعتر، دقیقتر و کمهزینهتر تمرکز کردهاند.
جمعبندی
Claude Opus 4.8 آمده تا نشان بده آنتروپیک هنوز میخواهد یکی از بازیگرهای اصلی بازار مدلهای پیشرفته هوش مصنوعی باقی بمونه. امکان تنظیم میزان تلاش مدل، توانایی بهتر در پروژههای بزرگ کدنویسی، Fast Mode ارزانتر، صداقت بیشتر و کاهش رفتارهای فریبنده، مهمترین تغییراتی هستند که این نسخه را نسبت به قبل متمایز میکنن.
حالا باید دید این پیشرفتها در استفاده واقعی هم به همان اندازهای که در بنچمارکها دیده میشن، اثرگذار خواهند بود یا نه.
اگر دوست داری از اخبار روز هوش مصنوعی و مدلهایی مثل Claude، GPT و Gemini باخبر باشی، کافیه به صفحه اخبار وبسایت رامون طالع سر بزنی!