90% تخفیف برای همه دوره های تخصصی تا پایان قطعی و محدودیت های اینترنت، هنگام تهیه از کد freenet استفاده کنید.

Claude Opus 4.8 معرفی شد؛ کدنویسی بهتر و ارزان‌تر

خرداد 7, 1405
10:44 ب.ظ

آنتروپیک نسخه جدید مدل پرچمدار خودش یعنی Claude Opus 4.8 را معرفی کرده؛ مدلی که طبق گزارش The New Stack، نسبت به نسخه قبلی یعنی Opus 4.7 پیشرفت‌های مهمی داشته و حالا در بیشتر بنچمارک‌ها از GPT-5.5 و Gemini 3.1 Pro جلو زده. البته در بخش کدنویسی ترمینالی ایجنتیک، مدل اوپن‌ای‌آی هنوز برتری خودش را حفظ کرده.

نکته مهم اینجاست که Opus 4.8 با همان قیمت نسخه 4.7 عرضه شده، اما چند قابلیت تازه گرفته که می‌تونه برای توسعه‌دهنده‌ها و کاربرهای حرفه‌ای خیلی کاربردی باشه.

مقایسه Claude Opus 4.8 با چت جی‌پی‌تی و جمینی

مهم‌ترین تغییر Opus 4.8؛ حالا می‌تونی میزان تلاش Claude را تنظیم کنی

یکی از قابلیت‌های جدیدی که آنتروپیک به Opus 4.8 اضافه کرده، امکان کنترل میزان تلاش مدل است. یعنی کاربرها حالا می‌تونن مشخص کنن Claude برای انجام یک کار چقدر انرژی و دقت صرف کنه.

اگر کسی بخواد پاسخ دقیق‌تر و عمیق‌تری بگیره، می‌تونه مدل را روی حالت پر‌تلاش‌تر قرار بده تا بیشتر فکر کنه و با جزئیات بیشتری جواب بده. از آن طرف، اگر سرعت مهم‌تر باشه، میشه تلاش مدل را کمتر کرد تا پاسخ‌ها سریع‌تر آماده بشن و Rate Limit هم دیرتر مصرف بشه.

این تغییر برای کاربرهایی که حس می‌کنن مدل‌های هوش مصنوعی نسبت به قبل محدودتر یا کم‌جان‌تر شدن، می‌تونه خبر خوبی باشه.

Claude حالا از پس پروژه‌های بزرگ‌تر کدنویسی هم برمیاد

آنتروپیک در Opus 4.8 یک قابلیت تازه به نام Dynamic Workflows هم اضافه کرده که فعلاً در حالت Research Preview قرار داره. این ویژگی به Claude Code کمک می‌کنه پروژه‌های خیلی بزرگ‌تر و پیچیده‌تر را مدیریت کنه.

Dynamic Workflows دقیقاً چه کاری می‌کنه؟

با این قابلیت، کاربر می‌تونه از Claude بخواد اول برای انجام کار برنامه‌ریزی کنه و بعد صدها زیرایجنت را به‌صورت هم‌زمان در یک سشن اجرا کنه. بعد از آن هم مدل خروجی‌ها را بررسی می‌کنه و نتیجه نهایی را تحویل میده.

آنتروپیک برای توضیح این قابلیت، مثال مهاجرت کدبیس‌های بزرگ را زده؛ یعنی Claude Code با Opus 4.8 می‌تونه روی صدها هزار خط کد کار کنه و فرایند را از شروع تا ادغام نهایی جلو ببرد. این موضوع نشون میده آنتروپیک می‌خواد Claude را بیشتر از قبل وارد جریان‌های کاری جدی و سازمانی کنه.

Fast Mode حالا خیلی ارزان‌تر شده

یکی دیگر از تغییرات مهم Opus 4.8 به Fast Mode مربوط میشه. این حالت که مدل را با سرعت ۲.۵ برابر نسبت به حالت عادی اجرا می‌کنه، حالا طبق گفته آنتروپیک سه برابر ارزان‌تر از قبل شده.

این یعنی اگر کسی بخواد پاسخ سریع بگیره، دیگر لازم نیست مثل قبل هزینه بالایی پرداخت کنه. برای توسعه‌دهنده‌ها، تیم‌های فنی و کسب‌وکارهایی که با حجم بالایی از درخواست سروکار دارن، این تغییر می‌تونه خیلی مهم باشه.

آنتروپیک میگه Opus 4.8 صادق‌تر شده و کمتر فریب میده

آنتروپیک فقط روی توانایی‌های فنی Opus 4.8 تمرکز نکرده و میگه این مدل از نظر رفتاری هم بهتر شده. به گفته تیم Alignment این شرکت، Opus 4.8 در حمایت از استقلال کاربر و تصمیم‌گیری به نفع او عملکرد بهتری داره.

از طرف دیگر، آنتروپیک میگه نرخ فریب‌کاری و همکاری این مدل با سوءاستفاده، نسبت به نسخه‌های قبلی به‌طور محسوسی پایین‌تر آمده. این یعنی مدل جدید قرار است هم مفیدتر باشه و هم از نظر ایمنی، قابل اعتمادتر عمل کنه.

هوش مصنوعی Opus 4.8 صادق‌تر شده و کمتر فریب میده — عملکرد کلود اوپوس 4.8 در ازمون فریب‌کاری(misaligned behavior)

Opus 4.8 در پیدا کردن ایرادهای کد هم بهتر شده

یکی دیگر از ادعاهای مهم آنتروپیک اینه که Opus 4.8 در زمان کدنویسی، صداقت بیشتری از خودش نشون میده. این شرکت میگه نسخه جدید حدود چهار برابر کمتر از نسخه قبلی اجازه میده ایرادهای کدی که خودش نوشته، بدون اشاره باقی بمونن.

تست‌کننده‌های اولیه هم گفته‌اند این مدل در انجام کارهای ایجنتیک، هم قابل اعتمادتر شده و هم قضاوت دقیق‌تری داره. برای کاربرهایی که از مدل‌های هوش مصنوعی انتظار خروجی جدی و حرفه‌ای دارن، این بخش می‌تونه یکی از مهم‌ترین پیشرفت‌های Opus 4.8 باشه.

عملکرد Claude Opus 4.8 در بنچمارک‌ها چطور بوده؟

طبق اطلاعاتی که آنتروپیک منتشر کرده، Opus 4.8 تقریباً در همه بنچمارک‌ها نسبت به Opus 4.7 بهتر عمل کرده و در چند شاخص مهم از GPT-5.5 و Gemini 3.1 Pro هم جلو افتاده.

مقایسه در کدنویسی ایجنتیک

در بخش Agentic Coding، Opus 4.8 امتیاز ۶۹.۲ درصد را ثبت کرده. این در حالی است که:

Opus 4.7 امتیاز ۶۴.۳ درصد
GPT-5.5 امتیاز ۵۸.۶۵ درصد
Gemini 3.1 Pro امتیاز ۵۴.۲ درصد

را به دست آورده‌اند.

مقایسه در استفاده ایجنتیک از محاسبات

در بخش Agentic Compute Use هم Opus 4.8 با امتیاز ۸۳.۴ درصد بالاتر از رقبایش قرار گرفته:

GPT-5.5 با ۷۸.۷ درصد
Gemini 3.1 Pro با ۷۶.۲ درصد

البته در بخش Agentic Terminal Coding، مدل اوپن‌ای‌آی هنوز جلوتر است و Opus 4.8 در این قسمت حدود ۳.۶ درصد پایین‌تر از GPT-5.5 قرار گرفته.

مسیر پر فراز و نشیب سری Opus در یک سال گذشته

آنتروپیک در مه ۲۰۲۵ مدل Opus 4 را در رویداد Code with Claude معرفی کرد و آن زمان از آن به‌عنوان «بهترین مدل کدنویسی جهان» یاد شد. بعد از آن، نسخه‌های Opus 4.1، Opus 4.5، Opus 4.6 و Opus 4.7 یکی بعد از دیگری منتشر شدند.

هرکدام از این نسخه‌ها در بخش‌هایی مثل کدنویسی، استدلال، حافظه، درک بهتر دستورها و مدیریت وظایف پیچیده پیشرفت‌هایی داشتن. مثلاً Opus 4.6 با پنجره کانتکست یک میلیون توکنی معرفی شد و آنتروپیک روی آمادگی بیشتر آن برای استفاده در محیط‌های واقعی و سازمانی تأکید داشت.

اما همه چیز هم برای آنتروپیک خوب پیش نرفت

مسیر پر فراز و نشیب سری Opus در یک سال گذشته

در کنار این پیشرفت‌ها، بعضی از نسخه‌های قبلی Opus با انتقادهایی هم روبه‌رو شدند. برای مثال، بعد از عرضه Opus 4.6 برخی کاربران از تغییرات قیمت‌گذاری در کانتکست‌های طولانی ناراضی بودند. از آن طرف، Opus 4.7 هم با گزارش‌هایی درباره افت عملکرد و پاسخ‌های متناقض روبه‌رو شد.

حتی خود آنتروپیک هم گفته بود Opus 4.7 از نظر توانایی کلی، از Claude Mythos Preview ضعیف‌تر است. برای همین، معرفی Opus 4.8 را میشه تلاشی برای جبران بخشی از این انتقادها هم دانست.

بعد از Opus 4.8 نوبت به Sonnet 4.8 و Mythos 1 می‌رسه؟

جالب اینجاست که شایعه‌هایی که پیش از معرفی Opus 4.8 منتشر شده بودند، زمان عرضه این مدل را درست پیش‌بینی کرده بودند. همان شایعه‌ها حالا می‌گویند آنتروپیک احتمالاً به‌زودی از Sonnet 4.8 و Mythos 1 هم رونمایی می‌کنه.

اگر این اتفاق بیفته، رقابت بین آنتروپیک، اوپن‌ای‌آی و گوگل وارد مرحله تازه‌ای میشه؛ مخصوصاً حالا که شرکت‌ها بیشتر از همیشه روی مدل‌های سریع‌تر، دقیق‌تر و کم‌هزینه‌تر تمرکز کرده‌اند.

جمع‌بندی

Claude Opus 4.8 آمده تا نشان بده آنتروپیک هنوز می‌خواهد یکی از بازیگرهای اصلی بازار مدل‌های پیشرفته هوش مصنوعی باقی بمونه. امکان تنظیم میزان تلاش مدل، توانایی بهتر در پروژه‌های بزرگ کدنویسی، Fast Mode ارزان‌تر، صداقت بیشتر و کاهش رفتارهای فریبنده، مهم‌ترین تغییراتی هستند که این نسخه را نسبت به قبل متمایز می‌کنن.

حالا باید دید این پیشرفت‌ها در استفاده واقعی هم به همان اندازه‌ای که در بنچمارک‌ها دیده می‌شن، اثرگذار خواهند بود یا نه.

اگر دوست داری از اخبار روز هوش مصنوعی و مدل‌هایی مثل Claude، GPT و Gemini باخبر باشی، کافیه به صفحه اخبار وب‌سایت رامون طالع سر بزنی!

از MBA تا دنیای واقعی بازار، یک چیز برام روشنه: موفقیت شانسی نیست، ساختنیه، یه روزی باید تصمیم بگیرید و شروع به ساخت کنید. ساخت زمانبره و من در حد خودم اینجا هستم که مخصوصا به نوجوون ها کمک کنم تا ساختن رو با آگاهی، جسارت و نگاه درست شروع کنن.