بالاخره گوگل با مدل هوش مصنوعی Veo 3.1 وارد صحنه شده تا بازی تولید ویدیو رو حسابی عوض کنه! دیگه دوران ویدیوهای بیصدا و رباتگونه تموم شده. هوش مصنوعی Veo 3.1 در واقع نسخه ارتقاءیافته Veo 3 هست که تیم DeepMind گوگل روش کار کرده و یه شاهکار به تمام معناست. مهمترین قابلیت این مدل؟ اینه که ویدیو رو با صدای بومی و هماهنگ میسازه!
یعنی نه فقط تصویر، بلکه دیالوگها و صدای محیط رو هم خود هوش مصنوعی Veo 3.1 تولید میکنه. اگه دنبال ساخت محتوای ویدیویی خفن، واقعگرایانه و با کنترل کامل هستید، باید بگم در این مقاله از سایت رامون طالع هوش مصنوعی Veo 3.1 همون چیزیه که منتظرش بودید. بیایید ببینیم این مدل جدید گوگل چه قابلیتهایی رو توی چنته داره.
عنوان های این مقاله
ویدیو رو با صدا بگیرید!

مهمترین ویژگی هوش مصنوعی Veo 3.1 که اونو از بقیه مدلها متمایز میکنه، قابلیت تولید صدای بومی (Native Audio Generation) هست.
- صدا و تصویر همزمان: با هوش مصنوعی Veo 3.1 کافیه تو پرامپت (دستور) بگید “یه زن کنار دریا داره میخنده و صدای موج میاد”؛ Veo 3.1 نه تنها تصویر رو میسازه، بلکه صدای خنده و صدای موج رو هم دقیقاً هماهنگ با صحنه تولید میکنه.
- جلوههای صوتی و دیالوگ: شما میتونید دیالوگ یا هر نوع جلوه صوتی خاصی (مثل صدای رعد و برق، صدای ماشین، یا نویز محیطی) رو تو دستور متنی به هوش مصنوعی Veo 3.1 بدید و اون هم همون رو اجرا میکنه.
- واقعگرایی مضاعف: این ویژگی باعث شده هوش مصنوعی Veo 3.1 ویدیوهای به مراتب واقعگرایانهتری نسبت به قبل بسازه.
کیفیت خفن و کنترل سینمایی Veo 3.1
هوش مصنوعی Veo 3.1 فقط یه ابزار ساده نیست؛ یه کارگردان هوشمنده! کنترلهای خلاقانهای که Veo 3.1 در اختیار میذاره، کار رو برای هر تولیدکنندهای آسون میکنه:
- فیزیک و نورپردازی حرفهای: هوش مصنوعی Veo 3.1 درک بهتری از قوانین فیزیک دنیای واقعی داره. یعنی سایهها، انعکاس نور و حرکت اشیاء خیلی طبیعی و درست از آب درمیاد.
- کنترل کاراکترها: برای حفظ ظاهر یک کاراکتر یا یک شیء در طول یک کلیپ یا در نماهای مختلف، میتونید تا ۳ تا تصویر مرجع به هوش مصنوعی Veo 3.1 بدید. این قابلیت تو مدل Veo 3 نبود و برای داستانگویی مداوم فوقالعادهست.
- تغییر نماهای روان (Transitions): میتونید یه عکس به عنوان فریم اول و یه عکس دیگه به عنوان فریم آخر به Veo 3.1 بدید تا خودش کل ویدیوی بین این دو تا رو بسازه و یه انتقال نرم و سینمایی ایجاد کنه.
- ویدیوهای طولانیتر: با قابلیت “Scene Extension” میتونید ویدیویی رو که با هوش مصنوعی ساختید، تا چند دقیقه ادامه بدید؛ Veo 3.1 خودش تداوم بصری و صوتی رو حفظ میکنه.
ویرایش حرفهای در ابزار Flow گوگل
هوش مصنوعی Veo 3.1 در قلب ابزار Flow گوگل کار میکنه و اینجا میتونید جادوی ویرایش رو ببینید:
- اضافه کردن هوشمند (Insert): میتونید به سادگی یه شیء جدید رو تو هر جای ویدیو قرار بدید. Flow به قدری هوشمنده که خودش نور و سایه اون شیء جدید رو با محیط ویدیو تنظیم میکنه تا غیرطبیعی به نظر نرسه. این یعنی Veo 3.1 فقط سازنده نیست، بلکه ویرایشگر هم هست.
- حذف اشیاء ناخواسته: اگه چیزی یا کسی تو ویدیو هست که دوست ندارید باشه، به سادگی میتونید حذفش کنید. هوش مصنوعی با قدرت Veo 3.1 پسزمینه رو بازسازی میکنه و انگار نه انگار که چیزی اونجا بوده!
- فرمتهای موبایلی: هوش مصنوعی از نسبتهای تصویر ۹:۱۶ و ۱۶:۹ هم پشتیبانی میکنه، که برای ساخت ریلز، شورتها و محتوای موبایلی عالیه.
دسترسی به هوش مصنوعی Veo 3.1 و آیندهاش
هوش مصنوعی Veo 3.1 در حال حاضر از طریق چند پلتفرم در دسترس قرار گرفته:
- اپلیکیشن و API جمنی (Gemini): توسعهدهندهها میتونن از Veo 3.1 تو برنامههای خودشون استفاده کنن.
- Google AI Studio و Vertex AI: پلتفرمهای تخصصی گوگل برای حرفهایها.
- Flow: ابزار اصلی فیلمسازی با هوش مصنوعی گوگل.
با عرضه قدرتمند هوش مصنوعی Veo 3.1، گوگل نشون داد که قصد داره جدیترین رقیب برای مدلهایی مثل Sora باشه. این مدل با تمرکز روی صدا و کنترلهای حرفهای، قراره تعریف ما از تولید محتوای ویدیویی رو عوض کنه و کار رو برای همه، از فیلمسازان حرفهای تا تولیدکنندههای محتوای روزانه، آسون کنه.
نتیجهگیری
به طور خلاصه، هوش مصنوعی یه پیشرفت خیلی مهم تو دنیای هوش مصنوعی مولد هست. این مدل با آوردن صدای بومی، ارتقای واقعگرایی و دادن کنترل خلاقانه بیشتر، به کاربران این امکان رو میده که بدون نیاز به تجهیزات گران قیمت یا دانش فنی بالا، ویدیوهای سینمایی و باکیفیت تولید کنن. Veo 3.1 دیگه فقط یه ابزار تبدیل متن به ویدیو نیست؛ یه پلتفرم کامل برای داستانگویی دیجیتال هست که مرز بین واقعیت و محتوای ساخته شده با هوش مصنوعی رو خیلی باریکتر کرده. به نظر میاد رقابت اصلی تو حوزه تولید ویدیو تازه شروع شده، و هوش مصنوعی Veo 3.1 گوگل یکی از مدعیان اصلی پادشاهی این میدونه.
سوالات متداول
تفاوت Veo 3.1 با Veo 3 چیه؟
تفاوت اصلی هوش مصنوعی Veo 3.1 با Veo 3، اضافه شدن قابلیت تولید صدای بومی (Native Audio) هست که همزمان با تولید تصویر، صدای هماهنگ و واقعی رو هم تولید میکنه. علاوه بر این، هوش مصنوعی Veo 3.1 از نظر واقعگرایی، پیروی از دستورات (پرامپت) و ابزارهای ویرایشی پیشرفتهتر شده.
آیا هوش مصنوعی Veo 3.1 میتونه ویدیوهای طولانی بسازه؟
بله. با استفاده از قابلیت “Scene Extension” در هوش مصنوعی Veo 3.1، میتونید ویدیویی رو که قبلاً ساخته شده، فریم به فریم و با حفظ تداوم بصری و صوتی، ادامه بدید و طول کلیپ رو به یک دقیقه یا حتی بیشتر برسونید.
چطور میتونم کاراکترهای ویدیوم رو ثابت نگه دارم؟
هوش مصنوعی Veo 3.1 قابلیت “Multi-Image Reference” رو داره. شما میتونید تا ۳ تصویر از کاراکتر یا شیء مورد نظرتون رو به مدل بدید تا Veo 3.1 از اونها به عنوان مرجع استفاده کنه و ظاهر کاراکتر رو در نماهای مختلف ثابت نگه داره.
چطور میتونم از Veo 3.1 استفاده کنم؟
هوش مصنوعی Veo 3.1 از طریق ابزارهایی مثل Flow گوگل، اپلیکیشن Gemini و برای توسعهدهندهها از طریق Gemini API و پلتفرمهای Cloud گوگل (مثل Vertex AI) قابل دسترسه.
کیفیت ویدیوهای تولید شده با هوش مصنوعی Veo 3.1 چقدره؟
هوش مصنوعی Veo 3.1 میتونه ویدیوها رو با وضوحهای 720p و 1080p تولید کنه. به لطف بهبودهای انجام شده در فیزیک، نورپردازی و بافتها، کیفیت خروجی این مدل، بسیار سینمایی و واقعگرایانه هست.


