گوگل بالاخره شاهکار خودش به اسم جمینی اومینی رو معرفی کرد! این مدل قراره بازی تولید و ادیت ویدیو رو کلاً عوض کنه! با این مدل میتونی از هر ورودی سادهای (متن، عکس یا صدا) یه ویدیوی خفن و بینظیر خلق کنی. هوش مصنوعی Gemini Omni دقیقاً همون چیزیه که بهش نیاز داری. تمرکز اصلی نسخه اولیه این مدل که اسمش Gemini Omni Flash هست، روی ساخت و ویرایش ویدیوئه و بهت اجازه میده بدون نیاز به سیستمهای غولپیکر یا مهارتهای سخت تدوین، ایدههاتو واقعی کنی.
عنوان های این مقاله
داستان از چه قراره؟ آشنایی با غول جدید گوگل
یادتونه سال قبل وقتی مدل تولید تصویر گوگل یعنی Nano Banana معرفی شد چقدر تو دنیای تکنولوژی سروصدا کرد؟ همون مدلی که باعث شد هوش مصنوعی جمینی وارد دنیای تولید و ادیت تصویر بشه و میلیونها نفر برای زنده کردن عکسهای قدیمی و تصویرسازی ایدههاشون ازش استفاده کردن.
حالا گوگل یه قدم خیلی بزرگتر برداشته. از اونجایی که جمینی از همون روز اول چندوجهی (Multimodal) ساخته شده بود، حالا با معرفی جمینی اومینی وارد یه مرحله جدید و هیجانانگیز شده. هوش مصنوعی Gemini Omni قدرت استدلال (Reasoning) رو با قدرت خلق کردن ترکیب کرده تا ویدیوهایی بسازه که هم کیفیت سینمایی دارن و هم کاملاً بر اساس منطق دنیای واقعی کار میکنن.
جادوی هوش مصنوعی Gemini Omni؛ قدرتی که باورش سخته!
فقط با صحبت در قالب ویس چت ویدیو بساز!
یکی از جذابترین ویژگیهای جمینی اومینی اینه که میتونی مثل یه کارگردان باهاش حرف بزنی و ویدیو رو ادیت کنی! میتونی تو چند مرحله با مدل چت کنی و ازش بخوای تغییراتی تو ویدیو بده. نکته فوقالعادهاش اینه که هر دستور روی دستور قبلی سوار میشه؛ یعنی حافظه صحنه حفظ میشه، شخصیتها همون میمونن و خط اصلی داستان وسط چت کردن گم نمیشه.
درک عمیق Omni از دنیای واقعی و فیزیک
هوش مصنوعی Gemini Omni درک خیلی بالایی از قوانین فیزیک مثل جاذبه، انرژی و حرکت مایعات داره. این یعنی ویدیوهایی که میسازه فیک و عجیبوغریب نیستن و کاملاً با دنیای واقعی جور در میان. مثلا میتونی با یک پرامپمت ساده یک ویدیو بسازی از موزیک نواختن یک زن و همه چیز از صدا تا حرکت دوربین برات اماده میشه!
برگ برنده این مدل قدرت بالاش توی ادیت و ویرایش ویدیو ها فقط با یک پرامپته،براش فرقی ندار هاین ویدیو ساخته ابزارهای هوش مصنوعی هستش تو یک استدیو حرفه ضبط شده یا حتی توسط ی بلاگر ساده با ی گوشی و فقط توی اتاقش ضبظ شده با جمینی اومینی میتونی به راحتی بکگراند ویدیو خودت رو تغییر بدی
مدل نه تنها بکگراند رو بینقص عوض میکنه، بلکه تار موها، لبههای لباس و سوژه اصلی رو با دقت پیکسلی حفظ میکنه.
ادیتور های ویدیو میدونن تغییر بکگراند ویدیو هایی که حتی با تجهیزات حرفه ای ضبط شده و از تکنولوژی پرده سبز استفاده میکنن چقدر سخته و علاوه بر نیاز به داشتن تجهیزات حرفهای و زمان زیاد شما باید برای رندر گیری و ویرایش اون ویدیو یک سیستم قدرتمند داشته باشین!
ویرایش جزئیات ویدیو از حذف تا اضافه کردن
یکی دیگه از قابلیت های به شدت جذاب مدل جدید گوگل(Gemini Omni)قابلیت ویرایش جزئیات ویدیو با کیفیت باورنکردنی و بالا فقط با نوشتن یا حتی گفتن اصلاح مورد نیازه،اگر ویدیو موزیک نواختن زن که توسط هوش مصنوعی ساخته شد رو به یک ادیتور حرفهای و متخصص بدیم فکرمیکیند میتونه موفق بشه با یک کیفیت بالا و ویولون رو از دست های اون زن حذف کنه و بقیه عناصر ویدیو بهم نخورن؟!
شاید یک ادیتور نتونه این کارو انجام بده اما مدل جدید گوگل بدون هیچ مشکلی این کار رو هم برای شما میکنه!
تغییر زاویه دوربین با جمینی اومینی
این یکی واقعاً جادوئه! شما یه ویدیوی دارید که از روبهرو گرفته شده، اما از جمینی میخواید زاویه رو تغییر بده. این مدل فضای ویدیو رو به صورت سهبعدی درک میکنه و میتونه یه شات ساده رو از شما به عنوان ورودی دریافت کنه و با حرکت دوربین دلخواه شما از یک زاویه جدید با جزئیات بالا دقیقا همون محیط رو به تصویر بکشه
با این قابلیت Gemini Omni به شکلی نقاط کور و جاهای خالی تصویر رو با جزئیات بالا و درک عمیق از پرسپکتیو بازسازی میکنه که انگار از همون اول چند تا دوربین حرفهای در محورهای مختلف (X,Y,Z) در حال ضبط اون صحنه بودن. با این قابلیت بینظیر، شما عملاً تبدیل به کارگردانی میشید که میتونه حتی بعد از تموم شدن فیلمبرداری، جای دوربینها رو تو فضای مجازی عوض کنه و جذابترین شاتها رو برای مخاطب بسازه!
قدرت بالا تو ساخت CGI حرفهای:
تا قبل از این برای ساخت جلوههای ویژه (CGI) نیاز به تیمهای بزرگ، نرمافزارهای سنگین و رندرهای چند روزه داشتیم. اما حالا جمینی اومینی میتونه افکتهای هالیوودی رو به ویدیوهای ساده شما تزریق کنه. میخواید یه اژدها از پشت ساختمون پرواز کنه و آتیش بکشه؟ یا یه انفجار عظیم با گرد و خاک واقعی پشت سرتون اتفاق بیفته؟ این مدل با درک کامل از ذرات (Particles)، دود، آتش و فیزیک تخریب، CGI رو طوری روی ویدیوهای واقعی شما (Live-Action) میشونه که مرز بین واقعیت و انیمیشن کاملاً محو میشه. این یعنی تولید تیزرهای تبلیغاتی و سینمایی با بودجه صفر!
چیزی که این قابلیت رو خفن میکنه اینه که شما میتونید حتی ویدیوهایی که باگوشی خودتون گرفتین رو به این مدل بدین و ازش بخواین cgi مدنظرتون رو بهش بده و در عرض یک دقیقه جمینی این کار رو هم براتون انجام میده!
ترکیب بینهایت ورودیها
جمینی اومینی میتونه هر رفرنسی (متن، تصویر، ویدیو و صدا) رو بگیره و با هم ترکیبشون کنه. میتونی یه عکس بهش بدی، یه فایل صوتی هم بذاری کنارش و بخوای بر اساس یه متن، همه اینا رو تبدیل به یه ویدیوی جذاب کنه. (البته فعلاً برای صدای ورودی فقط از صدای انسان پشتیبانی میکنه).
امنیت و ساخت آواتار دیجیتال
یه چیز باحال دیگه هم ساخت آواتار دیجیتال با صدای خودته! میتونی یه آواتار از خودت بسازی و بدون اینکه اصلاً جلوی دوربین بری، ویدیوهای باکیفیت با چهره و صدای خودت تولید کنی.
شاید بگی با اینهمه قدرت، حتماً کلی ویدیوی فیک (Deepfake) ساخته میشه. اما گوگل حواسش بوده! تمام ویدیوهایی که جمینی اومینی میسازه یه واترمارک نامرئی به اسم SynthID دارن. این یعنی اصالت ویدیوها راحت تو گوگل کروم و سرچ گوگل قابل تشخیصه.
فرصتهای طلایی پول درآوردن با جمینی اومینی
- تولید محتوا برای یوتیوب: با هوش مصنوعی Gemini Omni میتونی بدون خرید دوربین گرون و تجهیزات نور، ویدیوهای سینماتیک و جذاب بسازی. این ابزار برای زدن کانالهای یوتیوب بدون چهره (Faceless) و ساختن ویدیوهای YouTube Shorts یه معدن طلاست و میتونه خیلی سریع تو رو به درآمد دلاری برسونه. اگر به دنیا هوش مصنوعی علاقه داری پیشنهاد میکنم دوره تخصصی و رایگان ساخت ai ایجنت ها رو از دست ندی!
- ساخت ویدیوهای آموزشی با استفاده از درک فیزیک مدل: به کمک درک بالای این مدل از فیزیک، میتونی مفاهیم سخت علمی رو به ویدیوهای آموزشی خیلی ساده تبدیل کنی. مثلاً پیچیدهترین واکنشهای شیمیایی رو به یه انیمیشن جذاب تبدیل کنی یا با استفاده از خلاقیتت ایده های خفن تری بسازی. اگر دوست داری به صورت تخصصی کار با هوش مصنوعی رو یادبگیری پیشنهاد میکنم مدرسه هوش مصنوعی رو بررسی کنی!
کی و چطوری بهش دسترسی پیدا کنیم؟
اگه بیصبرانه منتظری باهاش کار کنی، خبر خوب اینه که Gemini Omni Flash از همین امروز برای کاربرای سرویسهای پولی گوگل (Plus, Pro, Ultra) تو برنامههای Gemini و Google Flow فعال شده.
از همین هفته هم میتونی تو یوتیوب شورتس (YouTube Shorts) و برنامه YouTube Create کاملاً رایگان ازش استفاده کنی! دولوپرها هم تو هفتههای آینده از طریق API بهش دسترسی پیدا میکنن.
جمینی اومینی (Gemini Omni) دقیقاً چیه؟
جمینی اومینی جدیدترین و خفنترین مدل هوش مصنوعی گوگله که تخصص اصلیش ساخت و ادیت ویدیوئه. این مدل میتونه متن، عکس، صدا و ویدیو رو با هم ترکیب کنه و با درک بالایی که از فیزیک دنیای واقعی داره، ویدیوهای بهشدت طبیعی و جذاب بسازه.
آیا استفاده از هوش مصنوعی Gemini Omni رایگانه؟
بر خوب اینه که بله! بخش مهمی از قابلیتهای این مدل قراره تو یوتیوب شورتس (YouTube Shorts) و اپلیکیشن YouTube Create کاملاً رایگان در دسترس همه قرار بگیره. اما اگه بخواید به نسخه حرفهایتر و کاملترش (Gemini Omni Flash) دسترسی داشته باشید، باید اشتراکهای پولی گوگل (مثل اکانتهای Plus، Pro یا Ultra) رو تهیه کنید.
آیا ویدیوهایی که میسازیم کپیرایت میخورن یا فیک بودنشون تابلوئه؟
ویدیوهای ساخته شده با این مدل خیلی طبیعی هستن، اما گوگل برای امنیت بیشتر، یه واترمارک دیجیتال و نامرئی به اسم SynthID روی تمام خروجیها قرار میده. این کار برای جلوگیری از کلاهبرداری و دیپفیک انجام میشه تا سیستمهای گوگل (مثل کروم و سرچ) بتونن تشخیص بدن ویدیو با هوش مصنوعی ساخته شده. البته این موضوع هیچ مشکلی برای کسب درآمد و انتشار ویدیوتون تو یوتیوب ایجاد نمیکنه.


