۳ برگ برنده جدید گوگل در رقابت سنگین هوش مصنوعی

در کنفرانس سالانه Google I/O ۲۰۲۵، گوگل با دست پر به میدان آمد و نشان داد دیگر قصد ندارد قدمبهقدم پیش برود. اینبار، با مجموعهای از ابزارها و مدلهای قدرتمند، بهدنبال تعریف دوبارهای از آینده جستجو، تولید محتوا و هوش مصنوعی است.
در مرکز این تحول، خانواده مدلهای پیشرفته جِمنای (Gemini) قرار دارد؛ مدلی که حالا همه چیز از پاسخ به پرسشهای پیچیده گرفته تا تولید ویدئو و تصویر را زیر بال خود گرفته است.
انقلاب گوگل در تولید ویدئو و تصویر با هوش مصنوعی
گوگل با معرفی Veo 3، پا را فراتر از رقبا گذاشته است. این مدل میتواند نهتنها ویدئویی با کیفیت 4K بسازد، بلکه همزمان موسیقی متن، صدای محیط، افکتهای صوتی و حتی دیالوگها را نیز خلق کرده و با تصویر هماهنگ کند. بهعبارتی، هرچه یک کارگردان برای ساخت یک ویدئوی کامل نیاز دارد، حالا در اختیار یک مدل هوش مصنوعی قرار گرفته است.
جاش وودوارد، معاون آزمایشگاههای گوگل، در مراسم رونمایی گفت: «ما وارد دوران تازهای از تولید ترکیبی تصویر و صدا شدهایم.» و این یعنی رقبایی مثل Sora از OpenAI یا مدلهای Luma و Kling باید خود را برای رقابتی تازه آماده کنند.
در کنار Veo، گوگل از نسخه جدید مدل تصویری خود بهنام Imagen 4 نیز رونمایی کرد؛ مدلی که با وضوح 2K، توانایی رندر واقعی متن (مثلاً روی تابلوها و بستهبندی محصولات) و کیفیت بصری بسیار بالا، تحولی واقعی در تولید تصویر ایجاد میکند.
جستجوی گوگل دیگر فقط لینک نیست
گوگل با نسخه جدید Gemini 2.5، موتور جستجوی خود را از یک ماشین لینکدهنده، به یک دستیار مکالمهمحور تبدیل کرده است. کاربران میتوانند سوالات پیچیدهتری بپرسند و پاسخهایی جامع و چندمنبعی دریافت کنند – بدون اینکه نیاز باشد روی لینکهای مختلف کلیک کنند.
این قابلیت که به آن مرورهای هوش مصنوعی (AI Overviews) گفته میشود، حالا بالاتر از نتایج جستجو ظاهر میشود و طبق اعلام گوگل، بیش از ۱.۵ میلیارد نفر در ماه از آن استفاده میکنند.
اما جذابترین بخش، فناوری جدید Gemini Diffusion است. برخلاف روش رایج autoregressive که متن را کلمهبهکلمه میسازد، این مدل با دادههای تصادفی شروع میکند و در هر مرحله متن را بهبود میدهد. نتیجه؟ سرعتی فوقالعاده در تولید محتوا – چیزی که هنوز رقبایی مثل Anthropic یا OpenAI به آن نرسیدهاند.
مدلهای رایگان برای همه، نسخههای پیشرفته برای حرفهایها
گوگل حالا مثل بسیاری از بازیگران حوزه هوش مصنوعی، از یک مدل اشتراکی استفاده میکند:
- طرح Ultra با قیمت ۲۵۰ دلار در ماه، دسترسی کامل به قویترین مدلها، ابزارهای حرفهای و ۳۰ ترابایت فضای ذخیرهسازی را فراهم میکند؛ هدف اصلی آن، فیلمسازان و تیمهای حرفهای هستند.
- طرح AI Pro با هزینه ۲۰ دلاری، مدلهای نسل قبل مثل Veo 2 را به همراه ابزارهای تصویری و بهرهوری، در اختیار کاربران نیمهحرفهای میگذارد.
- نسخههای رایگان همچنان در دسترس هستند، اما با محدودیتهایی مثل سقف تعداد توکن و فقط ۱۰ جستجو در ماه.
گوگل با این مدل پلکانی، میخواهد هم کاربران عمومی را جذب کند و هم حرفهایها را به ارتقای اشتراک ترغیب نماید؛ با این هدف که ارزش واقعی، در خلاقیتهای سطح بالا و کارهای سازمانی نهفته است نه صرفاً تولید متن یا تصویر تفننی.
اگر بخواهید خلاصه کنیم: گوگل دیگر فقط یک شرکت جستجو نیست. حالا بهعنوان یکی از رهبران تولید محتوای هوشمند، آمده است تا زمین بازی هوش مصنوعی را دوباره طراحی کند و آنهم با سرعتی چشمگیر، ابزارهایی بیرقیب و چشماندازی جاهطلبانه.
دیدگاهها