قابلیت جدید جمینای، ChatGPT را به چالش کشید

گوگل با معرفی Gemini 2.5 Flash Image توانسته است یک رقیب جدی برای ChatGPT و ابزارهای مشابه ایجاد کند. این قابلیت جدید که به کاربران اجازه میدهد تصاویر را با استفاده از دستورات متنی و بهصورت دقیق و با حفظ ویژگیهای اصلی و صحت بصری ویرایش کنند، به چالش جدی برای سلطنت OpenAI تبدیل شده است.
چه چیزی تازه است؟
مدل جدید Gemini 2.5 Flash Image به کاربران این امکان را میدهد که تصاویر را با دقت بالاتری ویرایش کنند، تغییراتی مثل تغییر زاویه، فازی کردن چند تصویر یا تغییر وضعیت بدون تحریف چهرهها را امکانپذیر میکند. این مدل با استفاده از دستورات ساده و طبیعی میتواند چهرهها و صحنهها را ثابت نگه دارد و بهطور خاص برای نگه داشتن انسجام شخصیتها و داستانها در برندینگ یا تولید محتوا طراحی شده است.
گوگل همچنین ابزارهای جدیدی برای توسعهدهندگان فراهم کرده که به آنها این امکان را میدهد تا اپلیکیشنهای خود را بهسرعت بسازند و حتی از AI Studio برای توسعه پروژههای سفارشی استفاده کنند.
مقایسه با OpenAI
این قابلیت جدید جمینای بهویژه در زمینه ویرایش دقیق و حفظ ثبات بصری تصاویر، چالش جدیدی برای OpenAI و ChatGPT ایجاد کرده است. هرچند ChatGPT با پشتیبانی از مدلهای متنی و تولید تصویر، توانسته در این زمینه پیشرفت کند، اما مدل جدید گوگل با سرعت و دقت بیشتری میتواند به نیازهای دقیقتر و شخصیتر کاربران پاسخ دهد.
ویژگیها و قیمت
- قیمت: این ابزار جدید بر اساس توکن و برای هر میلیون توکن خروجی، ۳۰ دلار هزینه دارد، که معادل ۴ سنت برای هر تصویر است.
- توزیع: بهطور گسترده از طریق OpenRouter و fal.ai در دسترس توسعهدهندگان جهانی قرار دارد.
- شمار کاربران: جمینای در اوت ۲۰۲۵ تعداد ۴۰۰ میلیون کاربر فعال ماهانه داشته است، که هرچند این رقم به اندازه ChatGPT (با ۷۰۰ میلیون کاربر فعال هفتگی) نمیرسد، اما با توجه به قابلیتهای پیشرفته، بهطور قابل توجهی در حال رشد است.
هدف گوگل: پاسخ به نگرانیهای امنیتی
گوگل برای مقابله با نگرانیها در مورد استفاده نادرست از تصاویر و اصالتسنجی، تمام خروجیها را با آرم SynthID و تگ متادیتا بهصورت AI-generated علامتگذاری میکند.
جمعبندی
جمینای ۲.۵ Flash Image بهویژه با قابلیتهای ویرایش پیشرفته تصویر، گوگل را در رقابت با OpenAI به یک بازیگر جدی تبدیل کرده است. با این حال، مدلهای ChatGPT همچنان بر شخصیسازی و انعطافپذیری در راستای نیازهای کاربران تاکید دارند. باید منتظر ماند که کدام مدل در درازمدت میتواند به محبوبیت بیشتری دست یابد.
دیدگاهها