ගූගල් සමාගම එයාලගේ Gemini chatbot එකට අලුත් AI image model එකක් දෙනවා. මේකෙන් usersලාට photos edit කරන එකට තව හොඳට control එකක් ලැබෙනවා. මේක කරන්නේ OpenAI එකේ popular image tools එක්ක compete කරන්න සහ ChatGPT එකෙන් usersලා ටිකක් එහාට අරගන්න.
Gemini 2.5 Flash Image කියලා හඳුන්වන මේ update එක අඟහරුවාදා ඉඳන් Gemini app එකේ හැම user කෙනෙක්ටම වගේම, developersලටත් Gemini API, Google AI Studio, සහ Vertex AI platforms හරහා ලැබෙනවා.
Gemini එකේ අලුත් AI image model එක design කරලා තියෙන්නේ images වලට precise edits කරන්න. ඒක කරන්නේ usersලා දෙන natural language requests වලට අනුව. ඒ වගේම faces, animals, සහ අනිත් details වල consistency එක ආරක්ෂා කරගන්නවා. මේක බොහෝ rival tools වලට අමාරු දෙයක්. උදාහරණයක් විදියට, ChatGPT හෝ xAI එකේ Grok එකට photo එකක කෙනෙකුගේ shirt එකේ color එක change කරන්න කිව්වොත්, ඒකෙන් face එක distortion වෙන්න නැත්නම් background එක වෙනස් වෙන්න පුළුවන්.
Google එකේ අලුත් tool එකට දැන් හොඳ attention එකක් ලැබිලා තියෙනවා. මෑත සතිවලදී, LMArena කියන crowdsourced evaluation platform එකේදී “nano-banana” කියලා pseudonym එකක් යටතේ anonymously ආපු AI image editor එකක් ගැන social media usersලා rave කරලා තිබුණා.
Google කියන්නේ මේ model එක එයාලගේම එකක් කියලා. මේක ඇත්තටම එයාලගේ flagship Gemini 2.5 Flash AI model එක ඇතුළේ තියෙන native image capability එකක්. Google කියනවා මේ image model එක LMArena සහ අනිත් benchmarks වල state-of-the-art කියලා.
“අපි visual quality එක වගේම, model එකට instructions follow කරන්න තියෙන ability එකත් ඇත්තටම forward push කරනවා,”
කියලා Google DeepMind එකේ visual generation models වල product lead කෙනෙක් වන Nicole Brichtova TechCrunch එකට දීපු interview එකකදී කිව්වා.
“මේ update එකෙන් edits වඩාත් seamlessly කරනවා, ඒ වගේම model එකේ outputs usable. ඒවා ඔයාට ඕනම දෙයකට use කරන්න පුළුවන්,” Brichtova කිව්වා.
AI image models කියන්නේ Big Tech එකට critical battleground එකක් වෙලා. OpenAI එකෙන් මාර්තු මාසයේදී GPT-4o එකේ native image generator එක launch කරපු වෙලාවේ, AI-generated Studio Ghibli memes නිසා ChatGPT එකේ usage එක roof එකට ගියා. OpenAI CEO Sam Altmanට අනුව, ඒ නිසා එයාලගේ GPUs “melting” වුණා.
OpenAI සහ Google එක්ක keep up වෙන්න, Meta පසුගිය week එකේ announce කළා Midjourney කියන startup එකෙන් AI image models license කරනවා කියලා. ඒ අතර, a16z-backed German unicorn එකක් වන Black Forest Labs, එයාලගේ FLUX AI image models වලින් benchmarks වල dominate කරනවා.
සමහරවිට Gemini එකේ impressive AI image editor එක Google එකට OpenAI එක්ක තියෙන user gap එක close කරන්න උදව් වෙයි. ChatGPT එකට දැන් weekly usersලා මිලියන 700 කට වඩා ඉන්නවා. Google එකේ earnings call එකේදී, CEO Sundar Pichai reveal කළා Gemini එකට monthly usersලා මිලියන 450ක් ඉන්නවා කියලා—ඒ කියන්නේ weekly usersලා ඊටත් වඩා අඩුයි.
Brichtova කියන විදියට Google විශේෂයෙන්ම මේ image model එක design කළේ consumer use cases mind එකේ තියාගෙන. උදාහරණයක් විදියට, usersලාට එයාලගේ home and garden projects visualise කරන්න උදව් වෙනවා. මේ model එකට වඩා හොඳ “world knowledge” එකක් තියෙනවා. ඒ වගේම single prompt එකකදී multiple references combine කරන්න පුළුවන්; for example, sofa එකක image එකක්, living room photo එකක්, සහ color palette එකක් එක cohesive render එකකට merge කරනවා.
Gemini එකේ අලුත් AI image generator එකෙන් usersලාට realistic images හදන්න සහ edit කරන්න පහසු වුණත්, company එකට safeguards තියෙනවා usersලාට create කරන්න පුළුවන් දේ limit කරන්න. Google එකට කලින් AI image generator safeguards එක්ක struggle වෙන්න සිද්ධ වුණා. එක point එකකදී, company එක Gemini එකෙන් historically inaccurate pictures of people generate කිරීම ගැන apologise කරලා, AI image generator එක altogether rollback කළා.
දැන්, Google එකට හිතෙනවා එයාලා හොඳ balance එකක් strike කරලා කියලා.
“අපි usersලාට creative control දෙන්න කැමතියි, එවිට එයාලට models වලින් එයාලට ඕන දේ ගන්න පුළුවන්,” Brichtova කිව්වා. “ඒත් ඕනම දෙයක් කරන්න පුළුවන් වගේ දෙයක් නෙමෙයි.”
Google එකේ terms of service එකේ generative AI section එකෙන් usersලාට “non-consensual intimate imagery” generate කරන එක prohibit කරනවා. Grok එකට නම් ඒ වගේ safeguards තියෙනවා කියලා පෙනෙන්නේ නෑ. ඒකෙන් usersලාට Taylor Swift වගේ celebritiesලට සමාන AI-generated explicit images create කරන්න allow කළා.
Deepfake imagery rise එකට address කරන්න, ඒකෙන් usersලාට online එකේ real දේ discern කරන්න අමාරු නිසා, Brichtova කියනවා Google AI-generated images වලට visual watermarks apply කරනවා වගේම, metadata වල identifiers දානවා කියලා. හැබැයි, social media එකක image එකක් scroll කරන කෙනෙක් එවැනි identifiers හොයන්නේ නැති වෙන්න පුළුවන්.