Dunia ya ubunifu wa picha na grafiki imepata mtikisiko mpya na wa kufurahisha. Kampuni ya Google imetangaza ujio wa toleo jipya la mfumo wake wa kuchora picha kwa Akili Mnemba (AI) unaoitwa 'Nano Banana Pro' (au kitaalamu Gemini 3 Pro Image). Tofauti na matoleo ya zamani yaliyokuwa yakibahatisha, toleo hili limepokelewa kwa shangwe kubwa na wadau wa teknolojia, likitajwa kuwa mkombozi wa kweli kwa wafanyabiashara na wabunifu.
Kwa muda mrefu, changamoto kubwa ya AI inayochora picha (kama Midjourney au DALL-E) imekuwa ni kushindwa kuandika maneno kwa usahihi. Ukiambia AI ichore bango la duka lenye jina "Karibu Mgeni", mara nyingi ilikuwa ikiandika maandishi yasiyosomeka kama "Krbui Mgni". Lakini Google wanasema 'Nano Banana Pro' imelimaliza tatizo hilo.
Ubora wa 4K na Akili ya Kufikiri
Siri ya ubora wa mfumo huu mpya ni matumizi ya 'ubongo' wa Gemini 3 Pro. Kabla ya kuchora, AI hii "inafikiri" kwanza (reasoning capabilities) ili kuelewa muundo, lengo, na uhalisia wa picha inayotakiwa.
Matokeo yake ni picha zenye ubora wa hali ya juu wa 4K (pixel 4096), kiwango ambacho ni kikubwa sana ukilinganisha na ukomo wa pixel 1024 wa matoleo ya zamani. Hii ina maana kuwa wabunifu wa mabango Kariakoo au Posta sasa wanaweza kutumia picha hizi kuchapisha mabango makubwa bila picha kupoteza ubora (pixelated).
Sifa nyingine za kutisha ni pamoja na:
- Uwezo wa Kuchanganya Vitu: Inaweza kuweka vitu tofauti 14 kwenye picha moja bila kuvuruga mpangilio.
- Uthabiti wa Sura: Inaweza kuchora kundi la watu watano na kuhakikisha sura zao zinabaki kuwa zilezile, bila kubadilika na kuonekana kama vinyago.
- Utafutaji wa Mtandaoni: Inaweza kuingia mtandaoni, kusoma mapishi ya pilau, na kisha kukutengenezea kadi ya maelekezo (flashcard) yenye picha halisi ya pilau na hatua zake.
Kama Studio ya Mpiga Picha
Google wameiita zana hii kuwa "kifaa cha wataalamu." Mtumiaji ana uwezo wa kubadilisha picha kama anavyofanya kwenye Photoshop. Unaweza kurekebisha mwangaza, kubadili muda (mfano, kutoka mchana kuwa jioni), kuweka ukungu nyuma ya picha (bokeh effect), na kurekebisha rangi. Hii ni habari njema kwa wapiga picha na watengeneza matangazo ambao wanataka picha kamilifu kwa ajili ya kampeni zao.
Gharama Zimepanda Kidogo
Hata hivyo, ubora huu hauji bure. Google wamepandisha bei ya kutumia huduma hii kwa watengenezaji programu na makampuni. Kutengeneza picha moja ya ubora wa 4K sasa kunagharimu Dola 0.24 (sawa na takriban Shilingi za Kitanzania 635). Hili ni ongezeko kubwa ukilinganisha na bei ya zamani ya Dola 0.039 (TZS 100), lakini Google wanasema thamani ya picha hizi ni kubwa na zinafaa kwa matumizi ya kibiashara yenye ulinzi wa hali ya juu.
Picha zote zinazotengenezwa zitawekewa alama maalum ya siri ya kidijitali (SynthID) ili kuzuia kusambaa kwa taarifa za uongo (fake news), ikiruhusu watu kutambua kuwa picha hiyo imetengenezwa na AI.
Watumiaji Wasema: "Hii ni Kufuru!"
Mapokezi mtandaoni yamekuwa ya kishindo. Kwenye mtandao wa X (Twitter), watumiaji wamemwagia sifa lukuki mfumo huu. Mmoja aliandika, "Hii ni kufuru! Nimeituma initengenezee menyu ya mgahawa na imetoa kitu kilichokamilika bila kosa hata moja la herufi." Mwingine alisifu uwezo wake wa kurejesha nembo (logo) zilizoharibika na kuzifanya mpya.
Hata hivyo, bado kuna mapungufu madogo. Wataalam wamegundua kuwa bado inachemka kidogo kwenye michezo ya mantiki kama Sudoku, ikimaanisha bado haijafikia akili kamili ya binadamu (AGI), lakini kwa kazi za picha, imeweka rekodi mpya.
Kwa sasa, watumiaji wa kawaida wanaweza kuijaribu kupitia programu ya Gemini App. Wale wanaotumia toleo la bure watapata idadi ndogo ya picha za majaribio kabla ya kurudishwa kwenye toleo la kawaida, huku wanaolipia wakifurahia uhuru zaidi.