OpenAI Yazindua Model Mpya ya AI ya Kutengeneza Picha kwa ChatGPT

it | Wed Mar 26 2025


OpenAI Yazindua Model Mpya ya AI ya Kutengeneza Picha kwa ChatGPT

Kampuni ya OpenAI, inayohusika na ukuzaji wa ChatGPT, imetangaza kuzinduliwa kwa modeli mpya ya kutengeneza picha inayoitwa 'ChatGPT-4o Image Generation' mnamo Machi 25.


OpenAI ilieleza kuwa modeli hii mpya ni mfumo wa akili bandia (AI) ulioimarishwa zaidi wa kutengeneza picha, ukiwa umeunganishwa na modeli yao mahususi ya lugha nyingi ya AI, ChatGPT-4o.


Gabrille Goh, anayesimamia sehemu ya lugha nyingi katika OpenAI, alisema, "Tulitaka kuunda modeli ambayo inaunganisha uwezo wa GPT-4 katika kuelewa maandishi na akili ya kuona ya modeli bora zaidi za kutengeneza picha. Model hii ndio matokeo ya kufikia lengo hilo."


OpenAI ilieleza kuwa modeli hii mpya inazalisha picha kwa urahisi na kwa usahihi zaidi kuliko modeli yao ya awali ya picha, 'DALL-E'. Hapo awali, watumiaji walipaswa kuingiza maelezo moja baada ya nyingine ili kupata picha waliyotaka, lakini modeli hii mpya ina uwezo wa kuelewa nia ya mtumiaji na kuzalisha picha kulingana na hiyo.


OpenAI ilisema kuwa modeli hii inaweza kutekeleza hata maagizo changamano kwa urahisi. Kwa mfano, ingawa modeli za awali za AI za kutengeneza picha zinaweza kuzalisha picha za baiskeli vizuri, zilikuwa na ugumu wa kuchora 'baiskeli yenye magurudumu ya pembetatu' kwa sababu haikuwa data iliyozoezwa nayo.


Zaidi ya yote, OpenAI ilieleza kuwa uwezo wa kuingiza maandishi kwa usahihi kwenye picha umeboreshwa sana. Ikiombwa 'utengeneze bango linaloonyesha aina mbalimbali za nyangumi,' modeli hiyo itazalisha picha inayolinganisha kwa usahihi aina za nyangumi na majina yao.


Ingawa modeli za awali hazikuelewa vizuri uhusiano kati ya sifa za vitu na mara nyingi maandishi yalionekana kuharibika, modeli hii mpya inakadiriwa kuwa inaweza kutekeleza maagizo magumu zaidi kwa ufanisi. Pia inaweza kutengeneza picha zinazohusiana na sheria za asili kwa urahisi. Ikiombwa itengeneze picha kuhusu 'majaribio ya Newton ya prism' yanayoelezea upinde wa mvua kwa maelezo rahisi, picha yenye maandishi huzalishwa kwa urahisi.


Ikiombwa itengeneze katuni, katuni yenye mazungumzo huzalishwa kwa usafi, na ikiombwa itengeneze orodha au fomula za hisabati, huzalishwa kwa urahisi.


Pia inasaidia mandhari yanayoonekana wazi (transparent background), kwa hivyo ukiomba mandhari wazi wakati wa kutengeneza stika ya mbwa, inaweza kuakisi hilo. Picha kama vile nembo za biashara pia zinaweza kuzalishwa kwa mandhari wazi.


OpenAI ilieleza kuwa ingawa modeli hii mpya ni toleo lililoboreshwa la 'DALL-E' kwa kuwa inazalisha picha, teknolojia msingi ya modeli hizo mbili ni tofauti kabisa, na maboresho mbalimbali yamefanywa katika modeli hii mpya kutokana na hilo.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.