Microsoft Yajitegemea: Yaingiza AI Zake (MAI-Image-1 na MAI-Voice-1) Kwenye Copilot, Yapunguza OpenAI!

it | Thu Nov 06 2025


Microsoft Yajitegemea: Yaingiza AI Zake (MAI-Image-1 na MAI-Voice-1) Kwenye Copilot, Yapunguza OpenAI!

Kampuni ya teknolojia ya Microsoft (MS) imefanya hatua kubwa katika mikakati yake ya Akili Bandia (AI) kwa kuingiza kwa mara ya kwanza mifumo yake ya kuzalisha picha na sauti iliyojengwa ndani kwenye bidhaa zake za Copilot. Uamuzi huu unalenga kupunguza utegemezi wake kwa kampuni ya OpenAI na wakati huo huo kuimarisha teknolojia yake ya AI.


Mkurugenzi Mtendaji wa kitengo cha AI cha Microsoft, Mustafa Suleyman, alitangaza rasmi kupitia mtandao wa X (zamani Twitter) mnamo Novemba 5 kuwa mfumo wao wa kuzalisha picha, 'MAI-Image-1', umezinduliwa kikamilifu. Mfumo huu ulianza kuoneshwa mwezi uliopita na umekuwa ukifanyiwa majaribio na watumiaji wachache.


Sasa, MAI-Image-1 imejumuishwa ndani ya 'Bing Image Creator'. Watumiaji sasa wana fursa ya kuchagua kati ya kutumia modeli hii mpya au mifumo mingine mashuhuri kama vile 'DALL-E 3' na 'GPT-4o' ya OpenAI.


Aidha, mfumo wa sauti wa Microsoft, 'Copilot Audio Expressions'—ambao hubadilisha maandishi kuwa sauti—pia umeingizwa kwenye bidhaa za Copilot. Watumiaji wakichagua 'Story Mode' ndani ya mfumo huo, AI inaweza kuunda kitabu cha sanaa (artbook) kinachojumuisha picha za AI na sauti ya AI inayosimulia hadithi, ikitegemea 'MAI-Voice-1' ambayo ilizinduliwa Agosti pamoja na MAI-Image-1.


Microsoft imeeleza kwamba nguvu ya MAI-Image-1 ni uwezo wake wa kuzalisha picha zenye uhalisia wa kiwango cha picha za kupigwa (photo-realistic). Inadaiwa mfumo huu unaweza kuonesha kwa usahihi wa hali ya juu picha tata kama vile umeme (radi) na mandhari ya asili. MS ilifafanua kwamba walizingatia maoni ya wabunifu wa kitaalamu ili kuhakikisha matokeo hayawi ya kurudia rudia (monotonous) au ya kuchosha.


Mafanikio haya yamethibitishwa na ukweli kwamba MAI-Image-1 imeingia katika nafasi ya 9 kwenye viwango vya ubora vya 'LM Arena'—jukwaa la kupima utendaji kazi wa AI za kutengeneza picha.


Wakati huo huo, Microsoft pia imetangaza kuongeza uwezo wa sauti kwenye programu ya simu ya 'MS 365 Copilot'. Uwezo huu unaruhusu watumiaji kutumia AI bila kutumia mikono (hands-free) wakiwa safarini au wakihitaji kufanya kazi kwa haraka. Mkurugenzi Mtendaji wa MS, Satya Nadella, alionesha mfumo huu kwa kuweka video akisema, "Mimi naitumia hii kila siku, na ni moja ya huduma muhimu sana katika kazi zangu."


Kwa jumla, Microsoft imeanzisha mfululizo wa mifumo yake mitatu ya AI: MAI-1-preview (Mfumo Mkuu wa Lugha - LLM), MAI-Voice-1, na sasa MAI-Image-1. Mifumo hii ya 'MAI' ndiyo mifumo ya kwanza iliyotengenezwa ndani tangu Mustafa Suleyman ajiunge na Microsoft.


Kwa kuanza kutumia mifumo hii ya picha na sauti kwenye bidhaa zake, Microsoft inapunguza utegemezi wa OpenAI. Aidha, mifumo ya 'MAI' inasemekana kuwa nyepesi na haraka kuliko mifumo ya OpenAI, jambo ambalo linatarajiwa pia kusaidia katika kupunguza gharama za uendeshaji.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.