Kampuni Changa Yawapiga Bao Google na OpenAI, Yatoa AI ya Video za Dakika 5

it | Fri Nov 21 2025


Kampuni Changa Yawapiga Bao Google na OpenAI, Yatoa AI ya Video za Dakika 5

Wakati dunia bado inashangaa video fupi za sekunde 10 hadi 20 zinazotengenezwa na mifumo mikubwa kama 'Sora' ya OpenAI au 'Veo 3' ya Google, kampuni mpya na changa kabisa (startup) imeibuka na kufanya kile kilichoonekana kushindikana. Kampuni hiyo, CraftStory, imetangaza teknolojia mpya yenye uwezo wa kutengeneza video za Akili Mnemba (AI) zenye urefu wa hadi dakika tano (5) mfululizo bila kupoteza ubora.


Hii ni habari kubwa sana kwa tasnia ya ubunifu wa maudhui, kwani inaondoa kikwazo kikuu cha teknolojia ya video za AI: udogo wa muda. Kwa sasa, mifumo mingi inashindwa kutengeneza video ndefu kwa sababu inapoteza 'kumbukumbu' na kuanza kuharibu picha (hallucinations) kadiri video inavyosonga mbele. Lakini CraftStory wamevunja mwiko huo.


Wataalamu wa 'Kompyuta Kuona' (Computer Vision)


CraftStory si kampuni ya kubahatisha. Waanzilishi wake ni wale magwiji waliojenga maktaba maarufu ya 'OpenCV'—mfumo ambao ndio msingi wa teknolojia nyingi duniani zinazozipa kompyuta uwezo wa 'kuona' na kutambua picha. Katika uzinduzi wao wa tarehe 19 Novemba, walitangaza pia kupata mtaji wa kuanzia wa Dola za Kimarekani milioni 2 (sawa na takriban Shilingi za Kitanzania Bilioni 5.3).


Siri ya Ushindi: Kujenga Barabara Yote kwa Pamoja


Mkurugenzi Mkuu wa CraftStory, Victor Eruhimov, anaeleza kuwa siri ya mafanikio yao ipo kwenye usanifu mpya wa kimfumo. Mifumo ya zamani hutengeneza video kipande kwa kipande (kwa mfuatano), jambo ambalo husababisha makosa kurundikana mwishoni. CraftStory inatumia teknolojia inayoitwa "Parallelized Diffusion Architecture".


Kwa lugha nyepesi, badala ya mchoraji kuchora picha moja baada ya nyingine, mfumo huu unachora video nzima ya dakika tano kwa wakati mmoja, ukigawanya kazi hiyo katika vipande vidogo vinavyowasiliana. Hii inahakikisha kuwa sura ya mtu aliyeanza mwanzoni mwa video haibadiliki na kuwa mtu mwingine dakika ya nne—tatizo ambalo limekuwa likisumbua sana mifumo mingine.


Kutoka Picha Mnato Hadi Video Hai


Mfumo wao mpya, 'Model 2.0', unafanya kazi kwa njia ya "Video-to-Video". Mtumiaji anaingiza picha moja (mfano, picha ya tangazo) na video ya mtu anayeongea au kutembea (driving video). AI inaunganisha vitu hivi viwili na kutengeneza video ndefu ya hadi dakika 5, ikiwa na uwezo wa kuigiza miondoko ya mdomo (lip-sync) na ishara za mwili kikamilifu.


Habari Njema kwa Wafanyabiashara


Tofauti na zana nyingine zinazolenga watumiaji wa kawaida wa mitandao ya kijamii, CraftStory inalenga soko la kibiashara (B2B). Eruhimov anasema teknolojia yao ni mkombozi kwa makampuni yanayotaka kutengeneza video za mafunzo, maelezo ya bidhaa, au matangazo ya biashara.


"Fikiria video ya kibiashara ambayo zamani iligharimu Dola 20,000 (kama Shilingi Milioni 53 za Kitanzania) na kuchukua miezi miwili kuiandaa, sasa inaweza kutengenezwa kwa dakika chache kwa sehemu ndogo ya gharama hiyo," alisisitiza Eruhimov.


Hii ina maana kubwa hata kwa soko la Tanzania. Makampuni yanayotaka kutengeneza video za mafunzo kwa wafanyakazi au matangazo ya TV hayatalazimika tena kukodi waigizaji na studio kwa gharama kubwa kila mara.


Mashindano Mapya


Ingawa kwa sasa wanatumia video na picha kama chanzo, CraftStory wameahidi kuleta uwezo wa kuandika maneno (text-to-video) hivi karibuni. Soko la video za AI limegeuka kuwa uwanja wa vita, kukiwa na wababe kama Runway, Pika, Stability AI, na Google. Lakini kwa kuweza kutoa video ndefu, thabiti, na zenye uhalisia wa kibinadamu, CraftStory wamejichimbia kwenye nafasi ya kipekee ambayo huenda ikawafanya kuwa chaguo namba moja kwa makampuni makubwa duniani.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.