Katika kile kinachoweza kutajwa kama hadithi ya kweli ya "Daudi na Goliati" katika ulimwengu wa teknolojia, kampuni ndogo ya Runway imefanya maajabu ambayo yamewaaacha vigogo wa Silicon Valley midomo wazi. Wakati dunia ikiamini kuwa Google na OpenAI ndio wafalme wa Akili Mnemba (AI), Runway imepindua meza kibabe kwa kuzindua mtambo wake mpya wa kutengeneza video uitwao ‘Gen-4.5’, ambao umetajwa kuwa na uwezo mkubwa kuliko bidhaa za matrilioni za washindani wake.
Tukio hili la Jumapili (Desemba 1) limebadili upepo wa ushindani, likithibitisha kuwa katika ulimwengu wa kidijitali, ukubwa wa pua si wingi wa kamasi; timu ndogo yenye nia inaweza kufanya makubwa.
Gen-4.5: Video Zinazochanganya Akili
Runway imetamba kuwa toleo hili jipya la 'Gen-4.5' lina uwezo wa kutisha wa kubadili maandishi kuwa video (Text-to-Video). Tofauti na matoleo ya zamani yaliyokuwa yakitoa video zinazoonekana kama katuni au zenye makosa mengi, Gen-4.5 inazingatia "Usahihi wa Kimwili" (Physical Accuracy).
Kwa lugha nyepesi, ukiiambia mashine hiiikutengenezee video ya maji yakimwagika au mtu akitembea, itazingatia kanuni za asili za fizikia—uzito wa mtu, mtawanyiko wa maji, na hata jinsi upepo unavyopeperusha nguo. Kampuni hiyo imesisitiza kuwa matokeo yake ni "halisi kiasi kwamba ni vigumu kutofautisha na video iliyorekodiwa na kamera." Hii ni habari njema kwa waandaaji wa video (videographers) na tasnia ya filamu nchini Tanzania, kwani sasa wanaweza kuunda mandhari za ajabu bila kuhitaji bajeti kubwa ya kusafiri au kukodi vifaa.
Kichapo kwa Google na OpenAI
Ushindi wa Runway si wa maneno matupu; una ushahidi wa namba. Katika ubao wa matokeo wa kimataifa unaosimamiwa na taasisi huru ya Artificial Analysis (Video Arena Leaderboard), Gen-4.5 imekamata nafasi ya kwanza.
Hii ni dharau kubwa kwa washindani wake. Mfumo wa ‘Veo 3’ wa Google umeshika nafasi ya pili, huku ule wa OpenAI unaopigiwa kelele nyingi, ‘Sora 2 Pro’, ukiambulia nafasi ya saba. Yaani, 'Sora' imepigwa 'gap' la mbali na kampuni ambayo haina rasilimali nyingi kama za Microsoft au Google.
Cristobal Valenzuela, Mkurugenzi Mtendaji wa Runway, alitoa kauli ya kijasiri na yenye hamasa: "Timu yetu ya watu 100 imeziangusha kampuni zenye thamani ya Dola Trilioni 1 (Takriban Shilingi Trilioni 2,700). Hii inathibitisha kuwa umakini na majaribio ya mara kwa mara yanaweza kukufikisha kileleni."
Kasoro Ndogo: "Hakuna Kizuri Kisicho na Ila"
Licha ya sifa hizo, Runway wamekuwa waungwana na kukiri kuwa mfumo wao bado haujakamilika kwa asilimia 100. Bado kuna changamoto katika kile kinachoitwa "Causality" (Sababu na Matokeo).
Kwa mfano, katika baadhi ya video, unaweza kuona mlango unafunguka wenyewe kabla mtu hajashika kitasa. Hii ni kasoro ndogo ya kiufundi ambayo inaonyesha kuwa mashine bado inajifunza mtiririko sahihi wa matukio, lakini ukilinganisha na ubora wa picha (visual precision), kosa hili linaonekana kurekebishika.
Vita ya "World Models"
Ushindani huu sasa umehamia kwenye kile wataalamu wanaita "World Models" (Mifumo ya Dunia). Lengo la makampuni haya si kutengeneza video nzuri tu, bali ni kutengeneza AI inayoelewa jinsi dunia inavyofanya kazi—kwamba ukidondosha glasi itavunjika, au maji yakimwagika yatalowesha sakafu.
OpenAI walijigamba kuwa 'Sora 2' inaelewa jinsi maji yanavyosukumwa (fluid dynamics), na Google nao wanapambana huko huko. Lakini kwa sasa, Runway inaonekana kuelewa "fizikia ya dunia" vizuri zaidi kuliko wote.
Fursa kwa Watanzania
Mfumo wa Gen-4.5 utaanza kupatikana kwa watumiaji wote wiki hii kupitia jukwaa la Runway na API zake. Kwa wabunifu wa maudhui (Content Creators) wa Tanzania, hii ni zana muhimu. Badala ya kuhangaika na 'stock footage' za kulipia, sasa unaweza "kuamuru" video unayoitaka iwe.
Hata hivyo, kama ilivyo kwa teknolojia yoyote mpya, tunapaswa kuitumia kwa umakini, tukikumbuka kuwa wakati inarahisisha kazi, pia inaleta changamoto mpya za kutofautisha ukweli na uongo mtandaoni.