Katika ulimwengu wa teknolojia unaoenda kasi kama upepo wa Kusi, mapinduzi makubwa yanazidi kutokea kwenye nyanja ya Akili Mnemba (Artificial Intelligence). Habari njema imetua mezani pangu leo kutoka Taasisi ya Allen ya AI (Ai2), na kwa jicho la kihariri, ninaona fursa adhimu kwa wadau wa teknolojia nchini Tanzania, hasa wale wanaopambana kufundisha kompyuta kuelewa lugha zetu adhimu za Kibantu.
Taasisi ya Ai2 imetangaza kuzinduliwa kwa 'Bolmo', familia mpya ya mifano ya lugha (language models) ambayo inafanya kazi kwa kiwango cha 'byte' badala ya kutegemea 'tokens' kama ilivyozoeleka. Hii ni hatua kubwa inayoweza kufananishwa na kubadili injini ya gari kutoka kutumia mafuta ya taa kwenda umeme; ni mabadiliko ya kimsingi.
Kwa Nini Hii ni Habari Kubwa?
Hebu tusemezane ukweli wa kijiweni. Mifano mingi ya AI iliyopo sasa (kama GPT) hutumia kitu kinaitwa "tokenizers". Hizi hukata maneno vipande vipande ili kompyuta iweze kuelewa. Mfano, neno la Kiingereza "internationalization" linaweza kukatwa kama 'inter', 'national', na 'ization'. Lakini kwenye lugha zetu kama Kiswahili, ambapo tunaunganisha maneno (agglutinative language), mfumo huu umekuwa na changamoto. Neno kama "hawajakutana" linaweza kuvuruga mifumo ya zamani.
Hapa ndipo 'Bolmo' inapokuja kama mkombozi. Mfumo huu mpya hauhitaji kamusi iliyoandaliwa awali wala huyo 'tokenizer'. Badala yake, inachakata maandishi katika kiwango cha chini kabisa cha 'UTF-8 bytes'. Hii ina maana inaweza kusoma na kuelewa maandishi yoyote, hata yale yenye makosa ya tahajia, lugha za mitaani, au data ambayo haijapangiliwa vizuri. Kwa vijana wetu wa Silicon Dar na wabunifu wa programu, hii inamaanisha uwezo wa kutengeneza 'chatbots' zinazoelewa Kiswahili cha mtaani bila 'kugoma'.
Ai2 wameachia matoleo mawili: Bolmo 7B na Bolmo 1B. Wanasema hii ndiyo "familia ya kwanza ya ushindani ya mifano ya lugha ya kiwango cha byte ambayo ni chanzo huria (open source) kabisa."
Ufanisi na Gharama: Mwarobaini wa Bajeti
Siku zote, kikwazo kikubwa cha teknolojia hii mpya kimekuwa gharama. Kufundisha mtambo wa AI kutoka mwanzo (from scratch) kunagharimu mabilioni ya Shilingi za Kitanzania. Lakini Ai2 wametumia akili ya ziada. Badala ya kuanza sifuri, wameuchukua mfano wao wa zamani uitwao 'Olmo 3' na kuufanyia maboresho ya kiwango cha 'byte'.
Mbinu hii imepunguza gharama kwa kiasi kikubwa sana. Wataalamu hao wanasema mbinu hii inagharimu chini ya asilimia 1 ya bajeti ya kawaida ya ufundishaji wa awali. Hii ni sawa na kupata huduma ya hoteli ya nyota tano kwa bei ya mgahawa wa kawaida! Hii inatoa mwanga kwa kampuni changa za Kitanzania kuweza kumudu teknolojia hizi bila kuhitaji mitaji mikubwa ya kutisha.
Matokeo ya Jaribio: Bolmo Yafanya Kweli
Kwenye majaribio, Bolmo imeonyesha uwezo wa hali ya juu. Katika nyanja za hisabati, sayansi, uhandisi (STEM), na uandishi wa kodi za kompyuta (coding), Bolmo 7B imefanya vizuri zaidi kuliko hata mfano wa awali wa Olmo 3. Imeweka rekodi nzuri kwenye vipimo vinavyoangalia usahihi wa herufi kama vile 'CUTE' na 'EXECUTE'.
Zaidi ya hayo, mfumo huu unatajwa kuwa na kasi ya ajabu. Kwa sababu unabana data (compression) kwa ufanisi mkubwa wakati wa kujifunza, kasi yake ya kufanya kazi inashindana na mifano ya zamani, huku ikiwa na uwezo mpana zaidi wa kuelewa muktadha.
Hitimisho: Fursa Ipo Mikononi Mwetu
Ndugu msomaji, 'Bolmo' si tu jina la kizungu; ni fursa. Kuanzia sasa, nambari siri (code) na vituo vya ukaguzi (checkpoints) vya Bolmo vimekwisha wekwa wazi kwenye majukwaa ya Hugging Face na GitHub. Ukubwa wake wa 7B na 1B unamaanisha inaweza kutumika hata kwenye mashine ambazo hazina uwezo mkubwa sana wa kiuchakataji.
Hii ni nafasi ya pekee kwa wataalamu wetu wa TEHAMA kuanza kufanyia kazi mifumo inayoweza kuelewa lahaja zetu, lugha zetu za kikabila, na hata namna tunavyoandika meseji zetu za simu bila kupoteza maana. Kama wahenga walivyosema, "Mchumia juani, hulia kivulini"—huu ni wakati wa kuchumia juani na teknolojia ya Bolmo.