Kampuni ya teknolojia ya Meta imezindua mfumo mpya wa akili bandia (AI) uliobuniwa mahususi kwa ajili ya simu za mkononi na vifaa vingine vidogo. Mifumo hii, iitwayo ‘MobileLLM-R1’, inalenga kuleta uwezo wa kufikiri katika vifaa vyetu bila kutegemea intaneti.
Meta imetoa mifumo mitatu ya chanzo huria chini ya mfululizo huu: MobileLLM-R1-140M, MobileLLM-R1-350M, na MobileLLM-R1-950M. Mifumo hii midogo, yenye vigezo milioni 140, milioni 350, na milioni 950, imeundwa kufanya kazi kwenye vifaa vyenye uwezo mdogo wa hifadhi na nishati, kama kompyuta za mezani na simu za mkononi.
Mifumo hii ni mahususi kwa masuala ya hesabu, uandishi wa programu (coding), na sayansi, na haifai kwa matumizi ya kawaida ya mazungumzo. Ili kuboresha utendaji wa mifumo hii midogo, Meta imetumia mbinu mpya za kiufundi kama vile ‘Group-Query Attention’ (GQA) na kugawanya uzito wa data katika vizuizi vidogo. Hii imepunguza matumizi ya kompyuta na hifadhi, huku ikiboresha utendaji wake.
Mifumo hii ina uwezo wa kushughulikia maneno 4,000, lakini baada ya mafunzo ya ziada, uwezo wake unaweza kuongezeka hadi maneno 32,000. Katika mafunzo hayo, tokens trilioni 5 zilitumika ili kuboresha uwezo wa mifumo hii wa kufikiri.
Ufanisi Mkubwa Zaidi ya Ukubwa Wake
Katika majaribio, MobileLLM-R1-950M ilionyesha matokeo ya kuvutia. Katika jaribio la uwezo wa hesabu liitwalo ‘MATH’, mfumo huu ulipata alama 74.0, na kumpiku kidogo mfumo wa Alibaba, Qwen3-0.6B, uliopata alama 73.0.
Katika jaribio la uandishi wa programu, ‘LiveCodeBench’, MobileLLM-R1-950M ilipata alama 19.9, ikiwa mbele sana ya Qwen3-0.6B, iliyopata alama 14.9. Inafurahisha kwamba mfumo wa Meta ulifanya vizuri zaidi, licha ya kufunzwa kwa data ndogo mara 8.6 kuliko mfumo wa Alibaba.
MobileLLM-R1 inasambazwa bure kupitia jukwaa la Hugging Face, lakini matumizi yake ni kwa ajili ya utafiti tu na haikusudiwi kwa matumizi ya kibiashara.
Utoaji wa mifumo hii unafuatia urekebishaji wa muundo wa idara ya utafiti ya Meta FAIR, ambayo imehamishiwa kwenye kundi la ‘Superintelligence Lab (MSL)’. Kundi hili, ambalo pia linajumuisha wataalamu kutoka nje, linafanya kazi kwenye kizazi kijacho cha mifumo ya AI, ikiwemo ‘Llama 4.5’.