Mwalimu Kazi Hana? Meta Yavumbua AI Inayojifunza Kujitegemea Kama Binadamu

Kwa miaka mingi, tumekuwa tukizoea mifumo ya Akili Mnemba (AI) ambayo inahitaji binadamu (wahandisi) kuilisha data, kuifundisha, na kuisahihisha pale inapokosea. Lakini vipi kama AI inaweza kujifundisha yenyewe, kujitahini, na kuwa na akili zaidi kila sekunde bila msaada wa mtu yeyote? Hili sasa linaanza kuwa ukweli.

Watafiti kutoka maabara ya utafiti ya Meta (FAIR) kwa kushirikiana na Chuo Kikuu cha Taifa cha Singapore wamezindua mfumo mpya wa kimapinduzi unaoitwa SPICE (Self-Play In Corpus Environments). Huu ni mfumo unaoiwezesha AI kujiboresha yenyewe kwa kutumia mbinu ya kipekee ya "kujifunza kwa kujishindana."

AI Inayovaa Kofia Mbili: Mwalimu na Mwanafunzi

Ili kuelewa jinsi SPICE inavyofanya kazi, fikiria wewe ni mwalimu na mwanafunzi kwa wakati mmoja. Mfumo huu wa AI hufanya kazi kwa kugawanyika katika nafasi mbili tofauti:

Mtoa Changamoto (The Challenger): Katika nafasi hii, AI hufanya kazi kama mwalimu mgumu. Inachukua rundo kubwa la data kutoka kwenye vyanzo halisi (kama vile nyaraka za mtandaoni), inazisoma, na kisha inatunga maswali magumu na ya kimantiki kutokana na data hizo. Inaweza kutunga maswali ya kuchagua (multiple choice) au maswali ya kujieleza kwa kirefu.
Mtatuzi (The Reasoner): Baada ya kutunga maswali, AI hubadilika na kuwa 'mtahiniwa'. Katika nafasi hii, inajaribu kujibu yale maswali iliyojitungia yenyewe.

Kinachofanya Mfumo Huu Kuwa Bora Zaidi

Hapa ndipo kuna ujanja mkubwa wa kiteknolojia. Mifumo ya zamani ya "kujifunza kwa kujishindana" ilikuwa na tatizo kubwa: AI zote mbili (mwalimu na mwanafunzi) zilikuwa zinatumia data zilezile, hivyo ilikuwa rahisi kwao "kudanganya" au kukariri majibu. Hali hii pia ilisababisha AI kuanza "kuzua mambo" (hallucinations) au kurudiarudia aina zilezile za maswali kwa sababu hazikuwa zinapata maarifa mapya.

SPICE inatatua tatizo hili kwa kutumia kitu kinachoitwa "utofauti wa taarifa" (information asymmetry). Mfumo huu umeundwa hivi:

Mtoa Changamoto (Mwalimu) anaruhusiwa kutumia vyanzo vya nje (kama kurasa za wavuti) kutunga maswali.
Lakini Mtatuzi (Mwanafunzi) anazuiwa kuona au kufikia zile nyaraka ambazo mwalimu alitumia kutunga maswali.

Hii inailazimisha AI 'Mtatuzi' kufikiri kweli, kuchambua, na kutoa majibu kwa kutumia mantiki yake ya ndani, badala ya kukariri au kunakili kutoka kwenye chanzo.

Katika mchakato huu, "Mwalimu" anapata alama za juu (rewards) ikiwa atatunga swali zuri ambalo liko katika kiwango sahihi—siyo jepesi sana wala siyo gumu la kumshinda 'Mwanafunzi' kabisa. Na "Mwanafunzi" anapata alama kwa kujibu swali hilo kwa usahihi. Huu mzunguko wa kujiboresha unaendelea bila kikomo na bila kuhitaji binadamu kuingilia kati.

Watafiti wanasema mbinu hii inaiwezesha AI kukua kiakili kwa kutumia hazina kubwa ya maarifa ya binadamu yaliyopo kwenye intaneti, badala ya kujifungia katika ulimwengu wake mdogo.

Matokeo Yanaonyesha Mafanikio

Mfumo huu si nadharia tu; umefanyiwa majaribio kwenye mifumo mingine ya AI kama 'Qwen3' na 'OctoThinker'. Matokeo yalikuwa ya kuridhisha sana:

Uwezo wa kufanya mahesabu ya kimantiki (mathematical reasoning) uliongezeka kwa 8.9%.
Uwezo wa kuchambua mambo kwa ujumla (general reasoning) uliongezeka kwa 9.8%.

Muhimu zaidi, kadiri mafunzo yalivyoendelea, uwezo wa AI kutatua matatizo ulipanda kutoka kiwango cha 55% hadi kufikia 85%.

Watafiti wanaita hii "mabadiliko makubwa ya kimtazamo" katika uundaji wa AI inayojitegemea. Hatua inayofuata ni kuipanua teknolojia hii ili isijifunze kutoka kwenye maandishi pekee, bali iweze kujifunza kutoka kwenye picha, video, sauti, na data za kihisia (sensor data), ikiiweka katika njia ya kuelewa ulimwengu halisi kama sisi.

Swahili News

Mwalimu Kazi Hana? Meta Yavumbua AI Inayojifunza Kujitegemea Kama Binadamu

Related Articles