AI Mjanja Lakini Muongo? Wanasayansi Wavumbua 'Kipima Uongo' cha Ndani ya Ubongo Wake

Sote tumekumbana na hili: unauliza Akili Mnemba (AI) kama ChatGPT au Gemini swali, na inakupa jibu zuri, la kujiamini, na lililopangwa vizuri. Tatizo ni moja tu: jibu hilo ni la uongo mtupu. Hali hii, ambayo wataalamu wanaiita "hallucinations" (maono), ndiyo donda ndugu kubwa linaloikabili teknolojia hii. Hatari inakuwa kubwa zaidi pale ambapo mtumiaji (kama wewe au mimi) hana utaalamu wa kuthibitisha kama jibu alilopewa ni sahihi au la.

Fikiria unauliza AI kuhusu dalili za ugonjwa au ushauri wa kisheria; jibu la uongo linaweza kuleta maafa makubwa.

Hadi sasa, njia pekee ya "kuhakiki" jibu la AI ilikuwa ni kuuliza swali lilelile mara kadhaa kwa mitindo tofauti. Ikiwa AI inakupa majibu yanayofanana, uwezekano ni kwamba jibu hilo ni sahihi. Lakini njia hii inatumia muda mwingi na ni ya gharama kubwa, kwani kila swali unalouliza linatumia nguvu za kompyuta.

Lakini sasa, watafiti kutoka Chuo Kikuu cha Michigan (MSU) nchini Marekani wamegundua mbinu mpya ya kijanja na yenye ufanisi zaidi. Wameunda kitu wanachokiita 'CCPS'—mfumo ambao unafanya kazi kama 'Kipima Kujiamini' (Confidence Dashboard) cha AI, lakini ukiangalia ndani ya 'ubongo' wake.

Jinsi Mfumo Huu Mpya Unavyofanya Kazi

Badala ya kuuliza maswali mengi, CCPS inatumia mbinu tofauti kabisa: inamchokoza AI kidogo wakati inafikiri.

Hebu fikiria hivi: Unamwuliza rafiki yako swali gumu. Wakati anaanza kujibu, unamtingisha kidogo begani au unampiga 'mshtuo' (nudge) mdogo.

Ikiwa rafiki yako alikuwa na uhakika na jibu lake, 'mshtuo' huo hautamtoa kwenye mstari. Ataendelea na jibu lake lilelile bila kuyumba.
Lakini, ikiwa alikuwa anabahahatisha au "anapiga blafu," ule 'mshtuo' mdogo tu utamchanganya, ataanza kujiumauma, na huenda akabadilisha kabisa jibu lake.

CCPS inafanya kazi vivyo hivyo kwa AI. Wakati AI inatengeneza jibu (tokeni kwa tokeni), mfumo huu unaingilia kati na kuweka 'mshtuko mdogo sana wa kihisabati' (a tiny perturbation) kwenye 'ubongo' wake wa ndani (hidden state).

Kisha, CCPS inachunguza: Je, 'mshtuko' huu mdogo umebadilisha jibu ambalo AI ilikuwa inataka kutoa? Ikiwa jibu linabadilika kirahisi, ni ishara tosha kwamba AI yenyewe haikuwa na uhakika na jibu hilo tangu mwanzo. Mfumo huu kisha unatoa alama ya "kujiamini" (confidence score) inayoonyesha uwezekano wa jibu hilo kuwa sahihi.

Matokeo ni ya Kushangaza

Katika majaribio yaliyofanywa kwa kutumia mifumo mbalimbali ya AI (kama 'Llama', 'Qwen', na 'Mistral'), mbinu hii ya CCPS ilionyesha matokeo bora zaidi kuliko mbinu zozote zilizopita. Ilipunguza makosa ya AI kujiamini kimakosa kwa 55% na kuongeza usahihi wa jumla kwa alama kadhaa za asilimia.

Hii ina maana kwamba sasa tuna kifaa kinachoweza kutofautisha kati ya "kile AI inachokijua kweli" na "kile AI inachodhani tu inajua."

Watafiti wamesema hii ni hatua muhimu sana katika zama hizi ambapo AI inazidi kutegemewa. Uwezo huu ni muhimu sana katika sekta nyeti kama vile uchunguzi wa magonjwa (medical diagnosis) au maamuzi ya kifedha (financial decisions), ambapo kosa moja dogo la AI linaweza kugharimu maisha au mabilioni ya fedha.

Kwa bahati nzuri, watafiti hawa wameweka 'code' zao za CCPS hadharani (kwenye GitHub), wakiruhusu watengenezaji wengine duniani kuanza kutumia mbinu hii ili kufanya AI zao ziwe salama na za kuaminika zaidi.

Swahili News

AI Mjanja Lakini Muongo? Wanasayansi Wavumbua 'Kipima Uongo' cha Ndani ya Ubongo Wake

Related Articles