Katika ulingo wa ushindani mkali wa teknolojia ya akili bandia (AI), matokeo ya jaribio la kina yamebainisha kuwa mfumo wa 'AI Mode' wa Google ndio unaotoa majibu sahihi zaidi ikilinganishwa na mifumo mingine mikuu ya utafutaji. Utafiti huu, ulioendeshwa na gazeti maarufu la Marekani, Washington Post, kwa kushirikiana na wataalamu wa maktaba za umma na vyuo vikuu, umetoa mwanga kuhusu uwezo na mapungufu ya zana hizi muhimu za kidijitali.
Jaribio hili kali lilihusisha mifumo tisa maarufu ya AI, ikiwemo Google AI Mode na AI Overview, ChatGPT (kutoka OpenAI), Claude (kutoka Anthropic), Meta AI, Grok (kutoka xAI ya Elon Musk), Perplexity, na Bing Copilot (kutoka Microsoft). Hii ina maana kuwa vigogo wote wa teknolojia duniani waliwekwa kwenye mizani kupima nani ni nani katika kutoa majibu yenye uhakika.
Ili kupata matokeo ya kuaminika, watafiti waliuliza maswali 30 magumu na yenye changamoto, na kukusanya takriban majibu 900 ambayo yalipimwa kwa vigezo mbalimbali. Maswali yaligawanywa katika nyanja tano: maswali ya kawaida (quiz), utafutaji wa vyanzo vya kitaalamu, matukio ya hivi karibuni, upendeleo uliopo kwenye majibu, pamoja na uwezo wa kutambua picha. Matumizi yalilenga matoleo ya bure ya mifumo hii ili kuakisi uhalisia wa watumiaji wengi.
Matokeo ya jumla yaliipa Google AI Mode ushindi kwa kupata alama 60.2 kati ya 100. Nafasi ya pili ilichukuliwa na ChatGPT-5 kwa alama 55.1, huku Perplexity ikishika nafasi ya tatu kwa alama 51.3. Kwa upande mwingine, mfumo wa Grok 3 wa Elon Musk ulishika nafasi ya nane kwa alama 40.1, na Meta AI ikaburuza mkia kwa kupata alama 33.7 pekee.
Hata hivyo, ushindi wa Google haukuwa wa jumla katika kila nyanja. Utafiti ulibaini kuwa wakati Google AI Mode iling'ara kwenye maswali ya kawaida na matukio ya hivi karibuni, mfumo wa Bing Copilot ulikuwa bora zaidi katika kutafuta vyanzo vya kitaalamu. Perplexity iliongoza kwa uwezo wa kutambua picha, huku ChatGPT-4 Turbo ikisifiwa kwa kutoa majibu yasiyo na upendeleo wowote.
Licha ya ushindani huu, Washington Post ilitoa angalizo muhimu: jaribio hili lilidhihirisha kuwa mifumo yote ya AI bado ina changamoto kubwa katika kutoa majibu sahihi kwa maswali mengi ya kawaida. Moja ya mapungufu makubwa ni ugumu wa AI kuthibitisha kama taarifa ni ya kisasa na kutathmini uaminifu wa chanzo cha habari. Zaidi ya hayo, AI zina tabia ya kutoa majibu yasiyo sahihi huku zikionyesha kujiamini kupita kiasi.
Funzo kuu, kama lilivyosisitizwa na wachambuzi, ni kwamba watumiaji hawapaswi kuamini majibu ya AI moja kwa moja. Badala yake, inasisitizwa umuhimu wa kuwa na fikra tunduizi, kama afanyavyo mkutubi, kwa kuhakiki vyanzo vya habari, kuthibitisha usasa wa taarifa, na kutafakari kwa kina kabla ya kukubali jibu la AI kama ukweli usiopingika.