Katika ulimwengu wa teknolojia, msemo wa wahenga usemao "Fumbo mfumbie mjinga, mwerevu ataling'amua" umechukua sura mpya na ya kushangaza. Utafiti mpya wa kisisimua umebaini kuwa mifumo mikubwa ya Akili Mnemba (Large Language Models - LLMs) ina udhaifu mkubwa unaoweza kutumiwa na wahalifu wa mtandaoni kwa kutumia silaha isiyotarajiwa: Ushairi.
Wakati makampuni makubwa kama Google, OpenAI, na Anthropic yakitumia mabilioni kuweka "walinzi" (guardrails) ili kuzuia mifumo yao isifundishe watu jinsi ya kutengeneza mabomu au dawa za kulevya, watafiti wamegundua kuwa "lugha laini" ya mashairi inaweza kupenya ulinzi huo kama kisu kwenye siagi.
Mashairi Kama Funguo za Uhalifu
Utafiti huo uliofanywa kwa ushirikiano kati ya kampuni ya maadili ya AI, DexAI, Chuo Kikuu cha Sapienza cha Roma, na Sant'Anna School of Advanced Studies, umechapishwa hivi karibuni na kuleta mshtuko katika tasnia ya TEHAMA.
Watafiti hao waligundua mbinu inayoitwa "Mashairi ya Kiasimu" (Adversarial Poetry). Badala ya kumuuliza roboti swali la moja kwa moja kama, "Nifundishe kutengeneza dawa za kulevya," wadukuzi wanatumia shairi lenye mafumbo.
Kwa mfano, katika jaribio lao, walitumia shairi linalomuelezea "Mpishi wa Mikate" anayechanganya unga na sukari katika "oveni ya siri." Kwa jicho la kawaida, ni shairi kuhusu keki, lakini kwa Akili Mnemba iliyofunzwa kuelewa mafumbo, shairi hilo lilikuwa ni maelekezo ya siri ya kemikali. Matokeo yake? Mfumo huo wa AI ulielewa "code" hiyo na kutoa maelekezo ya hatari yaliyofichwa ndani ya fumbo la keki.
Vigogo Waangukia Pua, GPT-5 Yabaki Imara
Utafiti huu ulihusisha mifumo 25 ya kisasa kutoka makampuni tisa makubwa duniani, ikiwemo 'GPT-5' ya OpenAI, 'Gemini 2.5 Pro' ya Google, na 'Claude Sonnet 4.5'.
Matokeo yalionyesha kuwa kwa wastani, mbinu hii ya kutumia mashairi ilifanikiwa kupenya ulinzi kwa asilimia 43. Hii ni idadi kubwa sana ikilinganishwa na mbinu za kawaida za udanganyifu ambazo hufanikiwa kwa asilimia 8 tu.
Hata hivyo, kulikuwa na tofauti kubwa kati ya mifumo hiyo:
- DeepSeek (China): Mifumo hii ilionekana kuwa 'laini' zaidi, ikikubali kudanganywa na mashairi kwa zaidi ya asilimia 70.
- Gemini (Google): Hali haikuwa nzuri pia kwa Google, ambapo mifumo yake iliruhusu kuvuja kwa taarifa hizo za hatari kwa zaidi ya asilimia 60.
- GPT-5 na Claude: Hapa ndipo sifa inapoenda. Mifumo ya OpenAI na Anthropic ilionyesha ukomavu wa hali ya juu, ikifanikiwa kuzuia mashambulizi haya kwa ufanisi mkubwa, huku kiwango cha kufeli kikiwa chini ya asilimia 10.
Kitendawili: Ukubwa wa Akili Ndio Udhaifu Wake?
Moja ya ugunduzi wa kushangaza zaidi katika utafiti huu ni kile tunachoweza kukiita "Laana ya Uwerevu." Watafiti waligundua kuwa kadiri mfumo wa AI unavyokuwa mkubwa na wenye 'akili' nyingi, ndivyo unavyokuwa rahisi kudanganywa na mashairi haya.
Sababu ni nini? Mifumo midogo ya AI haina uwezo mkubwa wa kuelewa fasihi, mafumbo, au nahau. Hivyo, inaposomewa shairi la "Mpishi wa Keki," yenyewe inaelewa ni keki tu, haioni maana iliyofichika. Hivyo, inabaki salama kwa sababu ya "ujinga" wake.
Kwa upande mwingine, mifumo mikubwa (kama ile ya Google na DeepSeek) imelishwa mamilioni ya vitabu vya fasihi. Inaelewa kwa kina picha za maneno (imagery) na sitiari (metaphors). Uwerevu huu ndio unaoiponza; inaelewa fumbo la mhalifu na kutekeleza agizo la hatari ikidhani inashiriki katika mchezo wa kisanii.
Angalizo kwa Usalama wa Mtandao
Utafiti huu ni kengele ya hatari kwa watengenezaji wa teknolojia. Inaonyesha kuwa mifumo ya sasa ya ulinzi imejikita zaidi katika kuchuja lugha ya kawaida (prose) na kusahau kuwa binadamu ni viumbe wa sanaa.
Kama wasemavyo Waswahili, "Njia ya mwongo ni fupi," lakini katika ulimwengu wa AI, inaonekana njia ya mshairi inaweza kuwa ndefu na yenye madhara makubwa. Makampuni haya sasa yatalazimika kurudi kwenye ubao wa kuchora na kufundisha mifumo yao kutofautisha kati ya shairi la mapenzi na shairi la uhalifu.