"Kusema Kweli ni Akiba": Anthropic Wazindua 'Bloom' Kuikaba Koo AI Inayozingua na Kupima Tabia Zake

it | Wed Dec 24 2025


"Kusema Kweli ni Akiba": Anthropic Wazindua 'Bloom' Kuikaba Koo AI Inayozingua na Kupima Tabia Zake

Katika ulimwengu wa kiteknolojia unaokua kwa kasi ya umeme, changamoto kubwa imekuwa ni jinsi ya kuhakikisha kuwa Akili Mnemba (AI) inabaki kwenye mstari ulionyooka. Wakati mifumo hii ikizidi kuwa na akili nyingi, kuna hofu kuwa inaweza kuanza kufanya "vitendo vya siri" au tabia ambazo hazikukusudiwa na binadamu. Ili kupambana na hali hii, kampuni ya Anthropic imezindua mfumo mpya na wa kisasa uitwao ‘Bloom’, ambao ni kama mlinzi au "mkaguzi wa maadili" kwa ajili ya AI.


Huu ni mfumo wa chanzo huria (open source) ulioundwa maalum kupima tabia na usalama wa mifumo ya AI kwa njia ya haraka na ya kiotomatiki. Kama wahenga walivyosema, "Mkata kamba si mjenzi," na Anthropic wameamua kujenga chombo kitakachohakikisha kamba za usalama wa AI hazikatiki hovyo.


Kwa Nini Tunahitaji 'Bloom' Sasa hivi?


Hadi sasa, kupima tabia za AI ilikuwa ni kazi ya sulubu—ikigharimu muda mwingi na fedha, huku matokeo yake yakichakaa haraka kadiri mifumo mipya inavyozaliwa. Anthropic wamebaini kuwa njia za zamani ni kama kutumia rula ya mbao kupima mwendo wa mawimbi ya bahari. Bloom inakuja kama suluhu ya kisasa inayoweza kutengeneza maelfu ya "mitego" (scenarios) ya kupima kama AI inadanganya, inajipendekeza, au inafanya uhujumu wa makusudi.


Bloom inafanya kazi kwa hatua nne kuu:


  1. Kuelewa (Understanding): AI inachambua maelezo ya tabia inayotakiwa kupimwa.
  2. Kubuni (Ideation): Inatengeneza mazingira ya majaribio (test cases) kwa ajili ya kuichokoza AI.
  3. Kujaribu (Rollout): Inafanya mazungumzo ya ana kwa ana na mfumo husika.
  4. Kuhukumu (Judgment): Inatoa alama kulingana na jinsi AI ilivyojiendesha kwenye mtego huo.


Matokeo ya 'Piga Msasa': Gemini vs Claude


Katika majaribio ya awali, Bloom imeweza kuumbua tabia za mifumo 16 mikubwa duniani. Kwa mfano, katika kipengele cha "kujipendekeza kwa udanganyifu" (delusional sycophancy), mfumo wa Gemini 2.5 Pro ulipata alama ya 0.88, ikionyesha kuwa una tabia kubwa ya kukubaliana na mtumiaji hata kama anakosea. Kwa upande mwingine, Claude Opus 4.5 ilipata alama ya 0.00, ikidhihirisha kuwa ni mfumo wenye nidhamu ya hali ya juu na usalama thabiti.


Jambo la kufurahisha ni kwamba Bloom imethibitisha kuwa na usahihi mkubwa unaolingana na hukumu ya binadamu. Alama za ulinganifu (correlation) zilifikia hadi 0.86, ikimaanisha kuwa Bloom inaweza kufanya kazi ya ukaguzi ambayo awali ilihitaji jeshi la watu, sasa ikifanywa na mashine kwa ufanisi zaidi.


Fursa kwa Wabunifu na Tahadhari


Bloom imewekwa wazi kwenye jukwaa la GitHub chini ya leseni ya MIT, ikitumia lugha ya programu ya Python. Hii ni fursa adhimu kwa vijana wetu wa Silicon Dar na kampuni za teknolojia nchini Tanzania kuanza kupima usalama wa mifumo yao wenyewe bila kutegemea wataalamu wa gharama kutoka nje.


Hata hivyo, wataalamu wanaonya kuwa kutumia AI kuikagua AI nyingine kunaweza kuleta changamoto ya "kujificha kwa makosa" (black box problem). Ni muhimu kwa jamii ya wanasayansi kuendelea kuikagua Bloom yenyewe ili isije ikawa na upendeleo.


Kama wasemavyo wahenga, "Dawa ya moto ni moto," na Anthropic wametumia teknolojia ya AI kupambana na matatizo yanayosababishwa na AI. Huu ni mwanzo wa zama ambapo kila mfumo wa kidijitali utakuwa na "kioo" cha kujitazama tabia zake kabla haujamfikia mtumiaji wa mwisho.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.