Kutoka kwenye vyuo vikuu vya kifahari vya Stanford na UC Berkeley, kwa kushirikiana na watafiti kutoka SambaNova, kumeibuka njia mpya ya kuongeza uwezo wa Miundo Mikuu ya Lugha (LLM - Large Language Models) bila kubadilisha uzito wake wa ndani. Mbinu hii inalenga katika kujifunza na kuendeleza muktadha (context) wenyewe.
Watafiti hao walitangaza mfumo mpya uitwao 'ACE (Agentic Context Engineering)' kupitia hifadhi ya mtandaoni mnamo Oktoba 10. ACE ni mkakati ambao huongeza uwezo wa LLM kujirekebisha kulingana na muktadha unaoingizwa, huku mfumo ukiendelea kurekebisha na kuboresha muktadha wa pembejeo. Kwa lugha rahisi, ACE inasaidia LLM kujijengea na kuboresha maarifa na mikakati yake yenyewe kadri inavyotumika.
Wataalamu walibainisha kuwa mbinu za zamani za kubadilisha muktadha (context adaptation) zilikuwa na matatizo mawili makubwa. Kwanza, 'Upendeleo wa Ufupi' (brevity bias), ambapo taarifa muhimu hupotea kwa sababu ya kufupisha maelezo kupita kiasi. Pili, 'Kuanguka kwa Muktadha' (context collapse), ambapo maelezo ya kina hupotea hatua kwa hatua kupitia marekebisho mengi ya muktadha.
Ili kukabiliana na matatizo haya, ACE hauchukulii muktadha kama ingizo rahisi tu, bali kama 'Kitabu Hai cha Mikakati' (living playbook). Badala ya kubana maagizo yote kuwa prompts fupi, mfumo huu unakusanya na kupanga mikakati maalum ya kazi fulani kwa muda, na kuifanya iwe na uzoefu zaidi na utaalamu.
ACE inaundwa na kazi tatu kuu zinazofanya kazi pamoja ili kupanua na kuboresha muktadha hatua kwa hatua:
- Mzalishaji (Generator): Hii hufanya kazi iliyopewa na kuonyesha michakato iliyosaidia au isiyofaa.
- Mtafakari (Reflector): Huchambua matokeo ya Mzalishaji na kufanya muhtasari wa masomo yaliyopatikana—nini kilikuwa kizuri na nini hakikufanya kazi.
- Msimamizi (Curator): Hii huchukua masomo yaliyopatikana na kuyageuza kuwa 'Vipengele vya Delta' (delta items). Hii inamaanisha kuondoa urudiaji na kuchagua taarifa muhimu tu, kisha kuongeza taarifa hiyo katika 'Kitabu cha Mikakati' kwa utaratibu.
Kwa njia hii, ACE inazuia upotevu wa taarifa muhimu na 'kuanguka kwa muktadha' kwa kudumisha maelezo ya kina ya muktadha na mchakato wa maendeleo yake, huku ikiepuka uandishi upya usio wa lazima.
Matokeo ya majaribio yameonyesha kuwa ACE ilizidi kwa kiasi kikubwa utendaji wa miundo mingine iliyokuwa na nguvu katika nyanja mbalimbali. Hasa, katika kazi za programu-msingi za 'AppWorld', ACE ilionyesha ongezeko la utendaji la wastani wa asilimia 10.6. Pia, katika maswali magumu ya kifedha (XBRL), kulikuwa na uboreshaji wa asilimia 8.6.
Mafanikio mengine muhimu ni kupunguza kwa wastani asilimia 86.9 ya muda unaochukuliwa kubadilisha muktadha, ikionyesha ufanisi na usahihi wa mfumo. Kwa mfano, katika cheo cha AppWorld, muunganisho wa mfumo wa ReAct na ACE, ukitumia programu huria ya 'Deepseek-V3.1', ilifikia usahihi wa asilimia 59.4, ikilingana na utendaji wa mfumo wa IBM CUGA (60.3%) unaotegemea 'GPT-4.1', na hata kuizidi katika maeneo magumu zaidi.
Watafiti walisisitiza kwamba programu za AI na zile maalum za sekta fulani zinazidi kutegemea mbinu ya kurekebisha muktadha kwa kutumia maagizo na mikakati, badala ya kusasisha uzito wa mfumo. Walimalizia kwa kusema kuwa utafiti huu unathibitisha kuwa uboreshaji wa muktadha wa LLM unaweza kuwa na ufanisi wa hali ya juu na uwezo wa kujiboresha wenyewe.