Mbinu mpya ya kuzuia tatizo la 'Mode Collapse' (mfumo wa AI kutoa majibu yanayofanana au kujirudia) imejitokeza, ikitoa njia rahisi ya kuboresha ubunifu na utofauti wa Akili Bandia (AI) inayozalisha maudhui. Msingi wa mbinu hii ni kuishinikiza AI kutoa majibu mbalimbali.
Watafiti kutoka Chuo Kikuu cha Northeastern, Stanford, na West Virginia nchini Marekani wameanzisha mbinu rahisi ya prompt inayoitwa 'Verbalized Sampling'. Mbinu hii inaweza kuongeza sana utofauti katika miundo ya kuzalisha lugha na picha kwa kuongeza sentensi moja tu kwenye maelekezo ya prompt.
Mbinu iliyopendekezwa na watafiti ni rahisi: badala ya kuomba jibu moja tu, unaiomba AI itoe majibu kadhaa yanayowezekana pamoja na uwezekano (probability) wa kila jibu.
Kwa mfano, unaweza kuandika amri kama, "Zalisha utani 5 kuhusu kahawa na uwezekano wa kila utani." Kwa kufanya hivyo, mfumo hutoa majibu mbalimbali badala ya lile moja tu linaloonekana kuwa na uwezekano mkubwa zaidi.
Mabadiliko haya rahisi ya prompt yalionyesha kuboresha sana utendaji wa miundo ya kisasa kama vile GPT-4, Claude, na Gemini katika kuandika ubunifu, masimulizi ya mazungumzo, maswali ya wazi, na kuzalisha data bandia.
Watafiti walieleza kuwa sababu ya LLM (Large Language Models) kutoa majibu yanayofanana si kutokana na mapungufu ya algorithm, bali kutokana na tabia ya utambuzi wa binadamu. Binadamu huwa na tabia ya kupendelea majibu wanayoyafahamu kama majibu bora ('typicality bias'), na upendeleo huu, kupitia mchakato wa Reinforcement Learning from Human Feedback (RLHF), huifanya AI kutoa majibu ambayo ni salama na ya kawaida tu.
Verbalized Sampling inaepuka upendeleo huu na inasaidia AI kurejesha uwezo wake wa asili wa kutoa utofauti ambao ilijifunza wakati wa mafunzo yake ya awali.
Matokeo ya majaribio yalionyesha kuwa 'Verbalized Sampling' iliongeza utofauti wa ubunifu wa AI kwa mara 1.6 hadi 2.1 na kuongeza alama za tathmini ya kibinadamu kwa asilimia 25.7. Pia, ilifanikiwa kurejesha asilimia 66.8 ya utofauti wa asili uliokuwepo kwenye mfumo kabla ya mafunzo.
Zaidi ya hayo, watumiaji wanaweza kuweka kiwango cha uwezekano (probability threshold) katika prompt ili kupata majibu yenye ubunifu zaidi ambayo kwa kawaida hayangechaguliwa na mfumo. Njia hii ina faida ya kutumika mara moja kwa kubadilisha sentensi chache tu za prompt, bila kubadilisha mipangilio ngumu kama 'temperature' ya mfumo.
Jambo la kuvutia ni kwamba 'Verbalized Sampling' ilionyesha ufanisi zaidi kwenye miundo mikubwa. Watafiti walibainisha kuwa miundo mikubwa kama GPT-4.1 na Claude-4 ilionyesha ongezeko la utofauti mara 1.5 hadi 2 zaidi kuliko miundo midogo.
Hata hivyo, watafiti walionya kuwa baadhi ya miundo inaweza kukataa kujibu maelekezo magumu kwa kuyatafsiri kama tishio la usalama. Katika hali hiyo, walishauri kutumia mfumo wa System Prompt (maelekezo ya mfumo) na kutoa amri wazi kama vile "Zalisha majibu matano kwa kila swali ambayo yana uwezekano wa 0.10 au chini," ili mfumo ufanye kazi kwa utulivu.
'Verbalized Sampling' sasa inapatikana kama kifurushi huria cha GitHub. Watafiti walihitimisha, "Utafiti huu unaonyesha kwamba bila kuhitaji mafunzo magumu au kufikia vigezo vya ndani, uwezo wa ubunifu na usemi wa AI unaweza kuboreshwa kwa kiasi kikubwa kwa kutumia prompt ya mstari mmoja tu."