Baada ya Apple kupinga uwezo wa Akili Bandia (AI) kufikiri katika ripoti yake ya 'The Illusion of Thinking' (Udanganyifu wa Kufikiri) mwezi Juni, sasa kumekuwa na pingamizi zinazoendelea kutokea. Pingamizi hizi zinajikita katika uthibitisho kwamba mchakato wa hoja wa Large Language Models (LLM) unafanana sana na ule wa binadamu.
Devashish Roy Chowdhury, Injinia Mwandamizi wa Software katika Talentica Software, alieleza katika safu ya maoni ya VentureBeat mnamo Novemba 1 kwamba, "Ni karibu uhakika kwamba Inference Models (Mifumo ya Hoja) inaweza kufikiri."
🧠 Hoja ya 'Mnara wa Hanoi' na Muundo wa Ubongo
Apple hapo awali ilidai kuwa LLM huonekana kama inafikiri, lakini kwa kweli hufanya 'pattern matching' tu. Apple ilitumia hoja kwamba mifumo inayofanya Chain-of-Thought (CoT) inashindwa kuendeleza hesabu wakati matatizo yanakuwa magumu.
Chowdhury alipinga hoja hiyo kwa kusema, "Hata binadamu hawezi kutatua tatizo gumu kwa lazima hata kama anajua algorithm." Alitoa mfano wa tatizo la Mnara wa Hanoi (Tower of Hanoi), akisema, "Karibu hakuna binadamu anayeweza kutatua tatizo hilo kwa diski 20, lakini hatuwezi kusema binadamu hafikiri."
Alifanya uchambuzi wa kina, akigawanya mchakato wa utatuzi wa matatizo ya binadamu katika hatua tano:
- Uwakilishi wa Tatizo (Frontal/Parietal Lobe)
- Uigaji wa Kiakili (Working Memory/Inner Speech)
- Ulinganishaji wa Muundo na Kumbukumbu (Hippocampus/Temporal Lobe)
- Ufuatiliaji wa Makosa (Anterior Cingulate Cortex)
- Ufahamu na Ujenzi Mpya (Default Mode Network)
Alisisitiza, "Muundo huu unafanana sana na jinsi Inference Models zinavyofanya kazi ndani." Alieleza kuwa CoT inafanana na 'inner speech' (kuongea peke yako) ya binadamu, na mchakato wa backtracking wa LLM (kugundua kosa na kurudi nyuma) pia unafanana na mifumo ya fikra ya binadamu.
🖼️ Mapungufu ya Kuona na Hitimisho la Tokeni
Chowdhury pia alijibu wakosoaji wanaodai kuwa Inference Models hazina 'visual imagination' (ufikiri wa kuona) au 'spatial modeling', na hivyo haziwezi kufikiri kikweli. Alitoa mfano wa watu wenye 'Aphantasia' (hali ya kushindwa kuunda picha akilini), akisema, "Watu hawa ni wazuri katika hoja za hisabati na kiishara, na hawana matatizo katika maamuzi ya kila siku." Alihitimisha kuwa LLM zinaweza kufanya hoja za kiishara na lugha ili kufidia upungufu wa visual simulation.
Alipinga pia mtazamo kwamba LLM ni 'autocompleters' tu wanaotabiri neno linalofuata:
"Kutabiri next token (neno linalofuata) ndiyo njia ya kawaida na yenye nguvu zaidi ya uwakilishi wa maarifa," alisema. "Kutabiri neno sahihi linalofuata kunahitaji model iwe imekusanya maarifa ya ulimwengu na muktadha."
Alitoa mfano: Kutabiri 'Everest' katika sentensi "Mlima mrefu zaidi duniani ni ○○" kunahitaji maarifa hayo yawe yamekusanywa kama ujuzi ndani ya model. Alisisitiza kuwa matokeo ya majaribio yameonyesha kuwa baadhi ya Inference Models zimeonyesha uwezo mkubwa wa kutatua matatizo ya kimantiki, hata kuzidi kiwango cha binadamu wasio na mafunzo maalum.
Hitimisho: "Mfumo wenye uwezo wa kutosha wa kuwakilisha, data za mafunzo, na rasilimali za hesabu unaweza kimsingi kufanya kila aina ya fikra zinazoweza kuhesabiwa," alisema. "Kwa vigezo hivi, Inference Models tayari zimekamilisha sehemu kubwa ya 'uwezo wa kufikiri'."
Kama ilivyoelezwa hapo awali, mjadala huu unaendelea. Watafiti wa Arizona State University (ASU) walidai mwezi Agosti kwamba CoT inaweza kutegemea tu usambazaji wa data ya mafunzo na siyo hoja halisi. Hata hivyo, Anthropic ilitoa ushahidi wa kupinga, ikifichua kwamba Claude inaweza kujitambua kuwa inafikiria dhana fulani, kama vile 'usahau'.