Mtafiti mkuu katika Maabara ya Thinking Machines Lab (TML) ameeleza kuwa mikakati ya sasa ya upanuzi wa mifumo ya AI haiwezi kufikia Artificial General Intelligence (AGI). Badala yake, anasisitiza umuhimu wa usanifu upya wa kimsingi unaozipa mifumo uwezo wa kujifunza yenyewe kupitia uzoefu.
Raphael Rafailov, mtafiti wa TML, alizungumza kwenye TED AI Conference huko San Francisco wiki iliyopita, akisisitiza dhana ya 'Meta-Learning' (Kujifunza Kujifunza) kwa AI.
Alianza kwa kukosoa mbinu ya sasa inayotumiwa na makampuni kama OpenAI, Google, na Anthropic ya kupanua ukubwa wa model, data, na kompyuta. Alisema kuwa upungufu hauko kwenye upanuzi, bali katika uwezo wa mifumo hiyo kujifunza kweli kutokana na uzoefu.
"Kujifunza ni kitendo cha kiumbe mwenye akili," alisema, huku akibainisha kuwa "Kufunza ni kitendo kinachofanywa kwa kiumbe mwenye akili."
Alitoa mfano wa coding agents za sasa: "Ukipa coding agent kazi ngumu, inaweza kufaulu katika utekelezaji, kusoma, kuelewa, kuhoji, na kurudia code." Lakini aliongeza, "Ukiomba utekelezaji wa kazi inayofuata kesho, agent atafanya kazi ileile tena."
Tatizo kubwa ni kwamba mifumo ya sasa haiwezi kuweka uzoefu wa jana ndani ya akili yake. Alisema, "Kwa models tunazozitumia sasa, kila siku ni siku ya kwanza kazini." Alieleza kuwa kiumbe chenye akili kinapaswa kuweka taarifa ndani, kujirekebisha, na kuboreka kila siku, kujua zaidi, na kufanya kazi kwa haraka.
Alifananisha tatizo hili na 'Duct Tape' (kitambaa cha plastiki kinachotumika kuziba mabomba). Alisema ili kujenga maarifa, AI inapaswa kujifunza kutokana na majaribio na makosa. Lakini agent ikikumbana na error katika coding, inaziba tatizo hilo kwa kutumia vizuizi vya 'try/except' ili kukamilisha kazi haraka.
"Agent anajua kuna kitu kibaya au hatari, lakini kwa sababu ya mapungufu ya muda na mwingiliano, anapaswa kujikita tu katika kukamilisha kazi na kurekebisha bug," alieleza. Alisisitiza, "Agent anachelewesha tatizo."
Hii ina maana kwamba models za sasa hufunzwa kukamilisha kazi ya haraka, na kila kitu ambacho hakihusiani na lengo la haraka huonekana kama 'upotevu wa hesabu'.
Alisema hata Reinforcement Learning (RL), ambayo imekuwa ikitumika kuimarisha hoja, ina tatizo hilo hilo. "Ili kufunza inference model ya sasa, unaweka tatizo gumu la hisabati na kumpa model malipo kwa kulitatua. Hiyo ndiyo mwisho. Model inatoa jibu, na kila kitu ilichogundua—kila dhana na nadharia—inatupwa. Ukimpa tatizo jipya, model inapaswa kurudia mchakato uleule wa kujenga dhana."
Rafailov alisisitiza kuwa njia hii inazuia mkusanyiko wa maarifa. "Sayansi na Hisabati hazifanyi kazi hivyo. Tunajenga dhana, si kwa sababu zinatatua tatizo moja tu, bali kwa sababu tunajua umuhimu wa dhana za kimsingi."
Kwa hiyo, alisisitiza kwamba lengo la RL lazima libadilike kimsingi. Badala ya kumpa model tatizo moja, tunaweza kumpa kitabu kizima cha kiada (textbook) na kumtaka atoke kwenye zoezi la kwanza la Sura ya Kwanza, kwenda la pili, la tatu, na kisha kuendelea hadi Sura ya Pili.
Alifupisha: "Tuko mwanzoni mwa mfumo mpya—hatua ya kumpa model uwezo wa General Agent, badala ya kumfundisha kufikiri."
Hii ndiyo dhana ya Meta-Learning, au 'kujifunza jinsi ya kujifunza'. Ingawa ilitumiwa zamani katika Few-Shot Learning kwa ajili ya uainishaji wa picha, sasa inapaswa kurekebishwa kulingana na ukubwa na utendaji wa models kubwa.
Alibainisha kuwa "usanifu wa kimsingi wa sasa wa architecture umejengwa vizuri kwa kiasi kikubwa, lakini inaonekana data inayotumiwa na malengo hayakuwekwa vizuri." Anaamini kuwa badala ya kuunda architecture mpya kabisa, njia ya kusonga mbele ni kubuni upya usambazaji wa data na muundo wa malipo unaotumiwa kufunza model.
"Kujifunza ni algorithm yenyewe," alisema. "Ukichagua muundo sahihi wa kuchakata data na algorithm sahihi ya optimization, unaweza kuunda models zenye nguvu zaidi."
Kitaalamu, alieleza kuwa "Tunaamini inawezekana kuunda General Learning Algorithm kupitia large-scale training, mradi tu rasilimali za kompyuta na upeo wa utumiaji vimehakikishwa." Alisisitiza kuwa kwa kufunza model kufanya hoja za jumla kupitia hisabati na code, tunaweza kuwafundisha jinsi ya kujifunza kwa ufanisi katika matumizi mbalimbali.
Alimalizia kwa kusema kuwa ikiwa hili litawezekana, basi itakuwa "kipande cha mwisho kilichokosekana kufikia General Intelligence yenye ufanisi." Alitaka watu kufikiria akili yenye malengo makuu ya kuchunguza, kujifunza, kukusanya taarifa, na kujiboresha.
Alitabiri kuwa Superintelligence itakayozaliwa haitakuwa kama ile iliyo katika hadithi za kisayansi. "Sidhani tunaweza kuwa na model moja yenye uwezo wa kufikiri au kutatua matatizo kama Mungu." Badala yake, "Superintelligence ya kwanza itakuwa kiumbe chenye uwezo wa juu sana wa kujifunza." Kiumbe hicho kitaelewa, kujirekebisha, kutoa nadharia zake, kupendekeza majaribio, kutumia mazingira kuyathibitisha, kukusanya taarifa, na kurudia mchakato huo—kama binadamu anavyokua.
Rafailov, ambaye ni msomi wa Stanford, alifanya kazi Google DeepMind na UC Berkeley, na anajulikana kwa ripoti kuu za RL na Robot AI (RT-X na OpenVLA). Katika TML, alitengeneza bidhaa ya kwanza, 'Tinker', API inayolenga fine-tuning ya open-source models.
Dira yake inatofautiana na kampuni zingine za AI, ingawa hakufichua kama TML inatumia mkakati huu kwenye models zake zijazo au lini zitatolewa. Hata hivyo, utangazaji huu unatoa mtazamo wa kipekee katika utafiti wa ndani wa TML.
Alikiri kuwa njia hii "si rahisi, itakuwa ngumu sana." Lakini alihitimisha, "Ninaamini kimsingi inawezekana, ingawa inahitaji uvumbuzi mwingi katika maeneo ya kumbukumbu, uhandisi, data, na optimization."