Vita vya AI: Mfumo Mpya 'o3' wa OpenAI Waipiku Gemini ya Google Kwenye Sayansi

it | Sat Jul 12 2025


Vita vya AI: Mfumo Mpya 'o3' wa OpenAI Waipiku Gemini ya Google Kwenye Sayansi

Katika uwanja wa vita vya teknolojia ya Akili Mnemba (AI), kampuni ya OpenAI, watengenezaji wa ChatGPT, imezindua silaha mpya. Mfumo wao mkuu wa lugha (LLM) unaoitwa 'o3' umetangazwa kuwa kinara katika uwezo wa kujibu maswali magumu ya kisayansi, ukiipiku mifumo mingine mashuhuri ikiwemo Gemini ya Google.


Matokeo haya yametolewa kupitia jukwaa jipya la upimaji liitwalo 'SciArena', lililotengenezwa na Taasisi ya Utafiti wa Akili Mnemba ya Allen (Allen Institute for AI), taasisi isiyo ya kiserikali iliyoanzishwa na mwanzilishi mwenza wa Microsoft, Paul Allen. Jukwaa hili limeundwa mahususi kupima na kulinganisha uwezo wa mifumo mbalimbali ya AI katika nyanja za kitaaluma.


Katika upimaji huu, mifumo 23 ya kisasa ya AI ilijaribiwa kwa kujibu maswali kutoka nyanja nne kuu: Sayansi Asilia, Uhandisi, Afya na Tiba, na Sayansi ya Jamii na Binadamu. Majibu ya mifumo hiyo yalipitiwa na kutathminiwa na jopo la watafiti halisi wa kibinadamu wapatao 102. Kipengele muhimu kilichoongeza uzito wa upimaji huu ni kwamba kila jibu la AI liliambatanishwa na vyanzo halisi vya machapisho na tafiti za kitaaluma, ili kuthibitisha usahihi na ukweli wa majibu.


Matokeo yalikuwa ya wazi: Mfumo wa 'o3' wa OpenAI uliibuka mshindi katika nyanja zote nne. Katika nafasi za pili, mfumo wa R1 kutoka kampuni ya DeepSeek ya China ulishika nafasi ya pili kwenye Sayansi Asilia, huku Gemini 2.5-Pro ya Google ikishika nafasi ya tatu katika fani hiyo na ya tano katika fani za Uhandisi na Tiba.


Kwa mujibu wa watafiti, ushindi wa 'o3' ulitokana na uwezo wake wa kutoa majibu ya kina ya kitaalamu na maelezo ya kina kuhusu vyanzo vya kitaaluma ilivyovitumia. Hata hivyo, walisema ni vigumu kueleza kwa uhakika nini kinasababisha tofauti kubwa ya uwezo kwa kuwa mifumo mingi ni ya siri.


Wanasayansi wanaona kuwa ikiwa mifumo hii ya LLM itaweza kutoa majibu ya kuaminika ya kisayansi, inaweza kuwa nyenzo muhimu sana kuwasaidia watafiti kufuatilia mamilioni ya tafiti mpya zinazochapishwa kila mwaka. Pamoja na hayo, wanatoa angalizo muhimu: ni lazima ikumbukwe kuwa mifumo hii bado inaweza kufanya makosa, kutafsiri vibaya maneno, au hata kutoa majibu yanayokinzana na vyanzo ilivyovinukuu.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.