Google Yazindua 'FLAME': AI Agent Inayoboresha Picha za Satellite na Ndege kwa Kujifunza kwa Dakika Moja Tu kwa Kutumia CPU

it | Tue Oct 28 2025


Google Yazindua 'FLAME': AI Agent Inayoboresha Picha za Satellite na Ndege kwa Kujifunza kwa Dakika Moja Tu kwa Kutumia CPU

Teknolojia mpya imejitokeza inayoweza kutambua vitu maalum kwa usahihi zaidi kutoka kwenye picha za setilaiti na ndege. Google imefichua mfumo wa mafunzo unaoitwa 'FLAME' (Few-shot Lightweight Active Model Enhancement) unaolenga kushinda mapungufu ya sasa ya mifumo ya Open Vocabulary Object Detection (OVD) inayotegemea Akili Bandia (AI).


Mfumo huu wa FLAME unatatua tatizo la kupungua kwa usahihi wa utambuzi ambalo mifumo ya OVD inakumbana nalo wakati wa kuchambua picha tata kama zile za satelaiti au ndege. Kinachovutia zaidi ni kwamba unaweza kufunzwa ndani ya dakika moja tu kwa kutumia CPU badala ya GPU, na kuufanya kuwa mfumo wa utambuzi wa vitu wenye kasi na uzito mdogo.


Mfumo wa OVD unaruhusu mtumiaji kutafuta kitu fulani kwenye picha kwa kutoa neno tu. Hata hivyo, katika mazingira ambapo kuna tofauti za urefu, pembe za mzunguko, na uhitaji wa kutofautisha maumbo madogo (kama picha za setilaiti), usahihi hupungua sana. Kwa mfano, inakuwa vigumu kutofautisha vitu vyenye maumbo yanayofanana kama 'Boti ya Uvuvi' na 'Yacht', kwani taarifa zao za embedding (uwakilishi wa hisabati) huingiliana.


Google imetangaza mfumo mpya wa FLAME, unaochanganya 'uwezo mpana wa ujumuishaji' wa Large Pre-trained Models na 'usahihi wa hali ya juu' wa Lightweight Local Classifiers (uainishaji mwepesi wa ndani) ili kutatua tatizo hili.


Utaratibu na Ufanisi wa FLAME


Kiini cha FLAME ni muundo wa 'One-step Active Learning' (Kujifunza kwa Hatua Moja).


  1. Uzalishaji wa Wagombea: Model yenye utendaji wa juu ya OVD kama vile OWL ViT v2 inatumika kuzalisha kiasi kikubwa cha maeneo yanayowezekana (candidate boxes) kulingana na neno la utafutaji lililoingizwa.
  2. Uchaguzi wa Sampuli: FLAME hufanya makadirio ya msongamano (density estimation) katika low-dimensional feature space (nafasi ya sifa zenye vipimo vichache) ili kutambua sampuli zisizo na uhakika karibu na mipaka. Kisha hupanga sampuli hizi ili kuhakikisha utofauti wa data.
  3. Mafunzo ya Classifier: Sampuli chache tu zilizochaguliwa (takribani picha 30) zinawasilishwa kwa mtumiaji. Mtumiaji huweka lebo rahisi (chanya au hasi) kwenye picha hizo chache. Data hii ndogo hutumika kufunza classifier ndogo.
  4. Uimarishaji wa Usahihi: Wakati model kubwa ya awali inabaki thabiti (frozen) ili kudumisha recall (uwezo wa kutambua vitu vyote), classifier mpya inafunzwa kuongeza semantic precision (usahihi wa kimaana) na hivyo kuboresha usahihi wa matokeo.


Mfumo huu unatumia CPU tu na inaweza kujifunza kwa wakati halisi (real-time learning) ndani ya dakika 1. Hii inamaanisha kuwa model inaweza kujirekebisha haraka katika mazingira ya picha kubwa za setilaiti na ndege.


Uthibitishaji wa Utendaji


FLAME ilithibitishwa kwa kutumia benchmarks muhimu za utambuzi wa vitu vya Remote Sensing (Utambuzi wa Mbali), DOTA na DIOR.


  1. Model ya awali ya OWL ViT v2 ilirekodi utendaji wa Zero-shot wa 31.8% (DOTA) na 29.4% (DIOR) mAP.
  2. FLAME ilitumika kwa mafunzo ya Few-shot (sampuli 30), na matokeo yaliongezeka kwa kiasi kikubwa, yakifikia 53.96% (DOTA) na 53.21% (DIOR) mAP, utendaji wa juu zaidi kuliko models zote zilizolinganishwa.


Hasa zaidi, usahihi wa utambuzi wa vitu kama 'chimney' (mifumo ya moshi) katika dataset ya DIOR iliongezeka ghafla kutoka 0.11 (Zero-shot) hadi 0.94 (baada ya FLAME). Hii inaonyesha ufanisi wa FLAME katika kuondoa makosa ya utambuzi (False Positives) kati ya vitu vyenye kufanana kimaono.


Google ilisema utafiti huu unatoa "Mfumo wa vitendo" wa kurekebisha haraka na kwa gharama nafuu VLM kubwa kwa ajili ya domains maalum. Walihitimisha kuwa teknolojia hii itaharakisha uenezaji wa matumizi ya AI katika maeneo mbalimbali kama vile picha za satelaiti, uchunguzi wa kimatibabu, na ukaguzi wa viwandani.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.