Meta Yazindua 'SAM 3', Akili Mnemba Inayochambua Video na Picha Kama Mchawi

it | Tue Nov 25 2025


Meta Yazindua 'SAM 3', Akili Mnemba Inayochambua Video na Picha Kama Mchawi

Dunia ya teknolojia haipo tayari kulala, na kila kukicha mambo yanazidi kuwa "bull" kama wasemavyo vijana wa mjini. Kampuni ya Meta, wamiliki wa mitandao pendwa ya Facebook, Instagram, na WhatsApp, imefanya mapinduzi mengine makubwa kwa kuzindua toleo jipya la Akili Mnemba (Artificial Intelligence) linaloitwa 'SAM 3' (Segment Anything Model 3). Hii siyo tu 'software' ya kawaida; ni mfumo wenye uwezo wa kutisha wa kutambua, kutenganisha, na kufuatilia kitu chochote kwenye picha au video kwa amri ya maneno au picha tu.


Kwa wale wapiga picha, waandaaji wa video (videographers), na wabunifu wa michoro (graphic designers) hapa Tanzania, hii ni habari njema na pia ni changamoto mpya. Kazi iliyokuwa inachukua masaa kukata picha (cropping) au kufuatilia kitu kwenye video (tracking), sasa inafanywa na SAM 3 kwa sekunde chache.


SAM 3 Ni Nini na Inafanya Nini?


Tofauti na matoleo ya zamani yaliyohitaji maelekezo magumu (fixed labels), SAM 3 imekuja na teknolojia mpya inayoitwa Promptable Concept Segmentation (PCS). Kwa lugha nyepesi, teknolojia hii inaelewa "dhana" (concepts).


Hebu vuta picha uko Uwanja wa Mkapa unaangalia mechi ya Watani wa Jadi, Simba na Yanga. Unataka kompyuta iwatambue na kuwatenga wachezaji wa Simba tu kwenye video. Zamani ilikuwa kazi ngumu, lakini kwa SAM 3, unaiandikia tu: "Wachezaji waliovaa jezi nyekundu" au unaiwekea picha ndogo ya jezi ya Simba kama mfano. Papo hapo, SAM 3 inapita kwenye video nzima, inawatambua wachezaji hao, inawafuatilia wanakokimbia, na kuwatenga na wachezaji wa Yanga au waamuzi.


Mfumo huu unatumia akili ya hali ya juu kutofautisha vitu vinavyofanana. Kwa mfano, inaweza kutofautisha kati ya "Basi la Shule la Njano" na gari lingine la njano, au kati ya mchezaji mweupe na mchezaji mwekundu, kwa kutumia kile wanachoita "Tokeni ya Uwepo" (Presence Token) ili kuondoa mkanganyiko.


Uwezo wa Kipekee: Video na Picha kwa Pamoja


Uzuri wa SAM 3 ni kwamba haichagui; inakula sahani moja na picha mnato (images) na video. Inatumia mfumo wa ufuatiliaji (tracker) uliorithiwa kutoka SAM 2 lakini ulioboreshwa zaidi. Hii inamaanisha kuwa hata kama kitu kinasonga kwa kasi kwenye video, au kinapotea kidogo na kurudi (occlusion), SAM 3 haipotezi mwelekeo. Inashikilia "ID" ya kitu hicho mwanzo mwisho.


Wataalamu wa Meta wameiunganisha SAM 3 na mifumo mikubwa ya lugha (Multimodal LLMs), ikimaanisha inaweza kuelewa maelekezo marefu na magumu ya maandishi na kuyafanyia kazi kwa usahihi wa hali ya juu.


Imewabwaga Washindani


Kwenye ulimwengu wa teknolojia, namba hazidanganyi. Meta wameifanyia majaribio SAM 3 kwenye hifadhi kubwa ya data (dataset) yenye dhana zaidi ya milioni 4. Katika vipimo vya kimataifa (benchmarks) kama SA-Co, SAM 3 imefikia ufanisi wa asilimia 75 hadi 80 wa uwezo wa jicho la binadamu.


Hii ni hatua kubwa sana. Katika mashindano hayo, SAM 3 imezishinda "akili" nyingine maarufu kama Google Gemini 2.5, OWLv2, na DINO-X. Hii inaonyesha kuwa kwa sasa, Meta imekaa kileleni kwenye teknolojia ya uoni wa kompyuta (Computer Vision).


Zawadi kwa Wasanidi Programu


Habari njema zaidi ni kwamba Meta imeamua kutoa teknolojia hii bure (Open Source). Koodi (Code) na modeli za SAM 3 zinapatikana kwenye majukwaa ya Hugging Face na GitHub.


Hii ni fursa ya dhahabu kwa vijana wa Kitanzania walio kwenye sekta ya TEHAMA (Silicon Dar). Wanaweza kuchukua teknolojia hii na kuitumia kutengeneza programu za kilimo (mfano: kutambua wadudu kwenye mimea kwa kupiga picha), usalama (kwenye CCTV), au hata kwenye tasnia ya burudani na utengenezaji wa video za muziki (Bongo Flava videos) kwa ubora wa kimataifa.


Kama Meta walivyosema, lengo ni kuifanya kompyuta ione na kuelewa dunia kama binadamu anavyoona, na kwa SAM 3, wamepiga hatua moja kubwa kuelekea huko.

The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.