Dunia Haina Lugha Tena: Google Yazindua 'Gemini 2.5' Inayotafsiri Sauti Papo kwa Papo Kama Binadamu

it | Sun Dec 14 2025


Dunia Haina Lugha Tena: Google Yazindua 'Gemini 2.5' Inayotafsiri Sauti Papo kwa Papo Kama Binadamu

Hebu vuta picha unatembea mitaa ya Tokyo au Paris, na unaweza kuongea na wenyeji bila kujua lugha yao, huku simu yako ikitafsiri siyo maneno tu, bali hadi hisia na sauti yako kwa wakati huo huo. Hii si ndoto tena. Kampuni ya Google imefanya mapinduzi makubwa kwa kuzindua toleo jipya la ‘Gemini 2.5 Flash Native Audio’.


Katika taarifa iliyotolewa Alhamisi (Desemba 12), Google imetangaza kuwa teknolojia hii mpya inaleta uwezo wa "Mwakala wa Sauti" (Voice Agent) ambaye anaweza kufanya mazungumzo marefu, kuelewa maelekezo magumu, na kutafsiri lugha papo kwa papo bila kuchelewa.


Sauti Ndani ya 'Search Live': Angalia na Uulize


Kwa mara ya kwanza, Google imeweka teknolojia hii ya sauti ndani ya huduma ya Search Live. Hii inamaanisha nini? Sasa unaweza kuelekeza kamera ya simu yako kwenye kitu (mfano: injini ya gari au menyu ya chakula) na kuanza kuongea na Google Gemini muda huohuo ukiuliza maswali, nayo itakujibu kwa sauti huku ikiona unachokiona.


Maboresho Makubwa Matatu


Google haikuongeza tu sauti, imempa roboti huyu "akili" ya kuelewa kazi:


  1. Umakini wa Hali ya Juu: Gemini 2.5 sasa ina uwezo wa asilimia 71.5 wa kujua lini inahitaji kuchukua data kutoka nje (mfano: kuangalia hali ya hewa au bei ya hisa) katikati ya maongezi na kukujibu bila kukwama.
  2. Kutii Maelekezo: Imeboreshwa kufuata maelekezo magumu ya watengeneza programu kwa asilimia 90 (kutoka 84%). Hii inahakikisha haifanyi makosa kizembe.
  3. Kumbukumbu: Inaweza kukumbuka mliyoyaongea mwanzoni mwa mazungumzo, hivyo huna haja ya kujirudia rudia kama unavyofanya kwa roboti za zamani.


Tayari makampuni kama Shopify yanatumia teknolojia hii kuwahudumia wateja kiasi kwamba wateja wanasahau kuwa wanaongea na roboti. Kampuni ya United Wholesale Mortgage imefanikiwa kutoa mikopo 14,000 kwa kutumia mfumo huu.


Mapinduzi ya 'Live Translate': Mwisho wa Ukalimani?


Hii ndiyo sehemu inayosisimua zaidi. Google imezindua huduma ya kutafsiri sauti kwa sauti (Speech-to-Speech) ambayo ni ya kipekee:


  1. Inasikia Lugha 70+: Inaweza kutambua na kutafsiri lugha zaidi ya 70 na jozi za lugha 2,000.
  2. Inaiga Sauti Yako: Tofauti na roboti zinazoongea kwa sauti ya "kideoni", Gemini inajitahidi kuiga kasi, kiwango cha sauti (pitch), na lafudhi (intonation) ya mzungumzaji. Ukiongea kwa hasira, tafsiri itasikika yenye hasira; ukiongea kwa upole, itakuwa hivyo hivyo.
  3. Njia Mbili (Bidirectional): Unaweza kuweka simu katikati na kuongea na mtu wa lugha nyingine, na simu itabadilisha lugha kiotomatiki kulingana na nani anaongea.


Huduma hii imeanza kupatikana kama 'Beta' kwenye app ya Google Translate kwa watumiaji wa Android nchini Marekani, Mexico, na India, huku ikitarajiwa kusambaa duniani kote (ikiwemo iOS) hivi karibuni.


Fursa kwa Utalii na Biashara Tanzania


Kwa wafanyabiashara wa Kariakoo wanaochukua mzigo China au Uturuki, na waongoza watalii huko Zanzibar, teknolojia hii ni mkombozi. Huna haja tena ya kuandika kwenye simu; unavaa 'headphones' zako, unawasha 'Live Translate', na unafanya biashara kana kwamba mnaongea lugha moja.


Google imepanga kupanua huduma hizi zaidi ifikapo mwaka 2026, ikilenga kuifanya dunia kuwa kijiji kimoja kisicho na mipaka ya lugha.


The copyright for this content belongs to the copyright holder or provider. Unauthorized use may result in legal liability under copyright laws and other regulations.