Zana za AI Ambazo Bado Hazijafikia Matarajio Baada ya Majaribio

Pengo kati ya demo ya teknolojia inayovuma na zana muhimu ya ofisini linazidi kupanuka. Kwa sasa tuko katika kipindi ambacho idara za masoko huahidi miujiza huku watumiaji wakipokea kitu kinachofanana na ‘autocomplete’ iliyopambwa. Watu wengi wanatarajia mifumo hii ifikiri, lakini inatabiri tu neno linalofuata katika mfululizo. Kutoelewana huku kunasababisha kufadhaika wakati zana inashindwa katika mantiki ya msingi au kubuni ukweli. Ikiwa unahitaji zana inayotegemeka kwa asilimia 100 bila usimamizi wa binadamu, unapaswa kupuuza kabisa wimbi la sasa la generative assistants. Hazijawa tayari kwa mazingira nyeti ambapo usahihi ndio kipimo pekee kinachojali. Hata hivyo, ikiwa kazi yako inahusisha kutafakari mawazo au kuandaa rasimu, kuna manufaa yaliyojificha chini ya kelele hizo. Ujumbe mkuu ni kwamba tunazidisha makadirio ya akili ya zana hizi huku tukipunguza kiasi cha kazi inayohitajika ili kuzifanya ziwe na manufaa. Mengi ya unayoona kwenye mitandao ya kijamii ni utendaji uliopangwa kwa uangalifu ambao huanguka chini ya shinikizo la wiki ya kawaida ya kazi ya saa arobaini.

Injini za Utabiri Zilizovaa Suti

Ili kuelewa kwa nini zana nyingi huhisi kama kukatisha tamaa, lazima uelewe ni nini hasa. Hizi ni large language models. Ni injini za kitakwimu zilizofunzwa kwenye data kubwa za maandishi ya binadamu. Hazina dhana ya ukweli, maadili, au uhalisia wa kimwili. Unapouliza swali, mfumo hutafuta mifumo katika data yake ya mafunzo ili kutoa jibu linalosikika kuwa la kweli. Hii ndiyo sababu ni nzuri sana katika ushairi lakini ni mbaya sana katika hesabu. Zinaiga mtindo wa jibu sahihi badala ya kufanya mantiki ya msingi inayohitajika kulifikia. Tofauti hii ndiyo chanzo cha dhana potofu ya kawaida kwamba AI ni injini ya utafutaji. Injini ya utafutaji hupata taarifa zilizopo. LLM hutengeneza mfululizo mpya wa maandishi kulingana na uwezekano. Hii ndiyo sababu “hallucinations” hutokea. Mfumo unafanya tu kile ulichojengwa kufanya, yaani kuendelea kuzungumza hadi ufikie ‘stop token’.

Soko la sasa limefurika na ‘wrappers’. Hizi ni programu rahisi zinazotumia API kutoka kampuni kama OpenAI au Anthropic lakini zinaongeza kiolesura maalum. Nyingi ya startup hizi zinadai kuwa na teknolojia ya kipekee, lakini mara nyingi ni modeli ile ile yenye muonekano tofauti. Unapaswa kuwa mwangalifu na zana yoyote isiyoelezea usanifu wake wa msingi. Kuna aina tatu kuu za zana zinazojaribiwa sasa hivi:

Wazalishaji wa maandishi kwa barua pepe na ripoti ambazo mara nyingi husikika kama roboti.
Waundaji wa picha wanaopata shida na maelezo maalum kama mikono ya binadamu au maandishi.
Wasaidizi wa kuandika kodi wanaoweza kuandika boilerplate lakini wanapata shida na mantiki tata.

Ukweli ni kwamba zana hizi ni bora kutazamwa kama wanafunzi wa mafunzo (interns) ambao wamesoma kila kitabu duniani lakini hawajawahi kuishi ndani yake. Zinahitaji ukaguzi wa mara kwa mara na maelekezo maalum ili kutoa kitu chochote cha thamani. Ikiwa unatarajia zana hizi zifanye kazi kwa uhuru, utakatishwa tamaa kila wakati.

Uchumi wa FOMO Duniani

Shinikizo la kutumia zana hizi halitokani na ufanisi wake uliothibitishwa. Linatokana na hofu ya kimataifa ya kupitwa na wakati (FOMO). Mashirika makubwa yanatumia mabilioni ya dola kwenye leseni kwa sababu yanaogopa washindani wao watapata faida ya siri. Hii imeunda wakati wa kiuchumi wa ajabu ambapo mahitaji ya AI ni makubwa, lakini faida halisi ya tija ni vigumu kupimika. Kulingana na utafiti kutoka mashirika kama Gartner group, nyingi ya teknolojia hizi kwa sasa ziko kwenye kilele cha matarajio yaliyopitiliza. Hii inamaanisha kipindi cha kukata tamaa hakiwezi kuepukika wakati makampuni yanapogundua kuwa kuchukua nafasi ya wafanyakazi wa binadamu ni vigumu zaidi kuliko maelezo ya mauzo yalivyopendekeza. Athari huhisiwa zaidi katika nchi zinazoendelea ambapo utoaji wa huduma nje (outsourcing) ulikuwa kichocheo kikuu cha ukuaji. Sasa, kazi hizo hizo zinafanywa kiotomatiki na AI ya ubora wa chini, na kusababisha ushindani wa kushuka kwa ubora wa maudhui.

Tunaona mabadiliko katika jinsi kazi inavyothaminiwa. Uwezo wa kuandika barua pepe ya msingi sio tena ujuzi unaouzika. Thamani imehamia kwenye uwezo wa kuhakiki na kuhariri. Hii inaunda aina mpya ya mgawanyiko wa kidijitali. Wale wanaoweza kumudu modeli zenye nguvu zaidi na kuwa na ujuzi wa kuzipa maelekezo (prompt) kwa ufanisi watasonga mbele. Wengine wote watakwama kutumia modeli za bure, za kiwango cha chini zinazozalisha matokeo ya jumla na mara nyingi yasiyo sahihi. Hili sio tatizo la kiteknolojia tu. Ni mabadiliko ya kiuchumi yanayoathiri jinsi tunavyofunza kizazi kijacho cha wafanyakazi. Ikiwa tutategemea sana mifumo hii kwa kazi za ngazi ya chini, tunaweza kupoteza utaalamu wa kibinadamu unaohitajika kusimamia mifumo hiyo katika siku zijazo. Viwango vya hivi karibuni vya utendaji wa AI katika [Insert Your AI Magazine Domain Here] vinaonyesha kuwa wakati modeli zinakuwa kubwa, kasi ya uboreshaji katika hoja (reasoning) inapungua. Hii inapendekeza kuwa huenda tunafikia kikomo na mbinu ya sasa ya machine learning.

Jumanne Iliyotumika Kurekebisha Mashine

Fikiria uzoefu wa Sarah, meneja wa mradi katika kampuni ya ukubwa wa kati. Anaanza siku yake kwa kumwomba msaidizi wa AI afupishe mnyororo mrefu wa barua pepe kutoka usiku uliopita. Zana hiyo inatoa orodha safi ya nukta. Inaonekana kamilifu hadi anapogundua kuwa ilikosa kabisa mabadiliko ya tarehe ya mwisho yaliyotajwa katika barua pepe ya tatu. Hii ndiyo gharama iliyofichika ya AI. Sarah aliokoa dakika tano za kusoma lakini alitumia dakika kumi kuhakiki muhtasari huo kwa sababu haiamini tena zana hiyo. Baadaye, anajaribu kutumia jenereta ya picha ya AI kuunda chati rahisi kwa ajili ya wasilisho. Zana hiyo inampa mchoro mzuri, lakini namba kwenye mhimili ni upuuzi. Anaishia kutumia saa moja katika programu ya kawaida ya usanifu kurekebisha kile kilichopaswa kuwa kazi ya sekunde kumi. Hii ndiyo hali ya kila siku kwa wafanyakazi wengi. Zana hizi hutoa mwanzo mzuri lakini mara nyingi hukuongoza katika mwelekeo usio sahihi.

Tatizo ni kwamba zana hizi zimeundwa kuwa na uhakika, si kuwa sahihi. Zitakupa jibu lisilo sahihi kwa sauti ile ile ya mamlaka kama jibu sahihi. Hii inaunda mzigo wa kiakili kwa mtumiaji. Huwezi kamwe kupumzika kikweli unapoitumia. Kwa mwandishi, kutumia AI kuzalisha rasimu ya kwanza mara nyingi huhisi kama kusafisha fujo ya mtu mwingine. Mara nyingi ni haraka zaidi kuandika kipande hicho kuanzia mwanzo kuliko kuondoa maneno ya kawaida na misemo ya kurudia ambayo modeli hizi hupendelea.

BotNews.today hutumia zana za AI kufanya utafiti, kuandika, kuhariri, na kutafsiri maudhui. Timu yetu hukagua na kusimamia mchakato ili kuweka habari kuwa muhimu, wazi, na ya kuaminika.

Maudhui haya yalitolewa kwa msaada wa akili bandia ili kuhakikisha uthabiti wa kimuundo. Hii inaunda kitendawili. Zana hizi zinalenga kuokoa muda, lakini mara nyingi hubadilisha tu aina ya kazi tunayofanya. Tunahama kutoka kuwa wabunifu na kuwa watunzaji wa data sintetiki. Zana zinazofanya kazi kweli ni zile zinazobaki katika mstari wao. Kikagua sarufi kinachorekebisha kosa la chapa ni muhimu. Zana inayojaribu kuandika tasnifu yako yote ni mzigo. Watu huwa wanazidisha uwezo wa ubunifu wa mifumo hii huku wakipunguza uwezo wao wa kufanya kazi kama kabati la faili la kisasa kwa maarifa ya binadamu.

Maswali Magumu kwa Wakurugenzi

Tunapojumuisha mifumo hii zaidi katika maisha yetu, lazima tuulize kuhusu gharama zilizofichika. Nini kinatokea kwa faragha yetu wakati kila maelekezo tunayoandika yanatumiwa kufunza toleo linalofuata la modeli? Makampuni mengi hayana sera wazi ya uhifadhi wa data. Ikiwa utaingiza hati ya mkakati wa siri kwenye LLM ya umma, taarifa hiyo inaweza kinadharia kujitokeza tena katika swali la mshindani. Pia kuna gharama ya kimazingira. Kufunza na kuendesha modeli hizi kunahitaji kiasi kikubwa cha umeme na maji kwa ajili ya kupoza vituo vya data. Utafiti katika Nature unaangazia kuwa alama ya kaboni ya swali moja kubwa la modeli ni kubwa zaidi kuliko swali la kawaida la injini ya utafutaji. Je, urahisi mdogo wa barua pepe iliyozalishwa unastahili athari za kiikolojia? Pia tunahitaji kuzingatia athari za hakimiliki. Modeli hizi zilifunzwa kwa kazi ya mamilioni ya wasanii na waandishi bila idhini yao. Kimsingi tunatumia mashine iliyojengwa juu ya kazi iliyoibwa.

Pia kuna swali la angavu ya binadamu. Ikiwa tutatoa fikra zetu kwa mashine, je, tunapoteza uwezo wa kuona makosa? Tayari tunaona kupungua kwa ubora wa maudhui ya wavuti kadiri makala zilizozalishwa na AI zinavyofurika kwenye mtandao. Hii inaunda mzunguko wa maoni ambapo modeli hufunzwa kwa matokeo ya modeli nyingine, na kusababisha uharibifu wa taarifa unaojulikana kama ‘model collapse’. Ikiwa mtandao utakuwa bahari ya maandishi ya AI yaliyosindikwa, wazo jipya litatoka wapi? Hizi sio tu vikwazo vya kiufundi. Ni maswali ya msingi kuhusu aina ya ulimwengu tunayotaka kujenga. Kwa sasa tunatanguliza kasi na kiasi kuliko usahihi na uhalisi. Hii inaweza kufanya kazi kwa miaka michache, lakini gharama za muda mrefu kwa akili yetu ya pamoja zinaweza kuwa kali. Lazima tuamue ikiwa tunataka zana zinazotusaidia kufikiri au zana zinazotufikiria.

Vikwazo vya Kiufundi kwa Mtumiaji Mtaalamu

Kwa wale wanaotaka kwenda zaidi ya kiolesura cha msingi cha gumzo, vikwazo vinakuwa dhahiri zaidi. Watumiaji wataalamu mara nyingi hutazama ujumuishaji wa mtiririko wa kazi na ufikiaji wa API ili kujenga suluhisho maalum. Hata hivyo, hivi karibuni hugonga ukuta wa madirisha ya muktadha na vikwazo vya token. Dirisha la muktadha ni kiasi cha taarifa ambacho modeli inaweza “kukumbuka” wakati wa mazungumzo moja. Ingawa baadhi ya modeli zinadai kushughulikia vitabu vizima, usahihi wa kumbukumbu zao hupungua sana katikati ya maandishi. Hii inajulikana kama jambo la “lost in the middle”. Ikiwa unajenga mfumo wa kiotomatiki, pia lazima ushughulikie vikwazo vya viwango. Watoa huduma wengi huzuia ni maombi mangapi unaweza kufanya kwa dakika, jambo linalofanya iwe vigumu kuongeza zana kwa msingi mkubwa wa watumiaji bila gharama kubwa. Bei pia ni tete, kwani makampuni yanajaribu kutafuta jinsi ya kufanya mifumo hii ya gharama kubwa iwe na faida.

Una hadithi ya AI, zana, mwelekeo, au swali unalofikiri tunapaswa kushughulikia? Tutumie wazo lako la makala — tungependa kulisikia.

Uhifadhi wa ndani na uingizaji wa ndani (local inference) unakuwa njia inayopendekezwa kwa geeks wanaojali faragha. Zana kama Ollama au LM Studio hukuruhusu kuendesha modeli kwenye maunzi yako mwenyewe. Hii inatatua suala la faragha lakini inaleta kikwazo cha maunzi. Ili kuendesha modeli ya ubora wa juu ndani ya kifaa, unahitaji GPU yenye nguvu na VRAM nyingi. Kompyuta nyingi za watumiaji zitapata shida kuendesha chochote kikubwa kuliko modeli ya vigezo bilioni 7 kwa kasi inayoweza kutumika. Pia kuna changamoto za programu. Kujumuisha modeli hizi katika mtiririko wa kazi uliopo kawaida kunahitaji ujuzi wa Python au lugha inayofanana. Lazima udhibiti maelekezo ya mfumo, mipangilio ya halijoto, na sampuli ya top-p ili kupata matokeo thabiti. Mambo yafuatayo ni muhimu kwa mtu yeyote anayejaribu kujenga mtiririko wa kazi wa AI wa kitaalamu:

Uwezo wa VRAM ndio kikomo kikuu cha kuendesha modeli za ndani.
Latency huongezeka kadiri ukubwa wa modeli au urefu wa maelekezo unavyoongezeka.
Maelekezo ya mfumo lazima yaandaliwe kwa uangalifu ili kuzuia modeli kupotoka kutoka kwa kazi.

Hata kwa maunzi bora, bado unashughulika na mfumo ambao haitabiriki kiasili. Unaweza kutuma maelekezo sawa mara mbili na kupata matokeo mawili tofauti. Ukosefu huu wa uthabiti ni jinamizi kwa uhandisi wa programu wa kitamaduni. Kulingana na ripoti ya MIT Technology Review, sekta bado inatafuta njia ya kufanya LLMs kuwa za kuaminika kwa kazi muhimu za misheni. Hadi hilo litakapotokea, zitaendelea kuwa zana ya hobbyist au msaidizi wa pili badala ya mfanyakazi mkuu.

Uamuzi wa Mwisho Kuhusu Kelele

Hali ya sasa ya AI ni mchanganyiko wa uwezo wa kweli na chumvi nyingi. Tuna zana ambazo ni nzuri sana katika kufupisha maandishi, kutafsiri lugha, na kuandika kodi ya msingi. Pia tuna kiasi kikubwa cha hype inayopendekeza kuwa zana hizi ziko karibu kuwa na hisia au kuchukua nafasi ya kazi yote ya binadamu. Ukweli uko mahali fulani katikati. Ikiwa unatumia zana hizi kama mahali pa kuanzia, zinaweza kuwa na manufaa. Ikiwa unazitumia kama bidhaa ya mwisho, unajitafutia matatizo. Swali linalobaki ni kama tutawahi kutatua tatizo la ‘hallucination’. Wataalamu wengine wanaamini kuwa ni sehemu ya asili ya jinsi modeli hizi zinavyofanya kazi, wakati wengine wanafikiri data zaidi na mafunzo bora yatalitatua. Hadi hilo litakapotatuliwa, mbinu bora ni ya mashaka ya tahadhari. Tumia zana zinazotatua tatizo maalum kwako leo, na upuuze ahadi za kile wanachoweza kufanya kesho. Zana muhimu zaidi katika mtiririko wako wa kazi bado ni uamuzi wako mwenyewe.

Editor’s note: We created this site as a multilingual AI news and guides hub for people who are not computer geeks, but still want to understand artificial intelligence, use it with more confidence, and follow the future that is already arriving.

Umepata hitilafu au kitu kinachohitaji kurekebishwa? Tujulishe.

Frequently Asked Questions

Wasomaji wanawezaje kutumia makala za “Ulinganisho wa LLM” kwa vitendo?

Gundua ulinganisho wa kina wa miundo mikuu ya LLM, ikijumuisha uwezo, udhaifu, bei, na kasi ili kupata suluhisho bora kwa mahitaji yako. Tumia makala hizi kulinganisha zana, kuelewa hatari, kuuliza maswali bora na kuamua kinachostahili kuzingatiwa kabla ya kutumia muda au pesa.

“AI ya Video” inafaa zaidi kwa nani?

Gundua ulimwengu wa AI ya video, ikijumuisha uzalishaji wa video, zana za kuhariri, na matumizi ya kibunifu kupitia miongozo na habari za hivi punde. Maudhui haya yameandikwa kwa wasomaji wa kawaida, timu ndogo, wabunifu, wamiliki wa biashara, wauzaji, wanafunzi na yeyote anayehitaji muktadha wazi wa AI bila hype.