fbpx

GPT avatud lähtekoodiga alternatiivid: kas need võivad tõesti konkureerida?

_codigoabierto_gpt_Extraction OCR AI arvete saatelehed – masinõpe tehisintellekti raamatupidamistarkvaraga AI OCR Dijit.app arvete saatelehed automatiseerib arvete ja saatelehtede andmete väljavõtmist OCR AI Dijit.app

OpenAI on generatiivse tehisintellekti valdkonnas laialt tuntud, kuid ta pole mängus ainus mängija. GPT-le on avatud lähtekoodiga alternatiive, mis pakuvad sarnast jõudlust, suuremat läbipaistvust ja väiksemaid arvutusvõimsuse nõudeid. Need alternatiivid on atraktiivsed kasutajatele, kes hindavad oma andmete privaatsust ja soovivad suuremat kontrolli koolitusprotsessi üle. Kuid kas nad saavad tõesti OpenAI mudelitega konkureerida?

Väljakutsed ja hirmud generatiivse AI kasutuselevõtul

Generatiivne AI on aasta tehnoloogiatrend, mis äratab tohutut tähelepanu, investeeringuid ja rahalisi vahendeid. Selle vastuvõtmine ei ole siiski vaba muredest ja ebakindlusest. Kuigi see pakub olulisi eeliseid, nagu tõhusus ja kulude kokkuhoid, on ka teateid andmete rikkumistest, generatiivsete AI-ettevõtete vastu algatatud kohtuasjadest ja selliste tööriistade nagu ChatGPT keelamisest andmeturbeprobleemide tõttu.

Kas avatud lähtekoodiga lahendus võib olla?

Avatud lähtekood võib olla nende väljakutsete ja hirmude lahendus. Selles artiklis uurime ChatGPT ja GPT baasmudelite saadaolevaid alternatiive. Digital Oceani värske aruanne näitab, et enam kui 30% idufirmadest ja VKEdest ning 28% ettevõtetest valivad poolele oma tarkvarale avatud lähtekoodiga lahendused. Lisaks eeldab küsitletud ettevõtete 80% nende väärtuste suurenemist uute tehnoloogiate puhul. Neile, kes on juba avatud lähtekoodiga kasuks valinud, on see nende turvastrateegia oluline osa.

Paindlikkus ja kohandamine

Teine põhjus, mille märkis 79% oma ettevõtetes avatud lähtekoodiga lahendusi kasutavatest inimestest, on see, et avatud lähtekoodiga pakub paindlikkust lahenduste kohandamiseks vastavalt konkreetsetele vajadustele ja ettevõtte standarditele. Generatiivse AI puhul on eriti oluline jälgida koolitusprotsessi ja mõista võimalikke eelarvamusi.

Populaarsed alternatiivid GPT-le

Kõned

LLaMA, mis on välja töötatud Meta AI uurimislaboris, on üks olulisemaid avatud lähtekoodiga mudeleid. Kuigi selle parameetrid võivad GPT-4 või GPT-3 omadega võrreldes tunduda vähem muljetavaldavad, ei tohiks seda alahinnata. Vaatamata vähematele parameetritele koolitati LLaMA mudeleid suurema arvu žetoonidega, mis tähendab, et neid on lihtsam ümber õpetada ja konkreetsete kasutusjuhtude jaoks häälestada. Selle tulemusel ületab LLaMA-13B tervemõistuslike arutlusülesannete puhul GPT-3. Juurdepääs LLaMA-le on aga piiratud akadeemiliste teadlaste, valitsusega seotud organisatsioonide, kodanikuühiskonna ja uurimislaboritega iga juhtumi puhul eraldi.

OPT

Open Pretrained Transformer (OPT) keelemudel, mille Meta avaldas 2022. aasta mais, sisaldab 175B parameetrit (sama, mis GPT-3) ja seda õpetati mitme avaliku andmekogumi kohta. Kahjuks, nagu LLaMA, on ka OPT praegu teadusuuringuteks saadaval ainult mitteärilise litsentsi alusel.

MPT-7B

MPT-7B on osa MosaicML-i välja töötatud MosaicPretrainedTransformer (MPT) mudelitest. Seda õpetati 1T ingliskeelse teksti ja koodimärkidega; Väidetavalt on see optimeeritud tõhusaks koolituseks ja järelduste tegemiseks ning, peame tunnistama, tundub GPT avatud lähtekoodiga alternatiivina väga paljutõotav.

GPT-J ja GPT-NeoX

GPT-J ja GPT-NeoX on EleutherAI välja töötatud teksti genereerimise mudelid. Vaatamata väiksemale suurusele pakuvad need mudelid peaaegu identset jõudlust OpenAI Babbage ja Curie mudelitega (GPT-3 perekond) standardsete keelemodelleerimisülesannete puhul. Mis kõige parem, need mudelid on täiesti tasuta kasutamiseks ja võimaldavad kaubanduslikku kasutamist.

Dolly

Dolly on veel üks avatud lähtekoodiga keelemudel, mida saab kasutada vestlusrobotites, teksti kokkuvõtete tegemisel ja põhiotsingumootorites. Oluline on see, et see on litsentsitud teadusuuringuteks ja äriliseks kasutamiseks.

document_management_ocr_pymes

ChatGPT-laadsed vestlusrobotid, mis on ehitatud generatiivsete AI mudelitega

Alpaka

Stanfordi ülikooli uurimisprojektina välja töötatud Alpaca tegeleb hallutsinatsioonide ja eelarvamuste kasvava probleemiga generatiivsetes AI mudelites. Siiski on selle kasutamine piiratud akadeemilise uurimistööga ja äriline kasutamine on keelatud.

Vicuna

Vicuna, mille töötas välja UC Berkeley, CMU, Stanfordi ja UC San Diego meeskond, koolitati LLaMA peenhäälestusega 70 000 kasutajate jagatud vestluste kohta, mis koguti ShareGPT-st avalike API-dega. Kuigi see kasutab vähem parameetreid kui ChatGPT (13B võrreldes 175B-ga), esitleti Vicunat kui "avatud lähtekoodiga vestlusbotit, mis avaldab GPT-4 ChatGPT-kvaliteediga muljet 90%-le" ja toimis läbiviidud testides hästi.

GPT4Kõik

GPT4All, mille on välja töötanud Nomic AI, viimistleti LLaMA mudeli järgi ja koolitati osalejate interaktsioonide kureeritud korpuse, sealhulgas koodi, lugude, kirjelduste ja mitme pöördega dialoogi põhjal. GPT4All on avatud lähtekoodiga tarkvara ökosüsteem, mis võimaldab igaühel treenida ja juurutada igapäevases riistvaras suuri ja võimsaid keelemudeleid.

OpenAssistant

OpenAssistant on projekt, mille käivitasid vaid kuu aega tagasi Large-scale Artificial Intelligence Open Network (LAION) ja enam kui 13 000 vabatahtlikku üle maailma. Selle eesmärk on demokratiseerida generatiivne AI ja takistada suurkorporatsioone keelemudelite turu monopoliseerimast. Nad kavatsevad kõik oma mudelid, andmekogumid ja andmete kogumise protsess avada lähtekoodiga täiesti läbipaistvaks.

document_management_ocr_pymes

Viimased kaalutlused

ChatGPT ja GPT baasmudelite avatud lähtekoodiga alternatiivide peamine probleem on see, et neid arendatakse peamiselt uurimisprojektidena. Need on mõeldud loomuliku keele töötlemise, masinõppe ja tehisintellekti teadlastele, akadeemikutele ja harrastajatele, mitte aga kommertskasutajatele. Kuigi need mudelid aitavad kaasa generatiivse tehisintellekti valdkonna arengule, on avatud lähtekoodiga alternatiivide arv, mida saab kaubanduslikult kasutada, piiratud ja ei hõlma kõige võimsamaid mudeleid.

Siiski võivad avatud lähtekoodiga mudelite kasutamise eelised mõnel juhul üles kaaluda nende väiksema jõudluse. Neid mudeleid saab arendada ja kohandada organisatsioonide sees, et saavutada häid tulemusi konkreetsetel kasutusjuhtudel. LLaMA, mille on välja töötanud Meta, on üks silmapaistvamaid avatud lähtekoodiga mudeleid. Kuigi selle parameetrid ei pruugi tunduda nii muljetavaldavad kui GPT-4 või GPT-3 omad, ei tohiks seda alahinnata. Vaatamata vähematele parameetritele koolitati LLaMA mudeleid suurema arvu žetoonidega, mis tähendab, et neid on lihtsam ümber õpetada ja konkreetsete kasutusjuhtude jaoks häälestada. Selle tulemusel ületab LLaMA-13B tervemõistuslike arutlusülesannete puhul GPT-3.

Järeldus

Kokkuvõtteks võib öelda, et kuigi GPT avatud lähtekoodiga alternatiivid ei pruugi olla nii võimsad kui OpenAI mudelid, pakuvad need mitmeid eeliseid, mis võivad muuta need teatud kasutajatele ja ettevõtetele atraktiivseks. Siiski on oluline meeles pidada, et generatiivse AI kasutuselevõtt ei ole väljakutsete ja hirmudeta ning õige mudeli valik sõltub iga kasutaja või ettevõtte konkreetsetest vajadustest ja prioriteetidest.

Meie partnerid turvalisuse ja tehnoloogia vallas

et