AI háború – alulmarad a ChatGPT?

Az utóbbi években hihetetlen fejlődés látható a mesterséges intelligencia terén. Nem egy cég igyekszik a lehető legjobb AI-t kifejleszteni, hogy a segítségünkre tudjon sietni az élet számos területén.

A legnépszerűbb, mindenki számára elérhető, az OpenAI ChatGPT-je, mely már szerves részét képezi a mindennapoknak. Természetesen emellett még számos mesterséges intelligencia érhető el, többek között a Google és az Anthropic fejlesztése által. Az Anthropic most azonban piacra dobta Claude 3 nevű új AI családját, aminek egyelőre úgy fest, hogy képességei lekörözhetik az eddigi AI fejlesztéseket, például az előszeretettel használt ChatGPT-t is.

A Claude 3 család

Azt fontos mindenekelőtt tisztázni, hogy ez a fejlesztés nem a hétköznapi problémákhoz lett kitalálva elsősorban, hanem a céges munkafolyamatok automatizálásában lehet roppant hasznos és nyújthat akár optimálisabb segítséget a ChatGPT-nél. Az Amazon be is jelentette, hogy az Anthropic új modelleit bevezeti az AWS (Amazon Web Services) platformjába, lehetővé téve ezzel a webhelyek számára, hogy márkájuk és ügyfeleik igényeire szabott Claude 3 modelleket hozzanak létre.

A Claude 3 család három különböző képességű mesterséges intelligenciát tartalmaz: a Claude 3 Haikut, a Claude 3 Sonnet-t és a csúcsmodellt, a Claude 3 Opust. Azonban nem lehet azt mondani, hogy a Haiku vagy a Sonnet kevesebbet érne, mint az Opus, mivel mindegyik modellnek specifikus felhasználási területei vannak:

  • Haiku: gyors válaszokra és információ kinyerésére képes strukturálatlan adatokból, különösen hatékony az egyszerű kérdések megválaszolásában.
  • Sonnet: egy szélesebb skálájú modell, amellyel időt tud az ember megspórolni az egyszerű feladatoknál. Képes még ezen kívül szöveg kinyerésre képekből, így segítve az információk gyors megszerzését.
  • Opus: a család “vezetője” kiemelkedő teljesítményt nyújt minden területen, szinte emberi szintű megértésre képes bonyolult feladatok esetén.
AI háború - alulmarad a ChatGPT?

Az Anthropic szerint ez az AI család már erőteljesebb teljesítményt nyújt, mint elődei, mert javult a pontosságuk a kontextus jobb megértésének és a megnövekedett sebességnek köszönhetően. Emellett a három modell hajlandóbb lesz válaszolni nehezebb kérdésekre is, a régebbi Claude verziók ugyanis néha megtagadták a válaszadást olyan kérésekre, amelyek súrolták a biztonsági előírások határait. A Claude 3 családnak most finomabb válaszadási megközelítése lesz, lehetővé téve, hogy válaszoljanak a kicsivel bonyolultabb, határokat feszegető kérdésekre is.

Az Anthropic egy „Needle In a Haystack” (NIAH) értékelésen keresztül tesztelte is az Opust, hogy megvizsgálja, mennyire tud információkat felidézni. Az eredmények szerint az AI szinte tökéletes részletességgel emlékezett az információkra és a vállalat azt állítja, hogy az Opus intelligens, meg tud oldani matematikai problémákat, kódokat tud generálni, valamint jobb érveléssel is rendelkezik, mint a ChatGPT-4.

Azonban természetesen ez az új fejlesztés sem mentes bizonyos hibáktól. Ugyan az új modellek javított pontossággal rendelkeznek, továbbra is probléma lehet az úgynevezett “AI hallucinációk” előfordulása, azaz hogy a válaszok hibás információkat tartalmazhatnak. Ezek mértéke viszont lényegesen alacsonyabb, mint elődje, a Claude 2.1 esetében.

Mind a Sonnet, mind az Opus jelenleg megvásárolható, a Haiku start dátuma pedig nem lett még közölve, de az Anthropic szerint hamarosan elérhető lesz az is.

Tehát akkor Claude 3 vagy ChatGPT?

Egyelőre hiába a Claude 3 tűnik ígéretesebbnek, ez egyik pillanatról a másikra megváltozhat. Ha szeretnél elköteleződni valamelyik AI mellett, érdemes alaposan utánanézni a műszaki adatoknak és lépést tartani a legfrissebb hírekkel, ugyanis a különböző mesterséges intelligenciák mérnöki tesztelése folyamatosan zajlik. A fejlesztők igyekeznek a legjobbal előrukkolni annak érdekében, hogy minden igényt kielégítsen az általuk létrehozott AI és hogy elváljon, melyik nyújtja a legjobb teljesítményt. Ennek köszönhetően ez az AI “háború” valószínűleg nem fog egyhamar véget érni és izgalmas lehet nyomon követni a fejleményeket.