Najobľúbenejšie chatboty si merajú svoje sily: ChatGPT-4 vs. Copilot v Edge vs. Gemini
Obsah:
1. ChatGPT-4: Skvelý spoločník
2. Copilot v Edge: Váš parťák v kódovaní
3. Gemini: Vylepšený Google vyhľadávač
Môj verdikt
Preskúmavanie sveta AI: Claude 2, Mixtral 8x7B a Llama 2
1. ChatGPT-4: Skvelý spoločník
Výhody:
- Podporí vaše tvorivé ja: Generuje básne, scenáre, piesne a dokonca aj fragmenty kódu.
- Porozpráva sa s vami: Vďaka znalostiam z mnohých rôznych odvetví sa s ním môžete porozprávať takmer o čomkoľvek.
- Je multilingválny: ChatGPT-4 dokáže komunikovať mnohými jazykmi. To znamená, že s ním môže konverzovať skoro každý.
- „Renesančné AI“: Vďaka znalostiam z mnohých rôznych odborov vám zvládne pomôcť so širokou škálou záležitostí. Existuje aj možnosť vytvoriť si vlastného chatbota na mieru. Toho môžete dotiahnuť k dokonalosti a urobiť z neho profesionála v jednom konkrétnom odvetví.
Nevýhody:
- Nesprávnosť informácií: Niekedy generuje informácie, ktoré nie sú fakticky správne. To znamená, že si musíte všetky jeho výsledky kontrolovať s inými zdrojmi.
- Zaujatosť: Chatbot býva zaujatý, preto občas generuje nepresné informácie.
- Inkonzistencia: Nie je vždy schopný sa držať inštrukcií, ktoré ste na začiatku konverzácie zadali. Často sa tak stáva, že zabúda dodržiavať štýl a tón, o ktorý ste ho požiadali. Je možné sa tomuto vyhnúť vytvorením vlastného chatbota.
- Malé kontextové okno: Limit tokenov (počtu slov) je pri ChatGPT pomerne malý, čo je pre niektorých používateľov problém. Čo to ovplyvňuje? V dlhších konverzáciách sa často odchyľuje od pôvodného zadania. Ako už bolo spomenuté predtým, robí mu problém zapamätať si všetky informácie z dlhých konverzácií. To občas vedie k neschopnosti na seba logicky nadväzovať.
- Zastaralé dáta: Dáta chatbota boli aktualizované v apríli 2023. To znamená, že o čomkoľvek, čo sa po tejto aktualizácii udialo, nevie. Nedokáže tak poskytnúť informácie z druhej polovice roku 2023.
2. Copilot v Edge: Váš parťák na kódovanie
Výhody:
- Zlepší vaše kódovacie schopnosti: Navrhuje, ako kód dokončiť a opravuje v ňom chyby. Šetrí tak váš čas a úprimne aj nervy.
- Je multilingválny: Pozná niekoľko programovacích jazykov od Pythona až po C++.
- Píše ako vy: Je schopný pozerať váš štýl kódovania a navrhovať také úpravy, pre ktoré by ste sa pravdepodobne rozhodli aj vy.
- Vie vyhľadávať na internete: Ja sám využívam Copilota na vyhľadávanie na internete každý deň. Okrem toho, že funguje ako super vyhľadávač, vám tiež pomôže s otázkami týkajúcimi sa stránky, ktorú máte práve otvorenú!
Nevýhody:
- Obmedzené možnosti využitia: V porovnaní s ChatGPT-4 mi Copilot pripadá oveľa slabší v konverzovaní a má aj špecifickú "osobnosť". A to aj napriek tomu, že verziu "Creative" a "Precise" poháňa GPT-4. Často tiež odmieta odpovedať na zložité otázky. Niekedy sa dokonca "naštve" a nechce v konverzácii pokračovať alebo odbočuje od témy.
- Efekt čiernej skrinky: "Black box" efekt sa vzťahuje na situáciu, keď používateľ nemá pohľad do toho, ako presne k danému výsledku chatbot dospel. Copilot niekedy nedokáže vysvetliť, prečo odpovedal tak, ako odpovedal. Veľakrát tak nie je možné zistiť, na základe čoho sa rozhoduje. Tento problém je ale súčasťou väčšiny jazykových modelov.
- Obavy o bezpečnosť: Medzery v zabezpečení môžu spôsobiť, že do vášho projektu prenikne nechcený kód. Microsoft akékoľvek pochybnosti spojené s bezpečnosťou popiera, ale brala by som ich vyjadrenie s rezervou.
- Opätovné načítanie konverzácie: Okno Copilota sa niekedy samo znova načíta. Dôjde tak k prerušeniu konverzácie. To je nepríjemné, pretože kvôli pretrhnutiu pomyselnej nite musíte konverzáciu začať úplne od začiatku.
3. Gemini: Vylepšený Google vyhľadávač
Výhody:
- Parťák, ktorému môžete dôverovať: Poskytuje presné informácie a pracuje s vierohodnými zdrojmi, ktoré sa naviac dajú ešte overiť pomocou malej ikonky Google vedľa chatovacieho poľa.
- Mimoriadny učiteľ: Aj naozaj zložité záležitosti vysvetľuje jednoducho. Porozumie im snáď každý. S Gemini je učenie zábava.
- Bezpečnosť na prvom mieste: Gemini pozerá na bezpečnosť. Dokáže rozpoznať škodlivý obsah a generuje tak iba ten nezávadný. Je preto vhodný aj pre mladších užívateľov.
Nevýhody:
- Kreatívna stránka pokrivkáva: Gemini nie je tak kreatívny ako napríklad ChatGPT. Na generovanie naozaj pekných textov tak radšej používajte ChatGPT.
- Je stále vo vývoji: Gemini je tu s nami iba pár mesiacov a zrejme bude ešte chvíľu trvať, kým ho budeme môcť používať univerzálnym spôsobom ako jeho rivalov ChatGPT a Copilota.
- Nie je prispôsobivý: V porovnaní s ChatGPT a Copilotom nedokáže tak dobre napodobniť váš štýl. Tiež mu často robí problém prispôsobiť sa individuálnym potrebám.
- Generuje kontroverzné obrázky: Gemini čelí kritike za podporu stereotypov a chybné vyobrazovanie historických postáv. Toto je obrovský problém, ktorý Google momentálne rieši.
Môj verdikt
Z môjho pohľadu je víťaz nejednoznačný.
Každý zo spomínaných modelov má svoje silné a slabé stránky. V čom jeden vyniká, druhý zaostáva a opačne. Záleží teda na tom, aký problém riešite:
- Ak chcete s AI generovať zaujímavé texty, odporúčam ChatGPT.
- Ak chcete asistenta, ktorý vám pomôže s kódovaním alebo analýzou webu v reálnom čase, odporúčam Copilota v Edge.
- Ak chcete s AI vyhľadávať dôveryhodné informácie na internete, odporúčam Gemini.
ChatGPT-4, Copilot v Edge a Gemini od Googlu však zďaleka nie sú jedinými užitočnými a voľne prístupnými nástrojmi generatívnej umelej inteligencie. Je ich celá rada. Určite preskúmajte aj iné možnosti. Možno vám niektorá z nič sadne viac.
Vlastnosť | ChatGPT-4 | Gemini Ultra | Copilot v Edge |
---|---|---|---|
Pochopenie jazyka | Vysoká úroveň pochopenia prirodzeného jazyka | Prekonáva výkony ľudských expertov v MMLU | Silná integrácia s Edge pre vylepšené webové interakcie |
Kódovanie | Schopný generovať a rozumieť kódu | Vyniká v generovaní Python kódu, prekonáva GPT-4 | Generuje a vysvetľuje kód v prehliadači Edge |
Multimodálne schopnosti | Vylepšené nástrojmi na analýzu obrázkov, PDF, atď. | Prirodzene multimodálne, rozumie textu, obrázkom, zvuku a videu | Zameriava sa primárne na text a kód, s potenciálom pre webové multimediálne interakcie |
Výkon v benchmarkoch | Je dobrý v rôznych benchmarkoch | Momentálne prekonáva 30 z 32 akademických benchmarkov | Špecificky nebenchmarkovaný, navrhnutý pre praktické webové a kódovacie úlohy |
Výkon porovnateľný s ľudskými expertmi | Porovnateľný s výkonom expertov v mnohých oblastiach | Prvý model, ktorý prekonal ľudských expertov v MMLU | Zameriava sa na doplnenie ľudskej práce pri prehliadaní webu a pri kódovaní |
Flexibilita a efektivita | Všestranný, s možnosťou tvorby custom modelov v mnohých doménach | Optimalizované pre rôzne veľkosti (Ultra, Pro, Nano) pre efektivitu naprieč úlohami | Integrovaný priamo do prehliadača Microsoft Edge pre okamžitú asistenciu |
Pokročilé uvažovanie | Schopný zložitého uvažovania | Demonštruje sofistikované multimodálne usudzovacie schopnosti | Vyniká v logickom uvažovaní pri kódovaní a pri navigácii na webe |
Aplikácia v reálnom svete | Široké spektrum aplikácií založených na texte | Zvýšené schopnosti pre vývojárov a podniky, vhodné pre zložité úlohy vrátane zvuku a videa | Priamo integrovaný do zážitku z prehliadania v Edge, zvyšuje produktivitu a učenie |
Dostupnosť a nasadenie | Široký prístup prostredníctvom OpenAI API | Dostupný vo viac ako 40 jazykoch a 230 krajinách prostredníctvom mobilnej aplikácie a pokročilej webovej platformy | Dostupný v prehliadači Microsoft Edge, zvyšuje funkčnosť prehliadača |
Budúci potenciál | Neustále aktualizácie a vylepšenia | Sľubuje významný pokrok v multimodálnych interakciách | Neustála integrácia pokrokov Microsoftu v AI pre zlepšenie webovej interakcie |
Preskúmanie sveta AI: Claude, Mixtral 8x7B a Llama 2
Tento článok je síce zameraný na veľkú trojku, ale ja mám v rukáve aj ďalšie chatboty, ktoré stoja za vyskúšanie. Pokiaľ si chcete svoje AI obzory rozšíriť, odporúčam tieto: Claude, Mixtral 8x7B a Llama 2.
Claude 2
Claude 2 patrí spoločnosti Anthropic. Urobí pre vás súhrn dlhých textov, na ktoré ChatGPT nestačí. Aké dlhé môžu texty byť? Pokojne ako román!
Update: Anthropic oznámil novú modelovú radu Claude 3. Zahŕňa tri najmodernejšie modely zoradené vzostupne podľa schopností: Claude 3 Haiku, Claude 3 Sonnet a Claude 3 Opus. Všetky modely vykazujú ohromujúce schopnosti v oblasti analýzy, tvorby obsahu a generovania kódu.
Mixtral 8x7B
Mixtral 8x7B je projekt spoločnosti Mistral AI. Tá mala za cieľ vyvinúť silnejší AI model zameraný na odbornosť. Ako sa im to podarilo, nechám posúdiť vás.
Mixtral 8x7B ovláda mnoho jazykov, má skvelé znalosti kódovania a veľké kontextové okno.
Llama 2
Tento model je od spoločnosti Meta. Ide o novú generáciu open-source AI. Môžete ho používať zadarmo pre výskum aj komerčné účely.
Pozn.: Nástroje Mixtral8x7B a Llama 2 môžete vyskúšať tu.