Nejoblíbenější chatboti měří své síly: ChatGPT-4 vs. Copilot v Edge vs. Gemini
Přiznejte se, komu z vás také přijdou vtipná přátelství robotů ve filmech? Chatboti jsou jako jejich mladší bratranci – chytré hlavy bez fyzických těl, u kterých si nemůžeme být jisti, zda neplánují ovládnout svět. Řeč je teď o třech nejznámějších jazykových modelech: ChatGPT-4, Copilot v Edge a Gemini. V tomto článku prozradím, čím vynikají a co je u nich naopak potřeba doladit.
Obsah:
1. ChatGPT-4: Skvělý společník
2. Copilot v Edge: Váš parťák na kódování
3. Gemini: Vylepšený Google vyhledávač
Můj verdikt
Prozkoumávání světa AI: Claude 2, Mixtral 8x7B a Llama 2
1. ChatGPT-4: Skvělý společník
Výhody:
- Podpoří vaše tvořivé já: Generuje básně, scénáře, písně, a dokonce i fragmenty kódu.
- Popovídá si s vámi: Díky znalostem z mnoha různých odvětví si s ním můžete popovídat téměř o čemkoliv.
- Je multilingvální: ChatGPT-4 umí komunikovat mnoha jazyky. To znamená, že s ním může konverzovat skoro každý.
- „Renesanční AI“: Díky znalostem z mnoha různých oborů vám zvládne pomoct se širokou škálou záležitostí. Existuje i možnost vytvořit si vlastního chatbota na míru. Toho můžete dotáhnout k dokonalosti a udělat z něj profesionála v jednom konkrétním odvětví.
Nevýhody:
- Nesprávnost informací: Někdy generuje informace, které nejsou fakticky správné. To znamená, že si musíte všechny jeho výsledky kontrolovat s jinými zdroji.
- Zaujatost: Chatbot bývá zaujatý, proto občas generuje nepřesné informace.
- Inkonzistence: Není vždy schopen se držet instrukcí, které jste na začátku konverzace zadali. Často se tak stává, že zapomíná dodržovat styl a tón, o který jste jej požádali. Tohoto se lze vyhnout vytvořením vlastního chatbota.
- Malé kontextové okno: Limit tokenů (počtu slov) je u ChatGPT poměrně malý, což je pro některé uživatele problém. Co to ovlivňuje? V delších konverzacích se často odchyluje od původního zadání. Jak už bylo zmíněno dříve, dělá mu problém zapamatovat si všechny informace z dlouhých konverzací. A to občas vede k neschopnosti je na sebe logicky navazovat.
- Zastaralá data: Data chatbota byla aktualizována v dubnu 2023. To znamená, že o čemkoliv, co se po této aktualizaci událo, neví. Nedokáže tak poskytnout informace z druhé poloviny roku 2023.
2. Copilot v Edge: Váš parťák na kódování
Výhody:
- Zlepší vaše kódovací schopnosti: Navrhuje, jak kód dokončit a opravuje v něm chyby. Šetří tak váš čas a upřímně i nervy.
- Je multilingvální: Zná několik programovacích jazyků od Pythonu až po C++.
- Píše jako vy: Je schopen okoukat váš styl kódování. A navrhovat takové úpravy, pro které byste se nejspíše rozhodli i vy.
- Umí vyhledávat na internetu: Já sám využívám Copilota k vyhledávání na internetu každý den. Kromě toho, že funguje jako super vyhledávač, vám taky pomůže s dotazy týkající se stránky, kterou máte zrovna otevřenou!
Nevýhody:
- Omezené možnosti využití: V porovnání s ChatGPT-4 mi Copilot připadá mnohem slabší v konverzování. A má i specifickou "osobnost". A to i přesto, že verzi "Creative" a "Precise" pohání GPT-4. Často taky odmítá odpovídat na složité otázky. Někdy se dokonce "naštve" a nechce v konverzaci pokračovat nebo odbočuje od tématu.
- Efekt černé skříňky: "Black box" efekt se vztahuje na situaci, kdy uživatel nemá vhled do toho, jak přesně k danému výsledku chatbot dospěl. Copilot někdy nedokáže vysvětlit, proč odpověděl tak, jak odpověděl. Mnohdy tak není možné zjistit, na základě čeho se rozhoduje. Tento problém je ale součástí většiny jazykových modelů.
- Obavy o bezpečnost: Mezery v zabezpečení mohou způsobit, že do vašeho projektu pronikne nechtěný kód. Microsoft jakékoliv pochybnosti spojené s bezpečností popírá, ale bral bych jejich vyjádření s rezervou.
- Opětovné načítání konverzace: Okno Copilota se někdy samo znovu načte. Dojde tak k přerušení konverzace. To je nepříjemné, protože kvůli přetržení pomyslné nitě musíte konverzaci začít úplně od začátku.
3. Gemini: Vylepšený Google vyhledávač
Výhody:
- Parťák, kterému můžete důvěřovat: Poskytuje přesné informace a pracuje s věrohodnými zdroji, které se navíc dají ještě ověřit pomocí malé ikonky Google vedle chatovacího pole.
- Mimořádný učitel: I opravdu složité záležitosti vysvětluje jednoduše. Porozumí jim tak snad každý. S Gemini je učení zábava.
- Bezpečnost na prvním místě: Gemini hledí na bezpečnost. Dokáže rozpoznat škodlivý obsah a generuje tak pouze ten nezávadný. Je proto vhodný i pro mladší uživatele.
Nevýhody:
- Kreativní stránka pokulhává: Gemini není tak kreativní jako například ChatGPT. Pro generování opravdu hezkých textů tak raději používejte ChatGPT.
- Je stále ve vývoji: Gemini je tady s námi pouze pár měsíců. A nejspíš bude ještě chvíli trvat, než jej budeme moci používat univerzálním způsobem jako jeho rivaly ChatGPT a Copilota.
- Není přizpůsobivý: V porovnání s ChatGPT a Copilotem nedokáže tak dobře napodobit váš styl. Také mu často dělá problém přizpůsobit se individuálním potřebám.
- Generuje kontroverzní obrázky: Gemini čelí kritice za podporu stereotypů a chybné vyobrazování historických postav. Toto je obrovský problém, který Google momentálně řeší.
Můj verdikt
Z mého pohledu je vítěz nejednoznačný.
Každý ze zmíněných modelů má své silné a slabé stránky. V čem jeden vyniká, druhý zaostává a opačně. Záleží tedy na tom, jaký problém řešíte:
- Chcete-li s AI generovat zajímavé texty, doporučuji ChatGPT.
- Chcete-li asistenta, který vám pomůže s kódováním nebo analýzou webu v reálném čase, doporučuji Copilota v Edge.
- Chcete-li s AI vyhledávat důvěryhodné informace na internetu, doporučuji Gemini.
ChatGPT-4, Copilot v Edge a Gemini od Googlu však zdaleka nejsou jedinými užitečnými a volně přístupnými nástroji generativní umělé inteligence. Je jich celá řada. Určitě prozkoumejte i jiné možnosti. Možná vám některá z nic sedne víc.
Vlastnost | ChatGPT-4 | Gemini Ultra | Copilot v Edge |
---|---|---|---|
Pochopení jazyka | Vysoká úroveň pochopení přirozeného jazyka | Překonává výkony lidských expertů v MMLU | Silná integrace s Edge pro vylepšené webové interakce |
Kódování | Schopný generovat a rozumět kódu | Vyniká v generování Python kódu, překonává GPT-4 | Generuje a vysvětluje kód v prohlížeči Edge |
Multimodální schopnosti | Vylepšené nástroji pro analýzu obrázků, PDF, atd. | Přirozeně multimodální, rozumí textu, obrázkům, zvuku a videu | Zaměřuje se primárně na text a kód, s potenciálem pro webové multimediální interakce |
Výkon v benchmarcích | Vede si dobře v různých benchmarcích | Momentálně překonává 30 z 32 akademických benchmarků | Specificky nebenchmarkován, navržen pro praktické webové a kódovací úkoly |
Výkon srovnatelný s lidskými experty | Srovnatelný s výkonem expertů v mnoha oblastech | První model, který překonal lidské experty v MMLU | Zaměřuje se na doplnění lidské práce při procházení webu a při kódování |
Flexibilita a efektivita | Všestranný, s možností tvorby custom modelů v mnoha doménách | Optimalizováno pro různé velikosti (Ultra, Pro, Nano) pro efektivitu napříč úkoly | Integrován napřímo do prohlížeče Microsoft Edge pro okamžitou asistenci |
Pokročilé uvažování | Schopný složitého uvažování | Demonstruje sofistikované multimodální usuzovací schopnosti | Vyniká v logickém uvažování při kódování a při navigaci na webu |
Aplikace v reálném světě | Široké spektrum aplikací založených na textu | Zvýšené schopnosti pro vývojáře a podniky, vhodné pro složité úkoly včetně zvuku a videa | Přímo integrován do zážitku z procházení v Edge, zvyšuje produktivitu a učení |
Dostupnost a nasazení | Široký přístup prostřednictvím OpenAI API | Dostupný ve více než 40 jazycích a 230 zemích prostřednictvím mobilní aplikace a pokročilé webové platformy | Dostupný v prohlížeči Microsoft Edge, zvyšuje funkčnost prohlížeče |
Budoucí potenciál | Neustálé aktualizace a vylepšení | Slibuje významný pokrok v multimodálních interakcích | Neustálá integrace pokroků Microsoftu v AI pro zlepšení webové interakce |
Prozkoumávání světa AI: Claude, Mixtral 8x7B a Llama 2
Tento článek je sice zaměřen na velkou trojku, ale já mám v rukávu i další chatboty, kteří stojí za vyzkoušení. Pokud si chcete své AI obzory rozšířit, doporučuji tyto: Claude, Mixtral 8x7B a Llama 2.
Claude 2
Claude 2 patří společnosti Anthropic. Udělá pro vás souhrn dlouhých textů, na které ChatGPT nestačí. A jak dlouhé mohou texty být? Klidně jako román!
Update: Anthropic oznámil novou modelovou řadu Claude 3. Zahrnuje tři nejmodernější modely seřazené vzestupně podle schopností: Claude 3 Haiku, Claude 3 Sonnet a Claude 3 Opus. Všechny modely vykazují ohromující schopnosti v oblasti analýzy, tvorby obsahu a generování kódu.
Mixtral 8x7B
Mixtral 8x7B je projekt společnosti Mistral AI. Ta měla za cíl vyvinout silnější AI model zaměřený na odbornost. Jestli se jim to povedlo nechám posoudit vás.
Mixtral 8x7B ovládá mnoho jazyků, má skvělé znalosti kódování a velké kontextové okno.
Llama 2
Tento model je od společnosti Meta. Jedná se o novou generaci open-source AI. Můžete jej používat zdarma pro výzkum i komerční účely.
Pozn.: Nástroje Mixtral8x7B a Llama 2 můžete vyzkoušet zde.