
Rekapitulace roku 2024
Rok 2024 byl plný technologických pokroků i hypu v oblasti umělé inteligence, které naznačují, kam se tento obor může ubírat v roce 2025. V tomto článku shrneme nejdůležitější události a trendy z loňského roku, které měly dopad na AI průmysl, a podíváme se na to, co můžeme očekávat v budoucnu. Tento článek shrnuje obsah videa na našel YouTube kanálu: AI v roce 2024 a co nás čeká v roce 2025.
Přehled událostí v roce 2024
Vybral jsem takové události, které byly zajímavé, v něčem nové v oblasti AI a které mohou mít dopad na další vývoj a mohou nám napovědět kam se obor trend může ubírat v roce 2025.
Leden
ChatGPT spouští GPT-Store
OpenAI představila GPT-Store, což je platforma, která umožňuje uživatelům sdílet a monetizovat vlastní GPT modely. Tento krok vytvořil nový ekosystém zaměřený na komercializaci personalizovaných jazykových modelů.
Více informací zde.
Rabbit Tech představuje AI gadget R1
Rabbit Tech představila svůj první AI gadget, R1, který měl uživatelům umožnit snadnou integraci umělé inteligence do každodenního života.
Více o produktu zde.
OpenAI povoluje vojenské aplikace
OpenAI změnila svou politiku a povolila vojenské využití svých technologií, čímž reagovala na požadavky vládních a obranných organizací.
Podrobnosti naleznete zde.
Eleven Labs získává nové financování
Společnost Eleven Labs představila nové nástroje pro AI dabování a další inovace v oblasti generovaného hlasu.
Více informací zde.
Únor
Apple Vision Pro vstupuje na trh
Apple uvedl na trh zařízení Vision Pro s více než 600 optimalizovanými aplikacemi pro rozšířenou realitu.
Podrobnosti o novince zde.
První Neuralink implantovaný člověku
Neuralink provedl svůj první implantát u člověka, který umožnil pacientovi s paralýzou ovládat zařízení pomocí myšlenek.
Více o této události zde.
Google Bard se přejmenovává na Gemini
Google přejmenoval svůj jazykový model Bard na Gemini a integroval jej do služeb Gmail, Google Docs a dalších.
Více informací zde.
ChatGPT Memory
OpenAI oznámila funkci ChatGPT Memory, která umožňuje zapamatování předchozích interakcí a personalizovaný výstup.
Podrobnosti zde.
Microsoft Copilot integruje GPT-4
Microsoft vylepšil Copilot a integroval do něj GPT-4, což přineslo nové možnosti v kancelářských aplikacích.
Více informací zde.
AI nemůže vlastnit patenty
Americký patentový úřad rozhodl, že umělá inteligence nemůže být vlastníkem patentů, což podnítilo debaty o právním postavení AI.
Více o této problematice zde.
Gemini 1.5 a Mixture of Experts
Google představil model Gemini 1.5 s přístupem „Mixture of Experts“, což přineslo významné zlepšení efektivity a výkonu modelů.
Více informací zde.
Březen
Claude 3: nové modely od Anthropic
Anthropic uvedl rodinu modelů Claude 3, která se rychle zařadila mezi nejvýkonnější na trhu.
Více informací zde.
Devin: první AI softwarový inženýr
Byl představen Devin, první AI softwarový inženýr, který slibuje změnu způsobu psaní a testování kódu.
Více informací zde.
ChatGPT získává hlas
OpenAI představila funkci, která umožňuje ChatGPT předčítat texty generovaným hlasem.
Více o této novince zde.
Heygen: mluvící avatary
Heygen představil nástroj, který umožňuje generovat mluvící avatary na základě textu a videa.
Více informací zde.
Duben
OpenAI a Microsoft plánují obří datové centrum
Společnosti OpenAI a Microsoft oznámily společný projekt datového centra v hodnotě 100 miliard dolarů, který má podpořit budoucí vývoj AI.
Podrobnosti zde.
Gemini 1.5 s 1 milionem tokenů
Google konečně zpřístupnil model Gemini 1.5 s kontextovým oknem o velikosti 1 milion tokenů, což umožňuje zpracování velmi rozsáhlých dat.
Llama 3 od Meta
Meta vydala svůj open-source model Llama 3, který se vyrovná komerční špičce.
Více o modelu zde.
Rabbit Tech zklamal uživatele
Rabbit Tech začal dodávat svůj gadget R1, ale první uživatelé hlásili zklamání kvůli omezené funkčnosti a konkurenci ze strany softwarových řešení.
Podrobnosti zde.
Květen
ChatGPT Memory funkční, ale stále ne v EU
OpenAI konečně zpřístupnila funkci ChatGPT Memory, která zlepšuje personalizaci a umožňuje modelu pamatovat si předchozí interakce. Bohužel však tato funkce stále není dostupná v Evropské unii.
Rabbit R1 jako aplikace
Místo původního AI gadgetu R1 představila Rabbit Tech aplikaci, která nabízí stejnou funkcionalitu a ukázala se jako praktičtější.
Více informací zde.
AlphaFold 3 od DeepMind
Google DeepMind oznámil AlphaFold 3, který dále vylepšuje predikci proteinových struktur, a mnozí jej považují za potenciálního kandidáta na Nobelovu cenu.
Více o AlphaFold 3 zde.
Udio Inpainting
Společnost Udio představila nový nástroj pro inpainting v generované hudbě, který umožňuje upravovat nebo doplňovat mezery v hudebních skladbách.
Podrobnosti zde.
„Abeceda“ vorvaňů
Pomocí strojového učení se vědcům podařilo odhalit základní vzory komunikace vorvaňů, které připomínají „abecedu“.
Více o tomto objevu zde.
GPT-4o
OpenAI vydala GPT-4o, první multimodální model, který zvládá text i obraz na vysoké úrovni.
Podrobnosti naleznete zde.
Ilya Sutskever odchází z OpenAI
Spoluzakladatel OpenAI Ilya Sutskever oznámil svůj odchod, což vyvolalo debaty o budoucím směřování společnosti.
Jeho prohlášení najdete zde.
Google AI Search čelí kritice
Vyhledávání generované Google AI se setkalo s kritikou kvůli nepřesnostem a zkreslením.
Podrobnosti naleznete zde.
Druhý zdroj zde.
Červen
Kling od Kuaishou
Čínská společnost Kuaishou uvedla na trh platformu Kling zaměřenou na generování videí.
Více informací zde.
Luma Dream Machine
Luma Labs představila Dream Machine, nástroj pro generování videí, který nabízí profesionální kvalitu výstupů.
Podrobnosti zde.
Runway Gen 3 Alpha
Runway ML spustila třetí generaci svého nástroje pro generování videí s názvem Gen 3 Alpha.
Více informací zde.
Claude 3.5 Sonnet
Anthropic vydal model Claude 3.5 Sonnet, který překonal výkon svých předchůdců.
Podrobnosti zde.
Claude Projects
Anthropic představil „Claude Projects“, které umožňují využití modelů pro konkrétní úlohy a projekty.
Více informací zde.
Google Gemini 1.5 Pro s 2 miliony tokenů
Google rozšířil kontextové okno modelu Gemini 1.5 Pro na 2 miliony tokenů, což umožňuje zpracování rozsáhlých dat.
Podrobnosti zde.
ChatGPT pro macOS
OpenAI vydala desktopovou aplikaci ChatGPT pro Mac, která uživatelům usnadňuje přístup k AI.
Více informací zde.
OpenAI kupuje platformu pro vzdálenou spolupráci
OpenAI provedla strategickou akvizici platformy zaměřené na vzdálenou spolupráci, aby podpořila týmovou produktivitu.
Podrobnosti naleznete zde.
Červenec
Perplexity AI vylepšuje Pro Search
Perplexity AI představila vylepšenou verzi svého produktu Pro Search, která umožňuje pokročilé hledání a zpracování komplexních úloh.
Více informací zde.
OpenAI a pět úrovní AGI
OpenAI zveřejnila svůj rámec pěti úrovní obecné umělé inteligence (AGI) a podělila se o vizi budoucího vývoje AI.
Více o této koncepci zde.
Srpen
Gemini Gems
Google odhalil „Gemini Gems“, což je sada nových funkcí a aplikací jazykových modelů pro lepší personalizaci.
Více informací zde.
Advanced Voice Mode ChatGPT
OpenAI zpřístupnila pokročilý hlasový režim ChatGPT, který podporuje přízvuky a nové jazyky pro přirozenější komunikaci.
Podrobnosti naleznete zde.
Září
OpenAI O1-preview
OpenAI představila model O1-preview, který zavádí nový přístup „test time scaling“.
Více informací zde.
Notebook LM od Google generuje podcasty
Google uvedl funkci, která umožňuje proměnit poznámky a dokumenty do formy podcastů, čímž usnadňuje zpracování informací.
Více o této funkci zde.
Druhý zdroj zde.
Říjen
ChatGPT Canvas
OpenAI představila ChatGPT Canvas, interaktivní pracovní prostor určený pro spolupráci a úpravu obsahu pomocí AI.
Více informací zde.
Nobelova cena za AlphaFold
Demis Hassabis a John Jumper ze společnosti DeepMind obdrželi Nobelovu cenu za chemii za práci na systému AlphaFold, který transformoval predikci proteinových struktur.
Podrobnosti naleznete zde.
Perplexity Spaces
Perplexity AI spustila nástroj Spaces, který umožňuje efektivní interní vyhledávání a správu znalostí v organizacích.
Více informací zde.
Claude 3.5 ovládá počítače
Anthropic přidal do modelu Claude 3.5 funkci pro ovládání počítače, což otevírá nové možnosti automatizace.
Podrobnosti zde.
Autonomní agenti v Copilot Studio
Microsoft integroval autonomní agenty do nástroje Copilot Studio, které nyní mohou samostatně provádět komplexní úkoly.
Více informací zde.
Kontroverzní změny v Copilot
Microsoft čelil kritice uživatelů za změny v uživatelském rozhraní aplikace Copilot, které zkomplikovaly jeho používání.
Podrobnosti naleznete zde.
Eleven Labs: Text-to-Voice
Společnost Eleven Labs představila novou aplikaci pro převod textu na hlas, která umožňuje uživatelům vytvářet personalizované hlasy.
Více informací zde.
ChatGPT Search
OpenAI obnovila funkci ChatGPT Search, která umožňuje přímé vyhledávání informací na internetu prostřednictvím chatbota.
Podrobnosti zde.
Interaktivní avatary
Společnosti Heygen a D-ID představily nové interaktivní avatary schopné vést konverzace v reálném čase.
Informace o Heygen avatary zde.
Informace o D-ID avatary zde.
Listopad
Mistral La Chat
Společnost Mistral představila významnou aktualizaci svého chatovacího nástroje La Chat, který nyní nabízí srovnatelné funkce s konkurencí.
Více informací zde.
Suno V4
Suno představilo svou čtvrtou generaci nástroje pro generování hudby, která nabízí vylepšenou kvalitu a více možností personalizace.
Více informací zde.
Prosinec
O1 a O1 Pro od OpenAI
OpenAI oficiálně uvedla modely O1 a O1 Pro, které se zaměřují na složité úkoly s důrazem na logické plánování. Model O1 Pro je dostupný v rámci předplatného za 200 USD měsíčně.
Podrobnosti zde.
Sora od OpenAI
OpenAI spustila platformu Sora pro generování videí. I když měla na začátku velká očekávání, na trhu existují lepší alternativy.
Veo 2 od Google
Google DeepMind představil Veo 2, pokročilý nástroj pro generování videí s špičkovou kvalitou výstupů.
Gemini 2.0
Google uvedl Gemini 2.0, model navržený speciálně pro zahájení „agentické éry“, kde AI provádí komplexní a autonomní úkoly.
Více informací zde.
OpenAI O3 model
OpenAI oznámila model O3, který zůstává dostupný pouze pro vybrané uživatele. Kvůli extrémním provozním nákladům bude nejvýkonější model pravděpodobně dostupný pouze Pro uživatelům.
OpenAI přechází na ziskovou strukturu
OpenAI formálně přešla na for-profit model, což vyvolalo debaty o budoucnosti etiky a přístupnosti AI.
Bezplatná verze GitHub Copilot
GitHub oznámil, že jeho nástroj Copilot je nyní k dispozici i ve zdarma dostupné verzi, což bylo dlouho očekávané uživateli.
Podrobnosti zde.
Meta chce AI influencery
Společnost Meta oznámila záměr zavádět AI generované influencery na sociálních sítích, což vyvolalo smíšené reakce veřejnosti.
Hlavní trendy roku 2024
-
Integrace generativní AI do běžných produktů
AI technologie se staly nedílnou součástí kancelářských nástrojů, jako je Microsoft Office a Google Workspace. -
Nové paradigma jazykových modelů
Rok 2024 přinesl nové technologie, jako je „Mixture of Experts“, multimodální modely a test time scaling které mění možnosti LLM. -
Pokroky v generování zvuku
AI hudba a zvuk dosáhly úrovně, kdy jsou skutečně použitelné v praxi. -
Realističtí avataři a generování videa
Kombinace zvukových a video AI technologií umožnila vznik realistických avatarů. -
Autonomní agenti
První ukázky samostatně fungujících agentů naznačují budoucnost AI, která se stane autonomnější.
Výhled do roku 2025
Rok 2025 slibuje revoluci v oblasti autonomních AI agentů a další explozi kreativního obsahu generovaného umělou inteligencí. S rostoucími možnostmi AI přichází i etické výzvy, které bude nutné řešit.
Budoucnost umělé inteligence je plná možností – a zároveň otázek. Jaké technologie přinese rok 2025? Jaká etická dilemata budeme řešit? Na tyto odpovědi si budeme muset ještě počkat.