Martin Svoboda

Rekapitulace roku 2024


Rok 2024 byl plný technologických pokroků i hypu v oblasti umělé inteligence, které naznačují, kam se tento obor může ubírat v roce 2025. V tomto článku shrneme nejdůležitější události a trendy z loňského roku, které měly dopad na AI průmysl, a podíváme se na to, co můžeme očekávat v budoucnu. Tento článek shrnuje obsah videa na našel YouTube kanálu: AI v roce 2024 a co nás čeká v roce 2025.

Přehled událostí v roce 2024

Vybral jsem takové události, které byly zajímavé, v něčem nové v oblasti AI a které mohou mít dopad na další vývoj a mohou nám napovědět kam se obor trend může ubírat v roce 2025.

Leden

ChatGPT spouští GPT-Store

OpenAI představila GPT-Store, což je platforma, která umožňuje uživatelům sdílet a monetizovat vlastní GPT modely. Tento krok vytvořil nový ekosystém zaměřený na komercializaci personalizovaných jazykových modelů.
Více informací zde.

Rabbit Tech představuje AI gadget R1

Rabbit Tech představila svůj první AI gadget, R1, který měl uživatelům umožnit snadnou integraci umělé inteligence do každodenního života.
Více o produktu zde.

OpenAI povoluje vojenské aplikace

OpenAI změnila svou politiku a povolila vojenské využití svých technologií, čímž reagovala na požadavky vládních a obranných organizací.
Podrobnosti naleznete zde.

Eleven Labs získává nové financování

Společnost Eleven Labs představila nové nástroje pro AI dabování a další inovace v oblasti generovaného hlasu.
Více informací zde.

Únor

Apple Vision Pro vstupuje na trh

Apple uvedl na trh zařízení Vision Pro s více než 600 optimalizovanými aplikacemi pro rozšířenou realitu.
Podrobnosti o novince zde.

Neuralink provedl svůj první implantát u člověka, který umožnil pacientovi s paralýzou ovládat zařízení pomocí myšlenek.
Více o této události zde.

Google Bard se přejmenovává na Gemini

Google přejmenoval svůj jazykový model Bard na Gemini a integroval jej do služeb Gmail, Google Docs a dalších.
Více informací zde.

ChatGPT Memory

OpenAI oznámila funkci ChatGPT Memory, která umožňuje zapamatování předchozích interakcí a personalizovaný výstup.
Podrobnosti zde.

Microsoft Copilot integruje GPT-4

Microsoft vylepšil Copilot a integroval do něj GPT-4, což přineslo nové možnosti v kancelářských aplikacích.
Více informací zde.

AI nemůže vlastnit patenty

Americký patentový úřad rozhodl, že umělá inteligence nemůže být vlastníkem patentů, což podnítilo debaty o právním postavení AI.
Více o této problematice zde.

Gemini 1.5 a Mixture of Experts

Google představil model Gemini 1.5 s přístupem „Mixture of Experts“, což přineslo významné zlepšení efektivity a výkonu modelů.
Více informací zde.

Březen

Claude 3: nové modely od Anthropic

Anthropic uvedl rodinu modelů Claude 3, která se rychle zařadila mezi nejvýkonnější na trhu.
Více informací zde.

Devin: první AI softwarový inženýr

Byl představen Devin, první AI softwarový inženýr, který slibuje změnu způsobu psaní a testování kódu.
Více informací zde.

ChatGPT získává hlas

OpenAI představila funkci, která umožňuje ChatGPT předčítat texty generovaným hlasem.
Více o této novince zde.

Heygen: mluvící avatary

Heygen představil nástroj, který umožňuje generovat mluvící avatary na základě textu a videa.
Více informací zde.

Duben

OpenAI a Microsoft plánují obří datové centrum

Společnosti OpenAI a Microsoft oznámily společný projekt datového centra v hodnotě 100 miliard dolarů, který má podpořit budoucí vývoj AI.
Podrobnosti zde.

Gemini 1.5 s 1 milionem tokenů

Google konečně zpřístupnil model Gemini 1.5 s kontextovým oknem o velikosti 1 milion tokenů, což umožňuje zpracování velmi rozsáhlých dat.

Llama 3 od Meta

Meta vydala svůj open-source model Llama 3, který se vyrovná komerční špičce.
Více o modelu zde.

Rabbit Tech zklamal uživatele

Rabbit Tech začal dodávat svůj gadget R1, ale první uživatelé hlásili zklamání kvůli omezené funkčnosti a konkurenci ze strany softwarových řešení.
Podrobnosti zde.

Květen

ChatGPT Memory funkční, ale stále ne v EU

OpenAI konečně zpřístupnila funkci ChatGPT Memory, která zlepšuje personalizaci a umožňuje modelu pamatovat si předchozí interakce. Bohužel však tato funkce stále není dostupná v Evropské unii.

Rabbit R1 jako aplikace

Místo původního AI gadgetu R1 představila Rabbit Tech aplikaci, která nabízí stejnou funkcionalitu a ukázala se jako praktičtější.
Více informací zde.

AlphaFold 3 od DeepMind

Google DeepMind oznámil AlphaFold 3, který dále vylepšuje predikci proteinových struktur, a mnozí jej považují za potenciálního kandidáta na Nobelovu cenu.
Více o AlphaFold 3 zde.

Udio Inpainting

Společnost Udio představila nový nástroj pro inpainting v generované hudbě, který umožňuje upravovat nebo doplňovat mezery v hudebních skladbách.
Podrobnosti zde.

„Abeceda“ vorvaňů

Pomocí strojového učení se vědcům podařilo odhalit základní vzory komunikace vorvaňů, které připomínají „abecedu“.
Více o tomto objevu zde.

GPT-4o

OpenAI vydala GPT-4o, první multimodální model, který zvládá text i obraz na vysoké úrovni.
Podrobnosti naleznete zde.

Ilya Sutskever odchází z OpenAI

Spoluzakladatel OpenAI Ilya Sutskever oznámil svůj odchod, což vyvolalo debaty o budoucím směřování společnosti.
Jeho prohlášení najdete zde.

Google AI Search čelí kritice

Vyhledávání generované Google AI se setkalo s kritikou kvůli nepřesnostem a zkreslením.
Podrobnosti naleznete zde.
Druhý zdroj zde.

Červen

Kling od Kuaishou

Čínská společnost Kuaishou uvedla na trh platformu Kling zaměřenou na generování videí.
Více informací zde.

Luma Dream Machine

Luma Labs představila Dream Machine, nástroj pro generování videí, který nabízí profesionální kvalitu výstupů.
Podrobnosti zde.

Runway Gen 3 Alpha

Runway ML spustila třetí generaci svého nástroje pro generování videí s názvem Gen 3 Alpha.
Více informací zde.

Claude 3.5 Sonnet

Anthropic vydal model Claude 3.5 Sonnet, který překonal výkon svých předchůdců.
Podrobnosti zde.

Claude Projects

Anthropic představil „Claude Projects“, které umožňují využití modelů pro konkrétní úlohy a projekty.
Více informací zde.

Google Gemini 1.5 Pro s 2 miliony tokenů

Google rozšířil kontextové okno modelu Gemini 1.5 Pro na 2 miliony tokenů, což umožňuje zpracování rozsáhlých dat.
Podrobnosti zde.

ChatGPT pro macOS

OpenAI vydala desktopovou aplikaci ChatGPT pro Mac, která uživatelům usnadňuje přístup k AI.
Více informací zde.

OpenAI kupuje platformu pro vzdálenou spolupráci

OpenAI provedla strategickou akvizici platformy zaměřené na vzdálenou spolupráci, aby podpořila týmovou produktivitu.
Podrobnosti naleznete zde.

Červenec

Perplexity AI představila vylepšenou verzi svého produktu Pro Search, která umožňuje pokročilé hledání a zpracování komplexních úloh.
Více informací zde.

OpenAI a pět úrovní AGI

OpenAI zveřejnila svůj rámec pěti úrovní obecné umělé inteligence (AGI) a podělila se o vizi budoucího vývoje AI.
Více o této koncepci zde.

Srpen

Gemini Gems

Google odhalil „Gemini Gems“, což je sada nových funkcí a aplikací jazykových modelů pro lepší personalizaci.
Více informací zde.

Advanced Voice Mode ChatGPT

OpenAI zpřístupnila pokročilý hlasový režim ChatGPT, který podporuje přízvuky a nové jazyky pro přirozenější komunikaci.
Podrobnosti naleznete zde.

Září

OpenAI O1-preview

OpenAI představila model O1-preview, který zavádí nový přístup „test time scaling“.
Více informací zde.

Notebook LM od Google generuje podcasty

Google uvedl funkci, která umožňuje proměnit poznámky a dokumenty do formy podcastů, čímž usnadňuje zpracování informací.
Více o této funkci zde.
Druhý zdroj zde.

Říjen

ChatGPT Canvas

OpenAI představila ChatGPT Canvas, interaktivní pracovní prostor určený pro spolupráci a úpravu obsahu pomocí AI.
Více informací zde.

Nobelova cena za AlphaFold

Demis Hassabis a John Jumper ze společnosti DeepMind obdrželi Nobelovu cenu za chemii za práci na systému AlphaFold, který transformoval predikci proteinových struktur.
Podrobnosti naleznete zde.

Perplexity Spaces

Perplexity AI spustila nástroj Spaces, který umožňuje efektivní interní vyhledávání a správu znalostí v organizacích.
Více informací zde.

Claude 3.5 ovládá počítače

Anthropic přidal do modelu Claude 3.5 funkci pro ovládání počítače, což otevírá nové možnosti automatizace.
Podrobnosti zde.

Autonomní agenti v Copilot Studio

Microsoft integroval autonomní agenty do nástroje Copilot Studio, které nyní mohou samostatně provádět komplexní úkoly.
Více informací zde.

Kontroverzní změny v Copilot

Microsoft čelil kritice uživatelů za změny v uživatelském rozhraní aplikace Copilot, které zkomplikovaly jeho používání.
Podrobnosti naleznete zde.

Eleven Labs: Text-to-Voice

Společnost Eleven Labs představila novou aplikaci pro převod textu na hlas, která umožňuje uživatelům vytvářet personalizované hlasy.
Více informací zde.

OpenAI obnovila funkci ChatGPT Search, která umožňuje přímé vyhledávání informací na internetu prostřednictvím chatbota.
Podrobnosti zde.

Interaktivní avatary

Společnosti Heygen a D-ID představily nové interaktivní avatary schopné vést konverzace v reálném čase.
Informace o Heygen avatary zde.
Informace o D-ID avatary zde.

Listopad

Mistral La Chat

Společnost Mistral představila významnou aktualizaci svého chatovacího nástroje La Chat, který nyní nabízí srovnatelné funkce s konkurencí.
Více informací zde.

Suno V4

Suno představilo svou čtvrtou generaci nástroje pro generování hudby, která nabízí vylepšenou kvalitu a více možností personalizace.
Více informací zde.

Prosinec

O1 a O1 Pro od OpenAI

OpenAI oficiálně uvedla modely O1 a O1 Pro, které se zaměřují na složité úkoly s důrazem na logické plánování. Model O1 Pro je dostupný v rámci předplatného za 200 USD měsíčně.
Podrobnosti zde.

Sora od OpenAI

OpenAI spustila platformu Sora pro generování videí. I když měla na začátku velká očekávání, na trhu existují lepší alternativy.

Veo 2 od Google

Google DeepMind představil Veo 2, pokročilý nástroj pro generování videí s špičkovou kvalitou výstupů.

Gemini 2.0

Google uvedl Gemini 2.0, model navržený speciálně pro zahájení „agentické éry“, kde AI provádí komplexní a autonomní úkoly.
Více informací zde.

OpenAI O3 model

OpenAI oznámila model O3, který zůstává dostupný pouze pro vybrané uživatele. Kvůli extrémním provozním nákladům bude nejvýkonější model pravděpodobně dostupný pouze Pro uživatelům.

OpenAI přechází na ziskovou strukturu

OpenAI formálně přešla na for-profit model, což vyvolalo debaty o budoucnosti etiky a přístupnosti AI.

Bezplatná verze GitHub Copilot

GitHub oznámil, že jeho nástroj Copilot je nyní k dispozici i ve zdarma dostupné verzi, což bylo dlouho očekávané uživateli.
Podrobnosti zde.

Meta chce AI influencery

Společnost Meta oznámila záměr zavádět AI generované influencery na sociálních sítích, což vyvolalo smíšené reakce veřejnosti.

Hlavní trendy roku 2024

  1. Integrace generativní AI do běžných produktů
    AI technologie se staly nedílnou součástí kancelářských nástrojů, jako je Microsoft Office a Google Workspace.

  2. Nové paradigma jazykových modelů
    Rok 2024 přinesl nové technologie, jako je „Mixture of Experts“, multimodální modely a test time scaling které mění možnosti LLM.

  3. Pokroky v generování zvuku
    AI hudba a zvuk dosáhly úrovně, kdy jsou skutečně použitelné v praxi.

  4. Realističtí avataři a generování videa
    Kombinace zvukových a video AI technologií umožnila vznik realistických avatarů.

  5. Autonomní agenti
    První ukázky samostatně fungujících agentů naznačují budoucnost AI, která se stane autonomnější.

Výhled do roku 2025

Rok 2025 slibuje revoluci v oblasti autonomních AI agentů a další explozi kreativního obsahu generovaného umělou inteligencí. S rostoucími možnostmi AI přichází i etické výzvy, které bude nutné řešit.

Budoucnost umělé inteligence je plná možností – a zároveň otázek. Jaké technologie přinese rok 2025? Jaká etická dilemata budeme řešit? Na tyto odpovědi si budeme muset ještě počkat.