História LLM

Kľúčové míľniky vo vývoji veľkých jazykových modelov od roku 2017 po súčasnosť.

2026 (2 udalostí)

Priemysel

Vydanie Claude Cowork

Anthropic predstavil Claude Cowork, grafický nástroj určený pre netechnických používateľov. Cowork umožňuje ľuďom bez programátorských skúseností využívať silu AI na tvorbu dokumentov, analýzu dát a automatizáciu úloh. Produkt demokratizoval prístup k pokročilým AI schopnostiam.

anthropic claude gui non-technical productivity
Vydanie

Vydanie GPT-5.2-Codex

OpenAI uviedol GPT-5.2-Codex, najlepší agentický model na programovanie. Model dokáže samostatne pracovať na zložitých softvérových projektoch vrátane návrhu architektúry, implementácie a testovania. Codex posunul hranice automatizovaného vývoja softvéru.

openai codex agentic-coding software-development

2025 (14 udalostí)

Vydanie

Vydanie Gemini 3 Flash

Google vydal Gemini 3 Flash, ktorý sa stal novým predvoleným modelom v aplikácii Gemini. Flash verzia ponúkla rýchle odpovede s výrazne nižšími nákladmi pri zachovaní vysokej kvality. Model bol optimalizovaný pre každodenné použitie miliardami používateľov.

google gemini flash default-model
Vydanie

Vydanie GPT-5.2

OpenAI vydal GPT-5.2, prvý model dosahujúci expertnú úroveň v 70,9 % profesionálnych úloh. Model prekonal ľudských expertov vo viacerých odborných oblastiach vrátane práva, medicíny a financií. Tento míľnik potvrdil rýchle približovanie AI k ľudskej expertíze.

openai gpt-5-2 expert-level professional
Vydanie

Oznámenie Gemini 3 Pro a Deep Think

Google oznámil Gemini 3 Pro a režim Deep Think, najvýkonnejšie modely od Google. Gemini 3 Pro priniesol výrazné zlepšenia v uvažovaní, kódovaní a multimodálnych úlohách. Deep Think umožnil modelu stráviť viac času hlbokým premýšľaním nad zložitými problémami.

google gemini deep-think reasoning
Vydanie

Vydanie Claude Haiku 4.5

Anthropic vydal Claude Haiku 4.5, najrýchlejší a cenovo najefektívnejší model od Anthropicu. Haiku 4.5 ponúkol výkon porovnateľný s väčšími modelmi pri zlomku nákladov. Ideálny pre aplikácie vyžadujúce nízku latenciu a vysokú priepustnosť.

anthropic claude haiku cost-effective fast
Vydanie

Vydanie Claude Sonnet 4.5

Anthropic uviedol Claude Sonnet 4.5, označený ako najlepší model na programovanie na svete. Model vynikal v generovaní kódu, ladení a architektonickom návrhu softvérových systémov. Ponúkol výnimočný pomer výkonu a ceny.

anthropic claude coding sonnet
Vydanie

Vydanie GPT-5

OpenAI predstavil GPT-5, ktorý priniesol veľký skok v schopnostiach AI. Model ponúkol kontextové okno 400 000 tokenov a o 80 % menej halucinácií oproti predchodcom. GPT-5 stanovil nový štandard pre všeobecné jazykové modely.

openai gpt-5 hallucination-reduction large-context
Vydanie

Vydanie Claude Opus 4.1

Anthropic vydal Claude Opus 4.1 s hybridným uvažovaním a najlepším výkonom v programovaní. Model kombinoval rýchle odpovede s hlbokým uvažovaním podľa potreby. Opus 4.1 sa stal referenciou pre kódovanie a zložité analytické úlohy.

anthropic claude hybrid-reasoning coding
Open Source

Vydanie DeepSeek V3.1

DeepSeek vydal aktualizovaný základný model V3.1 s otvoreným zdrojovým kódom. Model priniesol vylepšenia v mnohojazyčnej podpore, kódovaní a nasledovaní inštrukcií. DeepSeek V3.1 posilnil pozíciu čínskeho AI ekosystému na globálnej scéne.

deepseek open-source foundation-model llm
Vydanie

Všeobecná dostupnosť Gemini 2.5 Pro a Flash

Google sprístupnil modely Gemini 2.5 Pro a Flash pre všeobecné použitie. Tieto modely s funkciou myslenia (thinking) priniesli vylepšené uvažovanie a dlhý kontextový rozsah. Stali sa základom pre produkty Google ako Gemini chat a AI v Google Workspace.

google gemini thinking general-availability
Vydanie

Vydanie o3-pro

OpenAI uviedol o3-pro, najschopnejší model na uvažovanie v tom čase. Model vynikal v zložitých matematických, vedeckých a programovacích úlohách. Bol dostupný cez ChatGPT Pro predplatné pre najnáročnejších používateľov.

openai reasoning pro chatgpt
Vydanie

Vydanie OpenAI o3 a o4-mini

OpenAI predstavil modely o3 a o4-mini, prvé modely na uvažovanie s agentickým použitím nástrojov. Tieto modely dokážu samostatne prehľadávať web, analyzovať obrázky a používať nástroje počas riešenia úloh. Predstavujú významný posun smerom k autonómnym AI agentom.

openai reasoning agentic tool-use
Vydanie

Claude 4.5 rodina - Opus, Sonnet, Haiku

Anthropic predstavilo kompletnú rodinu Claude 4.5 s modelmi Opus, Sonnet a Haiku. Claude Opus 4.5 sa stal novým lídrom v reasoning a komplexných úlohách, zatiaľ čo Sonnet 4.5 ponúka optimálny pomer výkon/cena a Haiku 4.5 je najrýchlejší model pre jednoduchšie úlohy. Celá rodina podporuje rozšírené multimodálne schopnosti a dlhé kontextové okná.

claude anthropic rodina modelov opus reasoning
Vydanie

o3-mini - Dostupný reasoning model

OpenAI uvolnilo o3-mini, kompaktnejší a cenovo dostupnejší reasoning model z rodiny o3. Model ponúka konfigurovateľné úrovne reasoning úsilia (low, medium, high) a exceluje v programovaní, matematike a STEM úlohách pri zlomku nákladov väčších reasoning modelov, čím sprístupňuje pokročilé reasoning širšiemu publiku.

o3 openai reasoning cenovo efektívny stem
Open Source

Vydanie DeepSeek R1

DeepSeek vydal R1, open source model zameraný na uvažovanie. Model dosiahol výkon porovnateľný s proprietárnymi modelmi a bol voľne dostupný na stiahnutie. Tento krok významne posilnil ekosystém otvorených AI modelov.

deepseek reasoning open-source llm

2024 (20 udalostí)

Open Source

DeepSeek V3 - Čínsky MoE model

Čínsky DeepSeek predstavil DeepSeek V3, Mixture-of-Experts model s 671 miliardami parametrov (aktivuje 37B) trénovaný za iba 5,5 milióna dolárov. Model dosahuje konkurencieschopné výsledky s GPT-4o a Claude 3.5 Sonnet pri zlomku nákladov, čím demonštruje rastúcu efektivitu tréningu a posúva open source hranice.

deepseek čína moe efektivita 671b parametrov
Vydanie

Gemini 2.0 Flash - Multimodálna budúcnosť

Google predstavilo Gemini 2.0 Flash, prvý model z rodiny Gemini 2.0 zameraný na agentic AI aplikácie. Model dokáže natívne generovať text, obrázky a audio, podporuje multimodálny live streaming a ponúka dvojnásobnú rýchlosť oproti 1.5 Pro. Gemini 2.0 predstavuje víziu Google pre AI agentov integrovaných v reálnom svete.

gemini google multimodal agentic real-time
Vydanie

Sora oficiálne spustená ako spotrebiteľský produkt

OpenAI oficiálne spustilo Sora ako spotrebiteľský produkt dostupný pre predplatiteľov ChatGPT Plus a Pro. Používatelia mohli generovať videá až do 20 sekúnd v rozlíšení 1080p z textových popisov alebo obrázkov. Spustenie bolo sprevádzané obrovským záujmom, ktorý dočasne preťažil servery. Sora sa stala prvým masovo dostupným nástrojom na generovanie videa pomocou AI od veľkej technologickej spoločnosti.

sora openai generovanie videa spotrebiteľský produkt text-to-video
Open Source

Qwen 2.5 - Čínsky open source konkurent

Alibaba Cloud predstavilo Qwen 2.5, rodinu open source modelov (0.5B až 72B parametrov) s výnimočným výkonom v programovaní, matematike a multilingválnych úlohách. Qwen 2.5 dosahuje konkurencieschopné výsledky s Llama 3.1 a demonštruje rastúcu silu čínskeho AI výskumu v open source komunite.

qwen alibaba čína open source multilingválny
Vydanie

Claude získava schopnosť ovládania počítača

Anthropic predstavil schopnosť 'computer use' pre Claude, ktorá umožňovala modelu priamo interagovať s počítačovým rozhraním - klikať na tlačidlá, písať text, navigovať webové stránky a pracovať s aplikáciami ako ľudský používateľ. Táto funkcia predstavovala zásadný posun od pasívneho odpovedania na otázky k aktívnemu vykonávaniu úloh na počítači. Claude sa stal jedným z prvých komerčných AI systémov s touto schopnosťou.

claude anthropic computer use agentové ai automatizácia
Priemysel

Demis Hassabis získava Nobelovu cenu za chémiu za AlphaFold

Demis Hassabis a John Jumper z Google DeepMind spolu s Davidom Bakerom získali Nobelovu cenu za chémiu za predpovedanie štruktúry proteínov a dizajn proteínov. AlphaFold vyriešil jeden z najväčších problémov v biológii - predpovedanie 3D štruktúry proteínu z jeho aminokyselinovej sekvencie. Tento úspech demonštroval revolučný potenciál AI v riešení fundamentálnych vedeckých problémov.

hassabis nobelova cena chémia alphafold deepmind proteíny
Priemysel

Geoffrey Hinton získava Nobelovu cenu za fyziku za AI

Geoffrey Hinton a John Hopfield boli ocenení Nobelovou cenou za fyziku za základné objavy umožňujúce strojové učenie pomocou umelých neurónových sietí. Hinton, často označovaný ako 'krstný otec hlbokého učenia', bol ocenený za prácu na Boltzmannových strojoch a algoritme backpropagation. Toto ocenenie symbolizovalo uznanie transformačného vplyvu AI na vedu a spoločnosť zo strany najvyššej vedeckej autority.

hinton nobelova cena fyzika neurónové siete ocenenie
Vydanie

OpenAI o1-preview - prvý uvažovací model

OpenAI vydalo o1-preview, prvý model špeciálne navrhnutý na komplexné uvažovanie (reasoning). Na rozdiel od predchádzajúcich modelov o1 využíval reťaz myšlienok (chain of thought) priamo počas inferencie, čo mu umožňovalo riešiť zložité matematické, vedecké a programátorské problémy s výrazne vyššou presnosťou. Model otvoril novú kategóriu 'reasoning modelov' a naznačil budúci smer vývoja AI.

o1 openai uvažovanie reasoning chain of thought nová kategória
Open Source

Llama 3.2 - Malé a multimodálne modely

Meta predstavila Llama 3.2 s novou rodinou ľahkých modelov (1B, 3B) optimalizovaných pre edge zariadenia a multimodálne modely (11B, 90B) s podporou vision. Malé modely umožnili používanie Llama priamo na mobiloch a IoT zariadeniach, zatiaľ čo vision modely rozšírili schopnosti Llama na obrazovú analýzu.

llama meta edge computing multimodal vision
Open Source

Mistral Large 2 - Európsky flagship

Mistral AI predstavilo Mistral Large 2 so 123 miliardami parametrov, svoj najvýkonnejší model dizajnovaný pre komplexné reasoning, programovanie a multilingválne úlohy. Model podporuje 128K kontext a je dostupný pod permisívnou licenciou, čím posilňuje pozíciu Európy v globálnej AI konkurencii.

mistral európa flagship 123b parametrov
Open Source

Llama 3.1 405B - najväčší open source model

Meta vydala Llama 3.1 vo veľkostiach 8B, 70B a 405B parametrov, pričom 405B verzia sa stala najväčším open source jazykovým modelom v histórii. Model dosahoval výkon porovnateľný s GPT-4 a Claude 3.5 Sonnet na mnohých benchmarkoch. Llama 3.1 405B dokázal, že open source modely dokážu konkurovať najlepším proprietárnym modelom a výrazne posunul hranice toho, čo je voľne dostupné.

llama-3.1 meta open source 405b najväčší model
Vydanie

Claude 3.5 Sonnet - najlepší model na programovanie

Anthropic vydal Claude 3.5 Sonnet, ktorý prekvapivo prekonával aj oveľa väčší Claude 3 Opus na väčšine benchmarkov pri zachovaní rýchlosti a ceny strednej triedy. Model sa stal de facto štandardom pre programovanie a kódové úlohy, kde výrazne prekonával konkurenciu. Claude 3.5 Sonnet ukázal, že menšie, efektívnejšie modely môžu prekonať väčšie modely predchádzajúcej generácie.

claude-3.5-sonnet anthropic programovanie efektivita benchmark
Priemysel

OpenAI bezpečnostná kontrovérzia

Niekoľko kľúčových členov bezpečnostného tímu OpenAI, vrátane Ilyu Sutskevera a Jan Leikeho, opustilo spoločnosť s obavami o prioritizáciu bezpečnosti. Tento odchod vyvolal diskusiu o rovnováhe medzi rýchlym vývojom AI a zodpovedným prístupom k bezpečnosti pri budovaní superinteligencie.

openai bezpečnosť kontrovérzia etika
Vydanie

GPT-4o - natívny multimodálny model od OpenAI

OpenAI vydalo GPT-4o ('o' pre 'omni'), prvý model s natívnou multimodálnou architektúrou, ktorý dokázal spracovávať a generovať text, zvuk aj obraz v reálnom čase. GPT-4o bol výrazne rýchlejší a lacnejší ako GPT-4 Turbo pri zachovaní porovnateľnej kvality. Model bol sprístupnený zadarmo všetkým používateľom ChatGPT, čím OpenAI demokratizovalo prístup k špičkovým AI schopnostiam.

gpt-4o openai omni multimodálny reálny čas bezplatný
Open Source

Llama 3 - Meta nová generácia

Meta predstavila Llama 3 s modelmi 8B a 70B parametrov, ktoré priniesli významné zlepšenia oproti Llama 2. Llama 3 bola trénovaná na 15 trilióne tokenov a dosahuje state-of-the-art výsledky medzi open source modelmi, pričom Llama 3 70B konkuruje niektorým proprietárnym modelom v mnohých benchmarkoch.

llama meta open source výkon
Open Source

Mixtral 8x22B - Väčší MoE model

Mistral AI uvolnilo Mixtral 8x22B, väčšiu verziu svojho Mixture-of-Experts modelu so 141 miliardami celkových parametrov (využíva 39B aktívne). Model dosahuje výsledky blízke proprietárnym modelom ako GPT-4 v mnohých úlohách, pričom zostáva open source a efektívny na inference.

mistral moe open source 141b parametrov
Regulácia

Európska únia prijala AI Act

Európsky parlament schválil AI Act, prvý komplexný právny rámec pre reguláciu umelej inteligencie na svete. Legislatíva zavádza rizikovú klasifikáciu AI systémov a požiadavky pre vysokorizikové aplikácie vrátane transparency pre generatívnu AI. AI Act bude slúžiť ako vzor pre reguláciu AI globálne.

regulácia európska únia legislatíva ai act
Vydanie

Claude 3 - rodina modelov Opus, Sonnet a Haiku

Anthropic vydal rodinu modelov Claude 3 v troch veľkostiach: Opus (najschopnejší), Sonnet (vyvážený) a Haiku (najrýchlejší). Claude 3 Opus sa stal prvým modelom, ktorý prekonával GPT-4 na viacerých benchmarkoch, a priniesol natívne multimodálne schopnosti vrátane porozumenia obrázkov. Tento release etabloval Anthropic ako rovnocenného konkurenta OpenAI v oblasti špičkových jazykových modelov.

claude-3 anthropic opus sonnet haiku multimodálny
Vydanie

Gemini 1.5 Pro s kontextovým oknom 1 milión tokenov

Google DeepMind predstavil Gemini 1.5 Pro s revolučným kontextovým oknom 1 milión tokenov, čo umožňovalo spracovať celé knihy, rozsiahle kódové bázy alebo hodiny videa v jednom prompte. Neskôr bolo okno rozšírené na 2 milióny tokenov. Tento prielom v dĺžke kontextu zásadne zmenil možnosti využitia LLM a nastavil nový štandard pre celý priemysel.

gemini google kontextové okno 1m tokenov dlhý kontext
Vydanie

OpenAI predstavuje Sora - generovanie videa z textu

OpenAI predstavilo ukážku modelu Sora, ktorý dokázal generovať realistické videá až do 60 sekúnd na základe textového popisu. Sora generovala videá s pozoruhodnou vizuálnou kvalitou a konzistenciou, čo vyvolalo obrovský rozruch v kreatívnom priemysle. V čase uvedenia bol model dostupný len pre červených tímových testerov a vybraných umelcov.

sora openai generovanie videa text-to-video kreatívna ai

2023 (16 udalostí)

Open Source

Mixtral 8x7B - Sparse Mixture of Experts

Mistral AI uvolnilo Mixtral 8x7B, prvý open source Sparse Mixture of Experts (SMoE) model. Napriek 47 miliardom celkovým parametrom využíva len 13B pri každom tokene, čím dosahuje výkon väčších modelov pri nižších nákladoch. Mixtral preukázal kompetitívne výsledky s GPT-3.5 a Llama 2 70B.

mixtral moe open source efektivita
Vydanie

Gemini 1.0 - Google multimodálny model

Google DeepMind predstavilo Gemini 1.0, svoj najvýkonnejší a natívne multimodálny model dostupný v troch veľkostiach: Ultra, Pro a Nano. Gemini bol trénovaný od začiatku na spracovanie textu, kódu, obrázkov, audia a videa, pričom Gemini Ultra údajne prekonal GPT-4 v mnohých benchmarkoch.

gemini google multimodal deepmind
Priemysel

Kríza v OpenAI - odvolanie a návrat Sama Altmana

Správna rada OpenAI nečakane odvolala CEO Sama Altmana, čo vyvolalo dramatickú krízu v najvplyvnejšej AI spoločnosti sveta. Nasledovalo päť dní chaosu, počas ktorých takmer 700 z 770 zamestnancov pohrozilo odchodom a Microsoft ponúkol Altmanovi vedenie novej AI divízie. Altman sa nakoniec vrátil ako CEO s novou správnou radou, čo vyvolalo otázky o riadení a zodpovednosti v AI spoločnostiach.

openai altman kríza správna rada riadenie ai
Priemysel

ChatGPT prekročil 100 miliónov používateľov

ChatGPT dosiahol míľnik 100 miliónov aktívnych týždenných používateľov, čo z neho urobilo najrýchlejšie rastúcu spotrebiteľskú aplikáciu v histórii. Tento úspech potvrdil masový záujem o AI technológie a katalyzoval investície do AI startupov a výskumu naprieč celým odvetvím.

chatgpt míľnik používatelia mainstream adopcia
Priemysel

OpenAI DevDay - GPTs a Assistants API

OpenAI usporiadalo svoju prvú vývojársku konferenciu DevDay, na ktorej predstavilo GPTs - možnosť vytvárať si vlastné prispôsobené verzie ChatGPT bez programovania. Zároveň bolo oznámené Assistants API, GPT-4 Turbo s 128K kontextovým oknom a GPT Store. Konferencia signalizovala posun OpenAI smerom k platforme a ekosystému namiesto jednorazového produktu.

devday openai gpts assistants api platforma ekosystém
Regulácia

UK AI Safety Summit v Bletchley Park

Prvý globálny summit o bezpečnosti AI sa konal v historickom Bletchley Park s účasťou predstaviteľov 28 krajín vrátane USA, Číny a EÚ. Summit viedol k podpísaniu Bletchley Declaration o potrebe medzinárodnej spolupráce pri riadení rizík pokročilých AI systémov.

regulácia bezpečnosť medzinárodná spolupráca uk
Open Source

Mistral 7B - Francúzsky prelom

Francúzsky startup Mistral AI uvolnil svoj prvý model Mistral 7B, ktorý prekvapil komunitu tým, že s len 7 miliardami parametrov prekonal mnohé väčšie modely vrátane Llama 2 13B. Mistral 7B ukázal, že efektívny dizajn a kvalitné trénovanie môžu byť dôležitejšie ako čistá veľkosť modelu.

mistral open source efektivita európa
Open Source

Code Llama - Open source programovací model

Meta uvolnila Code Llama, špecializované verzie Llama 2 optimalizované pre generovanie a reasoning o kóde. Dostupné v veľkostiach 7B, 13B a 34B, vrátane Python-špecifických variant, Code Llama poskytol open source alternatívu k proprietárnym programovacím modelom ako Codex.

code llama meta open source programovanie
Open Source

Meta vydáva Llama 2 ako open source

Meta vydala Llama 2 ako open source model dostupný na komerčné aj výskumné použitie v spolupráci s Microsoftom. Model bol dostupný vo veľkostiach 7B, 13B a 70B parametrov a ponúkal výkon porovnateľný s mnohými proprietárnymi modelmi. Llama 2 výrazne demokratizoval prístup k výkonným jazykovým modelom a podnietil rozkvet open source AI komunity a ekosystému.

llama-2 meta open source demokratizácia ai komerčné použitie
Vydanie

Claude 2 - 100K kontextové okno

Anthropic predstavilo Claude 2 s revolučným kontextovým oknom 100K tokenov (približne 75 000 slov), čo bolo výrazne více ako konkurencia. Model dokázal spracovať celé knihy alebo veľké kódové bázy naraz, čím otvoril nové možnosti použitia pre analýzu dokumentov a komplexné úlohy.

claude anthropic 100k kontext dlhý kontext
Vydanie

Google vydáva PaLM 2 na Google I/O

Google na svojej výročnej konferencii Google I/O predstavil PaLM 2, nový veľký jazykový model, ktorý poháňal Bard a ďalšie Google produkty. PaLM 2 bol trénovaný na viac ako 100 jazykoch a vynikal v uvažovaní, programovaní a viacjazyčných úlohách. Google zároveň oznámil integráciu AI do všetkých svojich hlavných produktov vrátane Gmail, Docs a Search.

palm-2 google google i/o bard viacjazyčný
Vydanie

GPT-4 API sprístupnené vývojárom

OpenAI začalo postupne sprístupňovať GPT-4 API vývojárom, čo umožnilo integráciu najvýkonnejšieho modelu do aplikácií tretích strán. Tento krok inicioval vlnu nových AI-powered aplikácií a služieb postavených na GPT-4 a zrýchlil adopciu pokročilých LLM v biznise.

gpt-4 openai api vývojári
Vydanie

Anthropic spúšťa Claude

Spoločnosť Anthropic, založená bývalými výskumníkmi z OpenAI, spustila svojho prvého AI asistenta Claude. Model bol navrhnutý s dôrazom na bezpečnosť a využíval techniku Constitutional AI (ústavná AI) na zabezpečenie bezpečnejších a užitočnejších odpovedí. Claude sa rýchlo etabloval ako významný konkurent ChatGPT a GPT-4 a ponúkal alternatívny prístup k vývoju AI s dôrazom na zodpovednosť.

claude anthropic constitutional ai bezpečnosť konverzačná ai
Vydanie

GPT-4 - prvý skutočne multimodálny LLM od OpenAI

OpenAI vydalo GPT-4, svoj najschopnejší model, ktorý ako prvý z rodiny GPT dokázal spracovávať aj obrázky okrem textu. GPT-4 výrazne prekonával GPT-3.5 v logickom uvažovaní, programovaní a riešení komplexných úloh, vrátane úspešného absolvovania advokátskej skúšky. Model nastavil nový štandard pre veľké jazykové modely a vyvolal diskusiu o blížiacej sa umelej všeobecnej inteligencii.

gpt-4 openai multimodálny uvažovanie llm
Vydanie

Bing Chat - Microsoft vstupuje do hry

Microsoft predstavil nový Bing s integrovaným ChatGPT (GPT-4), čím prvýkrát priniesol pokročilú konverzačnú AI priamo do vyhľadávača. Tento krok signalizoval začiatok 'AI vojny' medzi veľkými technologickými spoločnosťami a ukázal potenciál kombinovania LLM s webovým vyhľadávaním.

bing microsoft vyhľadávanie gpt-4
Priemysel

Microsoft investuje 10 miliárd dolárov do OpenAI

Microsoft oznámil investíciu vo výške 10 miliárd dolárov do OpenAI v rámci dlhodobého partnerstva. Táto investícia sa stala jednou z najväčších v histórii technologického priemyslu a posilnila pozíciu Microsoftu v pretekoch o vedúce postavenie v AI. Partnerstvo viedlo k integrácii modelov OpenAI do produktov Microsoftu vrátane Bing, Office 365 a Azure.

microsoft openai investícia partnerstvo 10 miliárd

2022 (4 udalostí)

Vydanie

ChatGPT - spustenie éry konverzačnej AI

OpenAI spustilo ChatGPT, konverzačného AI asistenta založeného na GPT-3.5 s RLHF. ChatGPT sa stal najrýchlejšie rastúcou spotrebiteľskou aplikáciou v histórii a dosiahol 100 miliónov používateľov za necelé dva mesiace. Táto udalosť priniesla umelú inteligenciu do povedomia širokej verejnosti a odštartovala globálny AI boom, ktorý zmenil celý technologický priemysel.

chatgpt openai konverzačná ai mainstream 100 miliónov
Open Source

Stable Diffusion - demokratizácia generovania obrázkov

Stability AI vydalo Stable Diffusion ako open source model na generovanie obrázkov z textu. Na rozdiel od DALL-E 2 a Midjourney bol Stable Diffusion voľne dostupný a mohol bežať na bežnom spotrebiteľskom hardvéri. Tento krok demokratizoval prístup ku generatívnej AI pre obrázky a vytvoril obrovský ekosystém nástrojov, rozšírení a komunitných modelov.

stable diffusion stability ai open source generovanie obrázkov difúzia
Vydanie

DALL-E 2 - výrazne lepšia kvalita generovania obrázkov

OpenAI vydalo DALL-E 2 s výrazne vyššou kvalitou generovaných obrázkov a rozlíšením oproti prvej verzii. Model využíval difúzny prístup namiesto autoregresívneho a podporoval aj úpravu existujúcich obrázkov (inpainting) a vytváranie variácií. DALL-E 2 pritiahol masovú pozornosť verejnosti ku generatívnej AI a odštartoval súťaž v oblasti text-to-image modelov.

dall-e-2 openai generovanie obrázkov difúzia text-to-image
Výskum

InstructGPT a RLHF - základ pre ChatGPT

OpenAI publikovalo výskum InstructGPT, ktorý využíval metódu RLHF (Reinforcement Learning from Human Feedback) na doladenie jazykových modelov podľa ľudských inštrukcií. Ľudskí hodnotitelia porovnávali odpovede modelu a model sa učil preferovať odpovede, ktoré boli užitočnejšie, pravdivejšie a bezpečnejšie. Tento prístup sa stal základom pre ChatGPT a zmenil spôsob, akým sa dolaďujú jazykové modely.

instructgpt rlhf openai dolaďovanie ľudská spätná väzba

2021 (3 udalostí)

Výskum

Codex - AI pre generovanie kódu

OpenAI predstavilo Codex, model založený na GPT-3 ale dotrénovaný na kóde z GitHubu. Codex sa stal základom pre GitHub Copilot a demonštroval, že veľké jazykové modely môžu efektívne generovať funkčný programovací kód v rôznych jazykoch.

codex openai programovanie github copilot
Vydanie

GitHub Copilot - AI programátorský asistent

GitHub v spolupráci s OpenAI predstavil Copilot, prvý mainstream AI programátorský asistent postavený na modeli Codex. Copilot dokáže automaticky dokončovať kód, navrhovať celé funkcie a pomáhať s programovaním v reálnom čase priamo v editore. Tento nástroj zásadne zmenil pracovný tok vývojárov.

github copilot programovanie vývojárske nástroje codex
Vydanie

DALL-E - generovanie obrázkov z textu

OpenAI predstavilo DALL-E, model schopný generovať obrázky z textových popisov. Model bol založený na architektúre GPT-3 prispôsobenej na generovanie obrazu a dokázal vytvárať kreatívne vizualizácie konceptov, ktoré nikdy predtým neexistovali. DALL-E otvoril novú éru generatívnej AI pre tvorbu obrazového obsahu a inšpiroval vlnu podobných modelov.

dall-e openai generovanie obrázkov text-to-image multimodálne

2020 (2 udalostí)

Vydanie

GPT-3 - 175 miliárd parametrov a few-shot učenie

OpenAI vydalo GPT-3 so 175 miliardami parametrov, čo bol v tom čase zďaleka najväčší jazykový model. GPT-3 prekvapil schopnosťou 'few-shot learning' - dokázal riešiť nové úlohy len na základe niekoľkých príkladov v prompte bez akéhokoľvek dolaďovania. Model demonštroval emergentné schopnosti, ktoré neboli prítomné v menších modeloch, a podnietil vlnu záujmu o veľké jazykové modely.

gpt-3 openai few-shot veľký jazykový model škálovanie
Výskum

Zákony škálovania pre neurónové jazykové modely

Výskumníci z OpenAI (Jared Kaplan a kol.) publikovali prelomový článok o zákonoch škálovania neurónových jazykových modelov. Ukázali, že výkon modelov sa predvídateľne zlepšuje s rastúcim počtom parametrov, objemom trénovacích dát a výpočtovým výkonom podľa mocninových zákonov. Tieto zákony škálovania sa stali teoretickým základom pre stratégiu 'väčšie je lepšie', ktorá dominuje vývoju LLM dodnes.

škálovacie zákony openai kaplan výkon modelov výpočtový výkon

2019 (1 udalostí)

Vydanie

GPT-2 - model 'príliš nebezpečný na zverejnenie'

OpenAI vydalo GPT-2 s 1,5 miliardou parametrov, ktorý dokázal generovať pozoruhodne koherentný text. OpenAI pôvodne odmietlo zverejniť plnú verziu modelu s odôvodnením, že je 'príliš nebezpečný' kvôli potenciálu na tvorbu dezinformácií. Toto rozhodnutie vyvolalo intenzívnu debatu o zodpovednom zverejňovaní AI výskumu a stal sa prvým veľkým prípadom 'AI bezpečnostnej' kontroverzie.

gpt-2 openai bezpečnosť ai generovanie textu kontroverzia

2018 (3 udalostí)

Vydanie

BERT - revolúcia v porozumení jazyku od Google

Google vydal BERT (Bidirectional Encoder Representations from Transformers), model, ktorý sa učil porozumeniu jazyku obojsmerne - z ľavého aj pravého kontextu súčasne. BERT dominoval na takmer všetkých NLP benchmarkoch a bol integrovaný do Google vyhľadávania, čo výrazne zlepšilo kvalitu výsledkov. Model zásadne zmenil prístup k úlohám porozumenia textu a stal sa jedným z najcitovanejších AI článkov vôbec.

bert google nlp obojsmerný encoder transformer
Vydanie

GPT-1 - prvý generatívny predtrénovaný transformer

OpenAI vydalo GPT-1 (Generative Pre-trained Transformer) so 117 miliónmi parametrov, ktorý ukázal silu predtrénovania jazykového modelu na veľkom množstve textu s následným dolaďovaním na špecifické úlohy. Model dosiahol state-of-the-art výsledky na viacerých NLP benchmarkoch. GPT-1 položil základ pre celú rodinu GPT modelov, ktoré neskôr zmenili svet.

gpt-1 openai transformer predtrénovanie jazykový model
Výskum

ELMo - Embeddings from Language Models

Výskumníci z Allen Institute predstavili ELMo, prvý model využívajúci kontextualizované word embeddings. Na rozdiel od statických word2vec embeddings dokázal ELMo generovať reprezentácie slov závislé od kontextu vety, čo výrazne zlepšilo výsledky v NLP úlohách.

embeddings nlp kontextualizácia

2017 (1 udalostí)

Výskum

Attention Is All You Need

Vaswani et al. z Google Brain publikovali prelomový článok predstavujúci architektúru Transformer. Tento mechanizmus pozornosti (attention) sa stal základom pre všetky moderné veľké jazykové modely a nahradil dovtedy dominujúce rekurentné neuronové siete.

transformer google architektura attention

2016 (1 udalostí)

Výskum

AlphaGo poráža Lee Sedola v hre Go

Systém AlphaGo od Google DeepMind porazil profesionálneho hráča Go Lee Sedola 4:1 v historickom zápase v Soule. Hra Go bola považovaná za poslednú bastion ľudskej intelektuálnej nadradenosti nad strojmi kvôli obrovskému počtu možných ťahov. Víťazstvo AlphaGo bolo považované za prelomový moment v histórii AI, ktorý prišiel o desaťročia skôr, ako odborníci predpovedali.

alphago deepmind go lee sedol posilňovacie učenie

2015 (1 udalostí)

Priemysel

Založenie OpenAI

Sam Altman, Elon Musk, Ilya Sutskever a ďalší zakladatelia založili OpenAI ako neziskovú výskumnú organizáciu s cieľom vyvíjať bezpečnú umelú inteligenciu prospešnú pre celé ľudstvo. Organizácia bola založená s počiatočným príslibom financovania vo výške 1 miliardy dolárov. OpenAI sa neskôr transformovalo na hybridnú štruktúru a stalo sa jednou z najvplyvnejších AI spoločností na svete, stojacou za GPT sériou a ChatGPT.

openai altman musk sutskever založenie neziskovka

2014 (3 udalostí)

Výskum

Mechanizmus pozornosti (Attention) - Bahdanau

Dzmitry Bahdanau, Kyunghyun Cho a Yoshua Bengio predstavili mechanizmus pozornosti (attention mechanism) pre neurónový strojový preklad. Namiesto kompresie celej vstupnej vety do jedného vektora umožnil model dynamicky sa 'pozerať' na relevantné časti vstupu pri generovaní každého výstupného slova. Tento mechanizmus sa stal kľúčovým stavebným prvkom architektúry Transformer a všetkých moderných jazykových modelov.

attention bahdanau mechanizmus pozornosti strojový preklad transformer základ
Výskum

Seq2Seq - sekvencia na sekvenciu pre strojový preklad

Ilya Sutskever, Oriol Vinyals a Quoc Le z Google publikovali architektúru Sequence to Sequence (Seq2Seq) využívajúcu LSTM siete pre strojový preklad. Model používal enkóder na zakódovanie vstupnej vety a dekóder na generovanie prekladu, čím vytvoril nový paradigmatický prístup k NLP úlohám. Seq2Seq architektúra sa stala základom pre chatboty, sumarizáciu textu a mnohé ďalšie aplikácie.

seq2seq sutskever strojový preklad lstm enkóder-dekóder
Výskum

Generatívne adversariálne siete (GAN)

Ian Goodfellow a kol. predstavili koncept generatívnych adversariálnych sietí (GAN), kde dve neurónové siete - generátor a diskriminátor - súťažia proti sebe v procese učenia. GAN sa stal jedným z najvplyvnejších nápadov v histórii hlbokého učenia a umožnil generovanie realistických obrázkov, videí a ďalšieho obsahu. Yann LeCun označil GAN za 'najzaujímavejší nápad v strojovom učení za posledných 20 rokov'.

gan goodfellow generatívne modely adversariálne učenie

2013 (1 udalostí)

Výskum

Word2Vec - revolúcia v reprezentácii slov

Tomas Mikolov a kol. v Google publikovali Word2Vec, efektívnu metódu na vytváranie vektorových reprezentácií slov (word embeddings). Word2Vec ukázal fascinujúce vlastnosti, napríklad že vektorová aritmetika zachytáva sémantické vzťahy: 'kráľ - muž + žena = kráľovná'. Tento prístup zásadne zmenil spracovanie prirodzeného jazyka a stal sa základom pre neskoršie jazykové modely.

word2vec mikolov embeddingy nlp google

2012 (1 udalostí)

Výskum

AlexNet - prelom v hlbokom učení na ImageNet

Alex Krizhevsky, Ilya Sutskever a Geoffrey Hinton vyhral súťaž ImageNet s konvolučnou neurónovou sieťou AlexNet, ktorá dramaticky znížila chybovosť z 26% na 15,3%. Tento výsledok prekvapil celú komunitu počítačového videnia a dokázal, že hlboké neurónové siete trénované na GPU môžu výrazne prekonať tradičné metódy. AlexNet odštartoval revolúciu hlbokého učenia v praxi.

alexnet imagenet hlboké učenie počítačové videnie gpu

2011 (1 udalostí)

Priemysel

IBM Watson víťazí v Jeopardy!

Systém IBM Watson porazil dvoch najúspešnejších súťažiacich v histórii televíznej vedomostnej súťaže Jeopardy! - Kena Jenningsa a Brada Ruttera. Watson dokázal porozumieť otázkam v prirodzenom jazyku, spracovať ich a nájsť správne odpovede z obrovského množstva dát. Tento úspech ukázal potenciál AI v spracovaní prirodzeného jazyka a stal sa dôležitým míľnikom pre komerčné využitie AI.

watson ibm jeopardy nlp otázky a odpovede

2009 (1 udalostí)

Výskum

ImageNet - 14 miliónov obrázkov pre výskum AI

Fei-Fei Li a jej tím na Stanforde spustili databázu ImageNet obsahujúcu viac ako 14 miliónov anotovaných obrázkov v tisíckach kategórií. ImageNet sa stal štandardným benchmarkom pre hodnotenie modelov počítačového videnia. Súťaž ImageNet Large Scale Visual Recognition Challenge (ILSVRC) sa stala kľúčovým motorom pokroku v rozpoznávaní obrazu a hlbokom učení.

imagenet fei-fei li dataset počítačové videnie benchmark

2006 (1 udalostí)

Výskum

Hlboké učenie - Hintonova renesancia neurónových sietí

Geoffrey Hinton a kol. publikovali prácu o hlbokých sieťach viery (deep belief networks), v ktorej ukázali efektívny spôsob trénovania hlbokých neurónových sietí pomocou predtrénovania po vrstvách. Tento prielom oživil záujem o neurónové siete po desaťročiach skepticizmu a odštartoval éru hlbokého učenia (deep learning). Hinton je dodnes považovaný za 'krstného otca hlbokého učenia'.

hinton hlboké učenie deep belief networks predtrénovanie renesancia ai

2003 (1 udalostí)

Výskum

Neurónové jazykové modely - Bengiov prelomový článok

Yoshua Bengio a kol. publikovali článok 'A Neural Probabilistic Language Model', ktorý predstavil koncept neurónových jazykových modelov a slovných embeddingov. Tento prístup nahradil tradičné štatistické n-gramové modely neurónovými sieťami, ktoré dokázali zachytiť sémantické vzťahy medzi slovami. Článok je považovaný za základ pre všetky moderné jazykové modely vrátane GPT a BERT.

bengio jazykový model embeddingy nlp neurónové siete

1998 (1 udalostí)

Výskum

LeNet-5 - konvolučná sieť na rozpoznávanie číslic

Yann LeCun vyvinul konvolučnú neurónovú sieť LeNet-5, ktorá dosiahla výnimočnú presnosť pri rozpoznávaní ručne písaných číslic. Sieť bola nasadená v praxi na spracovanie šekov v amerických bankách. LeNet-5 demonštroval praktickú použiteľnosť hlbokých neurónových sietí a stal sa základom pre moderné konvolučné siete.

lenet lecun konvolučné siete rozpoznávanie obrazu cnn

1997 (1 udalostí)

Priemysel

Deep Blue poráža Kasparova v šachu

Superpočítač IBM Deep Blue porazil úradujúceho majstra sveta v šachu Garriho Kasparova v šesťzápasovom súboji skóre 3,5:2,5. Bola to prvýkrát v histórii, čo stroj porazil svetového šampióna v šachu za štandardných turnajových podmienok. Táto udalosť sa stala symbolom pokroku AI a vyvolala celosvetovú diskusiu o budúcnosti umelej inteligencie.

deep blue ibm kasparov šach míľnik ai

1986 (1 udalostí)

Výskum

Backpropagation - algoritmus spätného šírenia chyby

David Rumelhart, Geoffrey Hinton a Ronald Williams publikovali článok o algoritme spätného šírenia chyby (backpropagation) v časopise Nature. Tento algoritmus umožnil efektívne trénovanie viacvrstvových neurónových sietí a vyriešil problém, ktorý blokoval pokrok od éry perceptrónov. Backpropagation sa stal základným algoritmom hlbokého učenia používaným dodnes.

backpropagation hinton rumelhart neurónové siete trénovanie

1969 (1 udalostí)

Výskum

Kniha Perceptrons - spúšťač prvej zimy AI

Marvin Minsky a Seymour Papert publikovali knihu 'Perceptrons', v ktorej matematicky dokázali obmedzenia jednovrstvových perceptrónov, najmä ich neschopnosť riešiť problém XOR. Kniha výrazne znížila nadšenie aj financovanie výskumu neurónových sietí. Následovalo obdobie známe ako 'prvá zima AI', ktoré trvalo takmer dve desaťročia.

perceptrons minsky papert ai zima neurónové siete

1957 (1 udalostí)

Výskum

Perceptrón - prvý neurónový model

Frank Rosenblatt na Cornell University vytvoril Perceptrón, prvý umelý neurónový model schopný učenia. Perceptrón dokázal klasifikovať jednoduché vzory a bol implementovaný na hardvéri Mark I Perceptron. Tento vynález položil základy pre celú oblasť neurónových sietí a strojového učenia.

perceptrón rosenblatt neurónové siete základy ai

1956 (1 udalostí)

Výskum

Dartmouthská konferencia - zrod umelej inteligencie

Na Dartmouth College sa uskutočnila letná konferencia, ktorú organizovali John McCarthy, Marvin Minsky, Nathaniel Rochester a Claude Shannon. Na tomto stretnutí bol po prvýkrát oficiálne použitý termín 'umelá inteligencia' a boli stanovené základné ciele a smery výskumu. Konferencia je považovaná za oficiálny zrod AI ako samostatného vedného odboru.

dartmouth vznik ai mccarthy minsky história ai

1950 (1 udalostí)

Výskum

Turingov test - Computing Machinery and Intelligence

Alan Turing publikoval prelomový článok 'Computing Machinery and Intelligence' v časopise Mind, v ktorom navrhol tzv. Turingov test ako spôsob hodnotenia inteligencie strojov. Položil si zásadnú otázku 'Môžu stroje myslieť?' a definoval rámec, ktorý ovplyvňuje výskum umelej inteligencie dodnes. Tento článok sa považuje za jeden zo zakladajúcich textov odboru umelej inteligencie.

turing turingov test filozofia ai základy ai