Prejst na obsah
Technický sprievodca

Ako fungujú AI modely

Od textu na vstupe po inteligentnú odpoveď na výstupe. Vysvetlíme krok za krokom, ako jazykové modely fungujú, ako sa trénujú a ako ich nasadiť v praxi.

Čo je veľký jazykový model (LLM)

Veľký jazykový model je neurónová sieť natrénovaná na obrovskom množstve textu — knihy, webové stránky, vedecké články, kód. Počas tréningu sa model naučí vzory a súvislosti medzi slovami, vetami a konceptmi.

Výsledkom je systém, ktorý dokáže porozumieť otázke v prirodzenom jazyku a vygenerovať relevantnú, koherentnú odpoveď. Nejde o jednoduché vyhľadávanie — model skutočne „rozumie" kontextu a dokáže tvoriť nový obsah.

Moderné modely ako Claude Opus 4.6 majú stovky miliárd parametrov (naučených váh) a dokážu spracovať až 1 milión tokenov kontextu — to je ekvivalent celej technickej dokumentácie alebo tisícov strán textu.

Škála modelov

Qwen 3 8B 8 mld. parametrov
Llama 4 Scout 17 mld. parametrov
Llama 4 Maverick 109 mld. aktívnych
Claude Opus 4.6 ~300+ mld. parametrov
Llama 3.1 405B 405 mld. parametrov

Viac parametrov = viac naučených vzťahov = lepšie výsledky, ale aj vyššie nároky na hardware.

Architektúra Transformer

Základ všetkých moderných jazykových modelov — mechanizmus pozornosti (attention).

1

Tokenizácia

Text sa rozdelí na tokeny (podslová). „Programovanie" → „Program" + „ovanie"

2

Embedding

Každý token sa prevedie na číselný vektor (napr. 4096 čísel), ktorý zachytáva jeho význam

3

Attention vrstvy

Jadro Transformera. Každý token „sleduje" ostatné tokeny a učí sa kontextové vzťahy

4

Generovanie

Model predpovedá najlepší ďalší token. Proces sa opakuje, kým nevznikne kompletná odpoveď

Self-Attention: Kľúč k porozumeniu

Mechanizmus self-attention umožňuje modelu „pozerať sa" na všetky ostatné slová v texte pri spracovávaní každého slova. Takto model vie, že v texte „banka rieky" sa slovo „banka" vzťahuje na breh, nie na finančnú inštitúciu.

Query

„Na čo sa pýtam?"

Key

„Čo ponúkam?"

Value

„Aká je moja informácia?"

Každé slovo generuje trojicu Q, K, V. Query sa porovná so všetkými Keys — výsledné skóre určí, koľko pozornosti dostane každá Value.

Ako sa modely trénuj��

Od surových dát po inteligentného asistenta — tri fázy tréningu.

Fáza 1

Pre-training

Model číta bilióny tokenov textu a učí sa predpovedať nasledujúce slovo. Získava všeobecné znalosti o jazyku, svete a logike.

Bilióny tokenov textu
Tisíce GPU, týždne/mesiace
Milióny dolárov za výpočty
Fáza 2

RLHF / Constitutional AI

Ľudskí hodnotitelia porovnávajú odpovede modelu. Model sa učí generovať odpovede, ktoré sú nápomocné, pravdivé a bezpečné.

Ľudská spätná väzba
Porovnávanie odpovedí (A vs B)
Zarovnanie s hodnotami
F��za 3

Bezpečnostné testy

Red-teaming, testovanie hraníc, hodnotenie biasov. Model sa testuje na tisícoch scenárov pred nasadením.

Red-team testovanie
Benchmarky (MMLU, HumanEval)
Bezpečnostné audity

RAG — Retrieval Augmented Generation

Ako spojiť AI model s vašimi firemnými dátami bez pretréningu.

Otázka

„Aké sú podmienky zmluvy XY?"

Vektorová DB

Sémantické vyhľadanie relevantných dokumentov

LLM + Kontext

Model odpovie na základe nájdených dokumentov

Prečo RAG a nie fine-tuning?

RAG (odporúčané pre väčšinu)
  • + Okamžitá aktualizácia znalostí
  • + Žiadne náklady na pretréning
  • + Citácie zdrojov v odpovedi
  • + Funguje s akýmkoľvek modelom
Fine-tuning (špecifické prípady)
  • + Zmena štýlu a formátu výstupu
  • + Špecializovaná terminol��gia
  • Vyžaduje tréningové dáta
  • Nákladné a časovo náročné

Nasadenie: Cloud vs On-premise

Porovnanie dvoch prístupov — a prečo sa ich oplatí kombinovať.

Cloud API

Najvýkonnejšie modely (Claude Opus, Sonnet)
Žiadne nároky na vlastný hardware
Okamžitý prístup k novým modelom
Škálovateľnosť podľa potreby
!Dáta opúšťajú vašu infraštruktúru
!Náklady rastú s využitím
Ideálne pre: Komplexné analýzy, dlhý kontext, multimodálne úlohy, reasoning

On-premise

Plná kontrola nad dátami (GDPR)
Fixné náklady — bez per-token poplatkov
Fungovanie bez internetového pripojenia
Žiadny vendor lock-in (open source)
!Vyžaduje vlastný hardware (GPU/CPU)
!Menšie modely = nižší výkon na zložitých úlohách
Ideálne pre: Citlivé dáta, vysoký objem, klasifikácia, embeddingy, STT

Hybridný prístup = najlepšie z oboch svetov

Orchestračná vrstva automaticky smeruje požiadavky na optimálny model podľa citlivosti dát, zložitosti úlohy a požadovaného výkonu. Citlivé dáta nikdy neopustia váš server. Komplexné úlohy rieši cloud.

Tokenová ekonomika

Čo sú tokeny a koľko stojí spracovanie textu.

~0.75
tokenu za slovo (EN)
~1.2
tokenu za slovo (SK)
1M
= cca 700K slov
E-mail (300 slov) ~400 tokenov = $0.006
Zmluva (10 strán) ~8 000 tokenov = $0.12
Technická dokumentácia (100 strán) ~80 000 tokenov = $1.20
Celý kódový repozitár ~500 000 tokenov = $7.50

* Ceny pre Claude Opus 4.6 (vstupné tokeny $15/1M). On-premise modely majú nulové per-token náklady — platíte len za hardware.

Chcete vedieť viac?

Pozrite si naše ďalšie stránky o bezpečnosti AI, integračných možnostiach pre firmy a katalóg modelov.