Technický sprievodca

Ako fungujú AI modely

Od textu na vstupe po inteligentnú odpoveď na výstupe. Vysvetlíme krok za krokom, ako jazykové modely fungujú, ako sa trénujú a ako ich nasadiť v praxi.

Čo je veľký jazykový model (LLM)

Veľký jazykový model je neurónová sieť natrénovaná na obrovskom množstve textu — knihy, webové stránky, vedecké články, kód. Počas tréningu sa model naučí vzory a súvislosti medzi slovami, vetami a konceptmi.

Výsledkom je systém, ktorý dokáže porozumieť otázke v prirodzenom jazyku a vygenerovať relevantnú, koherentnú odpoveď. Nejde o jednoduché vyhľadávanie — model skutočne „rozumie" kontextu a dokáže tvoriť nový obsah.

Moderné modely ako Claude Opus 4.8 majú stovky miliárd parametrov (naučených váh) a dokážu spracovať až 1 milión tokenov kontextu — to je ekvivalent celej technickej dokumentácie alebo tisícov strán textu.

Škála modelov

Qwen 3 8B 8 mld. parametrov

Llama 4 Scout 17 mld. parametrov

Llama 4 Maverick 109 mld. aktívnych

Claude Opus 4.8 ~300+ mld. parametrov

Llama 3.1 405B 405 mld. parametrov

Viac parametrov = viac naučených vzťahov = lepšie výsledky, ale aj vyššie nároky na hardware.

Architektúra Transformer

Základ všetkých moderných jazykových modelov — mechanizmus pozornosti (attention).

Tokenizácia

Text sa rozdelí na tokeny (podslová). „Programovanie" → „Program" + „ovanie"

Embedding

Každý token sa prevedie na číselný vektor (napr. 4096 čísel), ktorý zachytáva jeho význam

Attention vrstvy

Jadro Transformera. Každý token „sleduje" ostatné tokeny a učí sa kontextové vzťahy

Generovanie

Model predpovedá najlepší ďalší token. Proces sa opakuje, kým nevznikne kompletná odpoveď

Self-Attention: Kľúč k porozumeniu

Mechanizmus self-attention umožňuje modelu „pozerať sa" na všetky ostatné slová v texte pri spracovávaní každého slova. Takto model vie, že v texte „banka rieky" sa slovo „banka" vzťahuje na breh, nie na finančnú inštitúciu.

Query

„Na čo sa pýtam?"

Key

„Čo ponúkam?"

Value

„Aká je moja informácia?"

Každé slovo generuje trojicu Q, K, V. Query sa porovná so všetkými Keys — výsledné skóre určí, koľko pozornosti dostane každá Value.

Ako sa modely trénuj��

Od surových dát po inteligentného asistenta — tri fázy tréningu.

Fáza 1

Pre-training

Model číta bilióny tokenov textu a učí sa predpovedať nasledujúce slovo. Získava všeobecné znalosti o jazyku, svete a logike.

• Bilióny tokenov textu

• Tisíce GPU, týždne/mesiace

• Milióny dolárov za výpočty

Fáza 2

RLHF / Constitutional AI

Ľudskí hodnotitelia porovnávajú odpovede modelu. Model sa učí generovať odpovede, ktoré sú nápomocné, pravdivé a bezpečné.

• Ľudská spätná väzba

• Porovnávanie odpovedí (A vs B)

• Zarovnanie s hodnotami

F��za 3

Bezpečnostné testy

Red-teaming, testovanie hraníc, hodnotenie biasov. Model sa testuje na tisícoch scenárov pred nasadením.

• Red-team testovanie

• Benchmarky (MMLU, HumanEval)

• Bezpečnostné audity

RAG — Retrieval Augmented Generation

Ako spojiť AI model s vašimi firemnými dátami bez pretréningu.

Otázka

„Aké sú podmienky zmluvy XY?"

Vektorová DB

Sémantické vyhľadanie relevantných dokumentov

LLM + Kontext

Model odpovie na základe nájdených dokumentov

Prečo RAG a nie fine-tuning?

RAG (odporúčané pre väčšinu)

+ Okamžitá aktualizácia znalostí
+ Žiadne náklady na pretréning
+ Citácie zdrojov v odpovedi
+ Funguje s akýmkoľvek modelom

Fine-tuning (špecifické prípady)

+ Zmena štýlu a formátu výstupu
+ Špecializovaná terminol��gia
− Vyžaduje tréningové dáta
− Nákladné a časovo náročné

Nasadenie: Cloud vs On-premise

Porovnanie dvoch prístupov — a prečo sa ich oplatí kombinovať.

Cloud API

✓Najvýkonnejšie modely (Claude Opus, Sonnet)

✓Žiadne nároky na vlastný hardware

✓Okamžitý prístup k novým modelom

✓Škálovateľnosť podľa potreby

!Dáta opúšťajú vašu infraštruktúru

!Náklady rastú s využitím

Ideálne pre: Komplexné analýzy, dlhý kontext, multimodálne úlohy, reasoning

On-premise

✓Plná kontrola nad dátami (GDPR)

✓Fixné náklady — bez per-token poplatkov

✓Fungovanie bez internetového pripojenia

✓Žiadny vendor lock-in (open source)

!Vyžaduje vlastný hardware (GPU/CPU)

!Menšie modely = nižší výkon na zložitých úlohách

Ideálne pre: Citlivé dáta, vysoký objem, klasifikácia, embeddingy, STT

Hybridný prístup = najlepšie z oboch svetov

Orchestračná vrstva automaticky smeruje požiadavky na optimálny model podľa citlivosti dát, zložitosti úlohy a požadovaného výkonu. Citlivé dáta nikdy neopustia váš server. Komplexné úlohy rieši cloud.

Tokenová ekonomika

Čo sú tokeny a koľko stojí spracovanie textu.

~0.75

tokenu za slovo (EN)

~1.2

tokenu za slovo (SK)

= cca 700K slov

E-mail (300 slov) ~400 tokenov = $0.002

Zmluva (10 strán) ~8 000 tokenov = $0.04

Technická dokumentácia (100 strán) ~80 000 tokenov = $0.40

Celý kódový repozitár ~500 000 tokenov = $2.50

* Ceny pre Claude Opus 4.8 (vstupné tokeny $5/1M). On-premise modely majú nulové per-token náklady — platíte len za hardware.

Chcete vedieť viac?

Pozrite si naše ďalšie stránky o bezpečnosti AI, integračných možnostiach pre firmy a katalóg modelov.

Bezpečnosť AI AI pre firmy Katalóg modelov