technike. Tieto dve teórie sa zaoberajú modelmi a ich formálnymi
popismi a zaradením formálnych jazykov. V 50-tých rokoch matematik
Stephen Cole Kleene popísal tieto modely za použitia matematických
notácií nazývaných regulárny zoznam. V 60-tých rokoch sa začal
vývoj použitia regulárnych výrazov v standardoch struktúrovaných
dokumentov a pre databázové modelovanie, ktoré expandovalo v rokoch
80-tych. Napr. SNOBOL bol jazyk, ktorý sa zaoberal porovnávaním
reťazcov so vzorom, ale nebol identický s regulárnymi výrazmi. Ken
Thompson vytvoril Kleenyho verziu vyhľadávania v textových súboroch
implementovanú do editora QED. Neskôr sa táto editácia pridala do
editora ed, čo časom viedlo k vzniku populárneho unixovského príkazu
vyhľadávania grep, ktorý priamo využíva regulárne výrazy. Slovo
grep je priamo odvodený od príkazu používaného v editore ed, kde re
(gREp Regular Expression) znamená regulárny výraz. Od toho času mnoho
obmenených verzií Thompsonovej originálnej adaptácie regulárnych
výrazov sa často používa v Unixe a v unix využívajúcich
aplikáciách ako expr, AWK, Emacs, vi a lex.
Perl a Tcl regulárne výrazy sú odvodené z regex knižnice napísanej
Henry Spencerom, neskôr Philip Hazel vyvinul PCRE (Perl Compatible
Regular Expressions) regulárne výrazy kompatibilné s Perlom, čo
viedlo k vývoju regulárnych výrazov v ich dnesnej podobe, ktoré dnes
využíva mnoho moderných jazykov ako PHP, C# alebo Apache HTTP Server.
Obsah
Zoznam obrázkov
Zoznam obrázkov
Chyba! Nenasli sa žiadne položky zoznamu obrázkov.
Zoznam tabuliek
Chyba! Nenasli sa žiadne položky zoznamu obrázkov.
Úvod
Regulárny výraz (skrátene regexp, regex či iba RE podľa anglického
regular expression) je reťazec popisujúci celú množinu reťazcov,
konkrétne regulárny jazyk.
Regulárne výrazy sa najčastejsie používajú v počítačových
programoch a skriptovacích jazykoch pre vyhľadávanie a úpravu textu. V
prípade, že užívateľ chce v texte vyhľadať nejaký reťazec, ktorý
nepozná presne, alebo ktorý môže mať viac variant, môže zadať
regulárny výraz, ktorý postihne vsetky chcené varianty. Program tak
nájde vsetky časti textu, ktoré danému výrazu odpovedajú. Regulárny
výraz sa skladá z literálov textu, ktoré sa majú zhodovať, a
speciálnych znakov, ktoré nie sú súčasťou hľadaného textu,
slúžiacich pre popis alternatív, množín, počtov výskytov a
prepínačov.
Obsah tohto dokumentu je vseobecná charakteristika regulárnych výrazov
v mnohých dnes populárnych jazykoch. Detailnejsie sa zaoberá
s Framework .NET, ktorý používa objektovo orientovaný jazyk C#.
Ďalej v jazyku C# popisuje podrobne menný priestor
System.Text.RegularExpressions. Menný priestor
System.Text.RegularExpressions obsahuje triedy, ktoré umožňujú
prístup k službám .NET Framework, ktoré pracujú s regulárnymi
výrazmi. Tento menný priestor umožňuje využívať regulárne výrazy
v plnej miere na vsetkých platformách a jazykoch, ktoré používajú
Microsoft .NET Framework. Vysvetľuje použitie daných tried a ich
vlastnosti. Ďalej obsahuje nastavenia regulárnych výrazov, ktoré sú
vyžívane buď osobitne ale je možné ich aj plne kombinovať.
Vysvetľuje ako sú v dnesnej dobe vyžívané regulárne výrazy, ako
napríklad pri validácii vstupných dát pomocou regulárnych výrazov,
vyhľadávaní vo vstupnom reťazci či dokumente, alebo pri nahradzovaní
textu iným textom za použití speciálnych tried a ich funkcií balíka
jazyka c#. Vsetky tri dané kategórie využitia regulárnych výrazov sú
aj ukázané na vseobecných príkladoch ale aj na programoch, ktoré
využívajú regulárne výrazy. Ďalej popisuje tieto programy ich
použitie a stručne popisuje ich ovládanie. V závere je celkové
vyhodnotenie práce, prognózy do budúcnosti pre regulárne výrazy
a ich využitie aj v budúcnosti.
* Formulácia úlohy
Text diplomovej práce môže obsahovať v rámci kapitoly 1 formuláciu
úlohy resp. úloh, riesených v práci. V tejto časti diplomant rozvedie
spôsob, akým budú riesené úlohy a tézy, formulované v zadaní
práce. Uvedie tiež prehľad podmienok riesenia. Ak formulácia úlohy
nie je potrebná, uvedie sa iný názov tejto kapitoly (Názov kapitoly 1)
podľa riesenej problematiky.
Prvá kapitola spravidla predstavuje teoreticko-metodologickú časť
práce. Táto časť zvyčajne obsahuje:
* teoretické poznatky vzťahujúce sa na danú úlohu (diplomat
prezentuje poznatky nadobudnuté stúdiom),
* charakteristiku metód a postupov, ktoré diplomant použil
pri riesení úlohy.
* Úvod do regulárnych výrazov
Úvod tejto práce je venovaný vseobecným definíciám,
charakteristikám a vlastnostiam regulárnych výrazov a ich uplatnení
v počítačových programoch a skriptovacích jazykoch.
Regulárny výraz (skrátene regexp, regex alebo RE podľa anglického
regular expression) je reťazec popisujúci celú množinu reťazcov,
konkrétne je to reťazec popisujúci regulárny jazyk. Regulárne výrazy
nachádzajú najčastejsie svoje uplatnenie v počítačových programoch
a skriptovacích jazykoch pre vyhľadávanie a úpravu textu.
V prípade, že používateľ chce v nejakom texte vyhľadať konkrétny
reťazec, pričom nevie jeho presnú syntax, alebo daný výraz môže
mať viacej variantov, môže zadať regulárny výraz, v ktorom zahrnie
vsetky možné varianty reťazca, ktorý chce vyhľadať. Po zadaní
regulárneho výrazu program prehľadá daný text a používateľovi
ponúkne časti textu, ktoré zodpovedajú danému reťazcu.
Každý regulárny výraz sa skladá z literálov textu, ktoré sa majú


































































Poslední komentáře
2 roky 11 týdnů zpět