Kasutaja:XDLUL/Regulaaravaldis

Allikas: Vikipeedia
Jump to navigation Jump to search

Regulaaravaldis (inglise keeles regular expression, lühendatult regexp, regex või RE) on sümbolite jada, mis defineerivad ostingu mustri (inglise keeles pattern). Peamiselt kasutatakse seda mustrit teksti osade otsimiseks ja asendamiseks.

Regulaaravaldise mustrid koosnevad literaalsetest ja metasümbolitest. Literaalsed sümbolid esinevad vaatlusaluses tekstis esitatud kujul ehk nad tähistavad iseennast. Metasümbolid ([, ], \, /, ^, $, ., |, ?, *, +, (, ), { ja }) tähistavad mingit kindlat seaduspärasust.

Süntaks[muuda | muuda lähteteksti]

Metasümbolid[muuda | muuda lähteteksti]

Varjestamine[muuda | muuda lähteteksti]

\ sümboli eesliitmine metasümbolile muudab metasümboli literaalseks.

Disjunktsioon[muuda | muuda lähteteksti]

| tähistab kahe mustri disjunktsiooni. Näiteks A|B, kus A ja B on mustrid, tähistab kas A-d või B-d.

Klassid[muuda | muuda lähteteksti]

Metasümbol(id) Tähendus
. Tähistab igat sümbolit peale reavahetuse sümbolit.
[…] Tähistab kõiki sümboleid, mis on on sulgude vahel.
[^…] Tähistab kõiki sümboleid, mis pole sulgude vahel.

Kvantorid[muuda | muuda lähteteksti]

Metasümbol(id) Tähendus
* Eelnev muster esineb suvaline arv (seal hulgas 0) kordi.
+ Eelnev muster esineb vähemalt üks kord (0 või 1).
? Eelnev muster esineb null või üks korda.
{n,m} Eelnev muster esineb vähemalt n ja ülimalt m korda.
{n,} Eelnev muster esineb vähemalt n korda.
{,m} Eelnev muster esineb ülimalt m korda.
{n} Eelnev muster esineb täpselt n korda.

Positsioon[muuda | muuda lähteteksti]

Metasümbol(id) Tähendus
^ Tähistab sõne algust.
$ Tähistab sõne lõppu