Regex

Aus UUGRN

Regular Expressions (aka regex)

mit regular Expressions ist es möglich einen Text nach bestimmten Mustern zu durchsuchen und zu ersetzen.

Optionen

g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt

i: Unterscheidet nicht zwischen Groß- und Kleinschreibung

s: Sucht über das Zeilenende hinweg

m: \n wird als Zeilenende erkannt

Zeichengruppe

(a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz

(a|b|)  : s.o. + kein Zeichen

[a-e]  : alternative Zeichen a,b,c,d,e

[abc(]  : alternative Zeichen a,b,c,(

[^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist

\d  : = [0-9]

\D  : = [^0-9]

\s  : = [\t\f\r\n]

\S  : = [^\t\f\r\n]

\w  : = [A-Za-z0-9_]

\W  : = [^A-Za-z0-9_]

.  : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen

Quantifizierer

{a,b}: mindestens a - maximal b Wiederholungen

{a,} : mindestens a Wiederholungen

{a}  : genau a Wiederholungen

?  : = {0,1}

*  : = {0,}

+  : = {1,}

Anker

\b: Wortgrenze

\B: Nichtwortgrenze

\A: Anfang des Strings

^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt

\Z: Ende des Strings

$ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt