Regex: Unterschied zwischen den Versionen
Aus UUGRN
K (→Quantifizierer) |
Rabe (Diskussion | Beiträge) K (Markup. FIXME: Detailinfos zu verschiedenen Systemen.) |
||
Zeile 1: | Zeile 1: | ||
− | ==Regular Expressions (aka regex)== | + | == Regular Expressions (aka regex) == |
− | mit | + | mit '''Regular Expressions''' ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen. |
− | + | {{FIXME|Verschiedene Ausprägungen, Dialekte und ''Maschinentypen''}} | |
− | |||
− | i: Unterscheidet nicht zwischen Groß- und Kleinschreibung | + | === Optionen === |
+ | * g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt | ||
+ | * i: Unterscheidet nicht zwischen Groß- und Kleinschreibung | ||
+ | * s: Sucht über das Zeilenende hinweg | ||
+ | * m: \n wird als Zeilenende erkannt | ||
− | s: | + | === Zeichengruppe === |
+ | * (a|b|c) : alternative Zeichenfolgen an einer Stelle im Wort / Satz | ||
+ | * (a|b|) : s.o. + kein Zeichen | ||
+ | * [a-e] : alternative Zeichen a,b,c,d,e | ||
+ | * [abc(] : alternative Zeichen a,b,c,( | ||
+ | * [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist | ||
+ | * \d : = [0-9] | ||
+ | * \D : = [^0-9] | ||
+ | * \s : = [\t\f\r\n] | ||
+ | * \S : = [^\t\f\r\n] | ||
+ | * \w : = [A-Za-z0-9_] | ||
+ | * \W : = [^A-Za-z0-9_] | ||
+ | * . : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen | ||
− | + | === Quantifizierer === | |
+ | * {a,b}: mindestens a - maximal b Wiederholungen | ||
+ | * {a,} : mindestens a Wiederholungen | ||
+ | * {a} : genau a Wiederholungen | ||
+ | * ? : = {0,1} | ||
+ | * <nowiki>*</nowiki> : = {0,} | ||
+ | * + : = {1,} | ||
− | === | + | === Anker === |
− | + | * \b: Wortgrenze | |
+ | * \B: Nichtwortgrenze | ||
+ | * \A: Anfang des Strings | ||
+ | * ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt | ||
+ | * \Z: Ende des Strings | ||
+ | * $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt | ||
− | |||
− | + | == Weblinks == | |
+ | * {{Wikipedia}} | ||
− | [ | + | [[Kategorie:Programmiersprache]] |
− | + | <!-- auch wenn es selbst keine eigenständige Sprache ist, ist es ein universelles Hilfsmittel in vielen Programmiersprachen --> | |
− | [ | ||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− | |||
− |
Version vom 28. Juli 2007, 22:39 Uhr
Regular Expressions (aka regex)
mit Regular Expressions ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.
FIXME: Verschiedene Ausprägungen, Dialekte und Maschinentypen (siehe Diskussionsseite)
Optionen
- g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
- i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
- s: Sucht über das Zeilenende hinweg
- m: \n wird als Zeilenende erkannt
Zeichengruppe
- (a|b|c) : alternative Zeichenfolgen an einer Stelle im Wort / Satz
- (a|b|) : s.o. + kein Zeichen
- [a-e] : alternative Zeichen a,b,c,d,e
- [abc(] : alternative Zeichen a,b,c,(
- [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
- \d : = [0-9]
- \D : = [^0-9]
- \s : = [\t\f\r\n]
- \S : = [^\t\f\r\n]
- \w : = [A-Za-z0-9_]
- \W : = [^A-Za-z0-9_]
- . : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen
Quantifizierer
- {a,b}: mindestens a - maximal b Wiederholungen
- {a,} : mindestens a Wiederholungen
- {a} : genau a Wiederholungen
- ? : = {0,1}
- * : = {0,}
- + : = {1,}
Anker
- \b: Wortgrenze
- \B: Nichtwortgrenze
- \A: Anfang des Strings
- ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
- \Z: Ende des Strings
- $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt