Regex: Unterschied zwischen den Versionen

Aus UUGRN
K (Markup. FIXME: Detailinfos zu verschiedenen Systemen.)
Zeile 1: Zeile 1:
==Regular Expressions (aka regex)==
== Regular Expressions (aka regex) ==
mit regular Expressions ist es möglich einen Text nach bestimmten Mustern zu durchsuchen und zu ersetzen.
mit '''Regular Expressions''' ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.


===Optionen===
{{FIXME|Verschiedene Ausprägungen, Dialekte und ''Maschinentypen''}}
g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt


i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
=== Optionen ===
* g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
* i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
* s: Sucht über das Zeilenende hinweg
* m: \n wird als Zeilenende erkannt


s: Sucht über das Zeilenende hinweg
=== Zeichengruppe ===
* (a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
* (a|b|)  : s.o. + kein Zeichen
* [a-e]    : alternative Zeichen a,b,c,d,e
* [abc(]  : alternative Zeichen a,b,c,(
* [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
* \d      : = [0-9]
* \D      : = [^0-9]
* \s      : = [\t\f\r\n]
* \S      : = [^\t\f\r\n]
* \w      : = [A-Za-z0-9_]
* \W      : = [^A-Za-z0-9_]
* .        : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen


m: \n wird als Zeilenende erkannt
=== Quantifizierer ===
* {a,b}: mindestens a - maximal b Wiederholungen
* {a,} : mindestens a Wiederholungen
* {a}  : genau a Wiederholungen
* ?    : = {0,1}
* <nowiki>*</nowiki>    : = {0,}
* +    : = {1,}


===Zeichengruppe===
=== Anker ===
(a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
* \b: Wortgrenze
* \B: Nichtwortgrenze
* \A: Anfang des Strings
* ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
* \Z: Ende des Strings
* $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt


(a|b|)  : s.o. + kein Zeichen


[a-e]    : alternative Zeichen a,b,c,d,e
== Weblinks ==
* {{Wikipedia}}


[abc(]  : alternative Zeichen a,b,c,(
[[Kategorie:Programmiersprache]]  
 
<!-- auch wenn es selbst keine eigenständige Sprache ist, ist es ein universelles Hilfsmittel in vielen Programmiersprachen -->
[^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
 
\d      : = [0-9]
 
\D      : = [^0-9]
 
\s      : = [\t\f\r\n]
 
\S      : = [^\t\f\r\n]
 
\w      : = [A-Za-z0-9_]
 
\W      : = [^A-Za-z0-9_]
 
.        : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen
 
===Quantifizierer===
{a,b}: mindestens a - maximal b Wiederholungen
 
{a,} : mindestens a Wiederholungen
 
{a}  : genau a Wiederholungen
 
?    : = {0,1}
 
<nowiki>*</nowiki>   : = {0,}
 
+    : = {1,}
 
===Anker===
\b: Wortgrenze
 
\B: Nichtwortgrenze
 
\A: Anfang des Strings
 
^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
 
\Z: Ende des Strings
 
$ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt

Version vom 28. Juli 2007, 22:39 Uhr

Regular Expressions (aka regex)

mit Regular Expressions ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.

FIXME: Verschiedene Ausprägungen, Dialekte und Maschinentypen (siehe Diskussionsseite)


Optionen

  • g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
  • i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
  • s: Sucht über das Zeilenende hinweg
  • m: \n wird als Zeilenende erkannt

Zeichengruppe

  • (a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
  • (a|b|)  : s.o. + kein Zeichen
  • [a-e]  : alternative Zeichen a,b,c,d,e
  • [abc(]  : alternative Zeichen a,b,c,(
  • [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
  • \d  : = [0-9]
  • \D  : = [^0-9]
  • \s  : = [\t\f\r\n]
  • \S  : = [^\t\f\r\n]
  • \w  : = [A-Za-z0-9_]
  • \W  : = [^A-Za-z0-9_]
  • .  : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen

Quantifizierer

  • {a,b}: mindestens a - maximal b Wiederholungen
  • {a,} : mindestens a Wiederholungen
  • {a}  : genau a Wiederholungen
  • ?  : = {0,1}
  • *  : = {0,}
  • +  : = {1,}

Anker

  • \b: Wortgrenze
  • \B: Nichtwortgrenze
  • \A: Anfang des Strings
  • ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
  • \Z: Ende des Strings
  • $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt


Weblinks