Regex: Unterschied zwischen den Versionen

Aus UUGRN
K (→‎Quantifizierer: makeup fix)
K (→‎Weblinks: FreeBSD manpages)
 
(2 dazwischenliegende Versionen von 2 Benutzern werden nicht angezeigt)
Zeile 1: Zeile 1:
==Regular Expressions (aka regex)==
+
== Regular Expressions (aka regex) ==
mit regular Expressions ist es möglich einen Text nach bestimmten Mustern zu durchsuchen und zu ersetzen.
+
mit '''Regular Expressions''' ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.
  
===Optionen===
+
{{FIXME|Verschiedene Ausprägungen, Dialekte und ''Maschinentypen''}}
g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
 
  
i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
+
=== Optionen ===
 +
* g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
 +
* i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
 +
* s: Sucht über das Zeilenende hinweg
 +
* m: \n wird als Zeilenende erkannt
  
s: Sucht über das Zeilenende hinweg
+
=== Zeichengruppe ===
 +
* (a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
 +
* (a|b|)  : s.o. + kein Zeichen
 +
* [a-e]    : alternative Zeichen a,b,c,d,e
 +
* [abc(]  : alternative Zeichen a,b,c,(
 +
* [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
 +
* \d      : = [0-9]
 +
* \D      : = [^0-9]
 +
* \s      : = [\t\f\r\n]
 +
* \S      : = [^\t\f\r\n]
 +
* \w      : = [A-Za-z0-9_]
 +
* \W      : = [^A-Za-z0-9_]
 +
* .        : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen
  
m: \n wird als Zeilenende erkannt
+
=== Quantifizierer ===
 +
* {a,b}: mindestens a - maximal b Wiederholungen
 +
* {a,} : mindestens a Wiederholungen
 +
* {a}  : genau a Wiederholungen
 +
* ?    : = {0,1}
 +
* <nowiki>*</nowiki>    : = {0,}
 +
* +    : = {1,}
  
===Zeichengruppe===
+
=== Anker ===
(a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
+
* \b: Wortgrenze
 +
* \B: Nichtwortgrenze
 +
* \A: Anfang des Strings
 +
* ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
 +
* \Z: Ende des Strings
 +
* $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt
  
(a|b|)  : s.o. + kein Zeichen
 
  
[a-e]    : alternative Zeichen a,b,c,d,e
+
== Weblinks ==
 +
* {{Wikipedia}}
 +
* {{man|freebsd|3|regex}}
 +
* {{man|freebsd|7|re_format}}
  
[abc(]  : alternative Zeichen a,b,c,(
 
  
[^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
+
[[Kategorie:Programmiersprache]]  
 
+
<!-- auch wenn es selbst keine eigenständige Sprache ist, ist es ein universelles Hilfsmittel in vielen Programmiersprachen -->
\d      : = [0-9]
 
 
 
\D      : = [^0-9]
 
 
 
\s      : = [\t\f\r\n]
 
 
 
\S      : = [^\t\f\r\n]
 
 
 
\w      : = [A-Za-z0-9_]
 
 
 
\W      : = [^A-Za-z0-9_]
 
 
 
.        : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen
 
 
 
===Quantifizierer===
 
{a,b}: mindestens a - maximal b Wiederholungen
 
 
 
{a,} : mindestens a Wiederholungen
 
 
 
{a}  : genau a Wiederholungen
 
 
 
?    : = {0,1}
 
 
 
*    : = {0,}
 
 
 
+    : = {1,}
 
 
 
===Anker===
 
\b: Wortgrenze
 
 
 
\B: Nichtwortgrenze
 
 
 
\A: Anfang des Strings
 
 
 
^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
 
 
 
\Z: Ende des Strings
 
 
 
$ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt
 

Aktuelle Version vom 28. Juli 2007, 22:49 Uhr

Regular Expressions (aka regex)[Bearbeiten]

mit Regular Expressions ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.

FIXME: Verschiedene Ausprägungen, Dialekte und Maschinentypen (siehe Diskussionsseite)


Optionen[Bearbeiten]

  • g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
  • i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
  • s: Sucht über das Zeilenende hinweg
  • m: \n wird als Zeilenende erkannt

Zeichengruppe[Bearbeiten]

  • (a|b|c) : alternative Zeichenfolgen an einer Stelle im Wort / Satz
  • (a|b|) : s.o. + kein Zeichen
  • [a-e] : alternative Zeichen a,b,c,d,e
  • [abc(] : alternative Zeichen a,b,c,(
  • [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
  • \d : = [0-9]
  • \D : = [^0-9]
  • \s : = [\t\f\r\n]
  • \S : = [^\t\f\r\n]
  • \w : = [A-Za-z0-9_]
  • \W : = [^A-Za-z0-9_]
  • . : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen

Quantifizierer[Bearbeiten]

  • {a,b}: mindestens a - maximal b Wiederholungen
  • {a,} : mindestens a Wiederholungen
  • {a} : genau a Wiederholungen
  • ? : = {0,1}
  • * : = {0,}
  • + : = {1,}

Anker[Bearbeiten]

  • \b: Wortgrenze
  • \B: Nichtwortgrenze
  • \A: Anfang des Strings
  • ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
  • \Z: Ende des Strings
  • $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt


Weblinks[Bearbeiten]