Regex

Aus UUGRN
Version vom 28. Juli 2007, 22:39 Uhr von Rabe (Diskussion | Beiträge) (Markup. FIXME: Detailinfos zu verschiedenen Systemen.)
Zur Navigation springen Zur Suche springen

Regular Expressions (aka regex)

mit Regular Expressions ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.

FIXME: Verschiedene Ausprägungen, Dialekte und Maschinentypen (siehe Diskussionsseite)


Optionen

  • g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
  • i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
  • s: Sucht über das Zeilenende hinweg
  • m: \n wird als Zeilenende erkannt

Zeichengruppe

  • (a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
  • (a|b|)  : s.o. + kein Zeichen
  • [a-e]  : alternative Zeichen a,b,c,d,e
  • [abc(]  : alternative Zeichen a,b,c,(
  • [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
  • \d  : = [0-9]
  • \D  : = [^0-9]
  • \s  : = [\t\f\r\n]
  • \S  : = [^\t\f\r\n]
  • \w  : = [A-Za-z0-9_]
  • \W  : = [^A-Za-z0-9_]
  • .  : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen

Quantifizierer

  • {a,b}: mindestens a - maximal b Wiederholungen
  • {a,} : mindestens a Wiederholungen
  • {a}  : genau a Wiederholungen
  • ?  : = {0,1}
  • *  : = {0,}
  • +  : = {1,}

Anker

  • \b: Wortgrenze
  • \B: Nichtwortgrenze
  • \A: Anfang des Strings
  • ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
  • \Z: Ende des Strings
  • $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt


Weblinks