Regex

Aus UUGRN

Regular Expressions (aka regex)[Bearbeiten]

mit Regular Expressions ist es möglich, einen Zeichenstrom nach bestimmten Mustern zu durchsuchen und ggf. zu ersetzen.

FIXME: Verschiedene Ausprägungen, Dialekte und Maschinentypen (siehe Diskussionsseite)


Optionen[Bearbeiten]

  • g: globale Suche. Findet alle Stellen an denen das Suchwort vorkommt
  • i: Unterscheidet nicht zwischen Groß- und Kleinschreibung
  • s: Sucht über das Zeilenende hinweg
  • m: \n wird als Zeilenende erkannt

Zeichengruppe[Bearbeiten]

  • (a|b|c)  : alternative Zeichenfolgen an einer Stelle im Wort / Satz
  • (a|b|)  : s.o. + kein Zeichen
  • [a-e]  : alternative Zeichen a,b,c,d,e
  • [abc(]  : alternative Zeichen a,b,c,(
  • [^A-Za-z]: jedes Zeichen, dass kein Buchstabe ist
  • \d  : = [0-9]
  • \D  : = [^0-9]
  • \s  : = [\t\f\r\n]
  • \S  : = [^\t\f\r\n]
  • \w  : = [A-Za-z0-9_]
  • \W  : = [^A-Za-z0-9_]
  • .  : = alles außer \n - wenn die Option s verwendet wird, wird auch \n mit eingeschlossen

Quantifizierer[Bearbeiten]

  • {a,b}: mindestens a - maximal b Wiederholungen
  • {a,} : mindestens a Wiederholungen
  • {a}  : genau a Wiederholungen
  • ?  : = {0,1}
  • *  : = {0,}
  • +  : = {1,}

Anker[Bearbeiten]

  • \b: Wortgrenze
  • \B: Nichtwortgrenze
  • \A: Anfang des Strings
  • ^ : Anfang des Strings - mit Option /m wird auch jede Position hinter \n berücksichtigt
  • \Z: Ende des Strings
  • $ : Ende des Strings - mit Option /m wird auch jede Position vor \n berücksichtigt


Weblinks[Bearbeiten]