6.2.7 Zusammenfassung der Syntax
In der Tabelle wird die bisherige Syntax zusammengefasst dargestellt. Es handelt sich hierbei um einen Ausschnitt aus einer weit umfangreicheren Syntax.
Tabelle: Syntax regulärer Ausdrücke für PHP
| Übersicht Sonderzeichen | Erklärung | 
|---|---|
( ) | 
Gruppiert die Elemente zu einem einzigen Element. Es muss eine Übereinstimmung in der Reihenfolge mit allen Elementen vorliegen, z.B. (tee). | 
(...|...|...) | 
Verbindet die Gruppierung mit der alternativen Auswahl, gekennzeichnet durch das Pipe-Zeichen |, z.B. (tee|tea|te). | 
[ ] | 
Bezeichnet eine Klasse von Elementen, die erkannt werden sollen. Es muss eine Übereinstimmung mit nur einem der Elemente vorliegen, z.B. [0-9]. Sonderzeichen der Mengenklammer sind [^ - / \], alle anderen Zeichen haben keine Sonderfunktion. | 
[^ ] | 
Bezeichnet eine negierte Klasse von Elementen. Das Zeichen ^ negiert die gesamte Klasse. Anmerkung: Der Operator gilt für die Negation nur in der Mengenklammer [ ], z.B. [^0-9]. | 
\d bzw. Negation \D | 
Digit (entsprechend [0-9]) bzw. nicht Digit (entsprechend [^0-9]). | 
\w bzw. Negation \W | 
Alphanumerische Zeichen (Wort) entsprechend [a-zA-Z0-9_] bzw. nicht alphanumerische Zeichen entsprechend [^a-zA-Z0-9_]. | 
\s bzw. Negation \S | 
Whitespace (Leerzeichen und Tabulator) bzw. nicht whitespace. | 
\b bzw. Negation \B | 
Wortgrenze (b = boundary) bzw. nicht Wortgrenze. Bei der Wortgrenze handelt es sich nicht um ein eigenes Zeichen, sondern nur um eine Markierung. Eine Wortgrenze ist definiert als Übergang zwischen einem \W-Zeichen und einem \w-Zeichen (also vor einem \w-Zeichen oder hinter einem \w-Zeichen). | 
. | 
Der „Punkt“ steht für ein beliebiges Zeichen (Ausnahme: Zeilenumbruch Newline). | 
{n,m} | 
Wiederholungsintervall (gierig).{n} genau n-mal{n,} mindestens n-mal{,m} maximal m-mal{n,m} mindestens n-mal und maximal m-mal | 
{n,m}? | 
Wiederholungsintervall (nicht-gierig). | 
? | 
Das vorstehende Zeichen 0 oder 1-mal (gierig). | 
+ | 
Das vorstehende Zeichen 1-mal oder beliebig oft (gierig). | 
* | 
Das vorstehende Zeichen 0-mal oder beliebig oft (gierig). | 
?? | 
Das vorstehende Zeichen 0 oder 1-mal (nicht-gierig). | 
+? | 
Das vorstehende Zeichen 1-mal oder beliebig oft (nicht-gierig). | 
*? | 
Das vorstehende Zeichen 0-mal oder beliebig oft (nicht-gierig). | 
^ | 
Markiert, dass der Suchausdruck am Anfang stehen muss. Im Mehrzeilenmodus wird auch jedes Newline-Zeichen erkannt. | 
$ | 
Erkennt das Zeilenende bzw. das Zeichen unmittelbar vor dem letzten Newline-Zeichen. | 
/ /i | 
Modifikator: Groß-/Kleinschreibung ignorieren. | 
/ /s | 
Modifikator: Single-line-Mode: Zeichenketten als eine einzige Zeile betrachten. Der Punkt-Operator gilt auch für das Newline-Zeichen. | 
/ /x | 
Modifikator: Ignoriert Whitespace und erlaubt Kommentare (#). So kann bei längeren Suchmustern eine Formatierung zur besseren Lesbarkeit des Suchmusters vorgenommen werden, indem das Suchmuster über mehrere Zeilen geschrieben wird. | 
/ /u | 
Modifikator: Schaltet UTF-8 an und damit enthält \w auch Umlaute. | 
Wer sich mehr mit der Syntax beschäftigen möchte:
- Wikibooks
 - RegExp Evaluator Tutorial
 - Sehr viele, professionelle Beispiele finden sind im Buch: Goyvaerts, Jan; Levithan, Steven: Reguläre Ausdrücke Kochbuch. [detaillierte Lösungen für acht Programmiersprachen; mit Einstiegs-Tutorial]. O'Reilly Verlag.
 - Stubblebine, Tony; Klicman, Peter; Schulten, Lars: Reguläre Ausdrücke. Kurz & gut. O'Reilly Verlag.
 
Und wer reguläre Ausdrücke aus Sicht der theoretischen Informatik kennen lernen möchte, der möge sich das folgende Video ansehen: