cf https://developer.mozilla.org/fr/docs/Web/JavaScript/Guide/Regular_Expressions
Création d'une expression régulière
On peut utiliser un littéral d'expression régulière, qui correspond à un motif contenu entre deux barres obliques, par exemple :
let re = /jolie/;
On peut également appeler le constructeur de l'objet RegExp, par exemple :
let re = new RegExp("jolie");
Exécution de l'expression régullière
let re = new RegExp("jolie"); let results = re.exec(str); console.log(results);//["jolie", index: 6, input: "Ok la jolie chaîne de caractères", groups: undefined]
La méthode exec() exécute la recherche d'une correspondance sur une chaîne de caractères donnée. Elle renvoie un tableau contenant les résultats ou null.
Si on souhaite uniquement savoir s'il y a une correspondance, on utilisera la méthode
RegExp.prototype.test()
ou la méthode
String.prototype.search().
Caractères spéciaux
Caractère | Signification |
---|---|
\ |
Correspond selon les règles suivantes : |
^ |
Correspond au début la séquence. Si le marqueur (flag) de lignes multiples vaut true , il correspondra également immédiatement après un caractère de saut de ligne.Ainsi, /^A/ ne correspond pas au 'A' de "un A", mais correspond au 'A' de "Arceau".Le caractère ' ^ ' possède un sens différent lorsqu'il est utilisé dans un motif d'ensemble de caractères. Voir les compléments sur les ensembles de caractères pour plus de détails et d'exemples. |
$ |
Correspond à la fin de la séquence. Si le marqueur (flag) de lignes multiples vaut true, il correspondra également immédiatement avant un caractère de saut de ligne. Ainsi, |
* |
Correspond à l'expression précédente qui est répétée 0 ou plusieurs fois. Équivalent à Ainsi, |
+ |
Correspond à l'expression précédente qui est répétée une ou plusieurs fois. C'est équivalent à Ainsi, |
? |
Correspond à l'expression précédente qui est présente une fois ou pas du tout. C'est équivalent à {0,1} .Ainsi, /e?le?/ correspond au 'el' dans "gel" et au 'le' dans "angle" mais aussi au 'l' dans "Oslo".S'il est utilisé immédiatement après l'un des quantificateurs : *, +, ?, ou {}, il rend le quantificateur moins « gourmand » auquel cas le moins de caractères correspond (le comportement par défaut, « gourmand », permettant de faire correspondre le plus de caractères possible). Par exemple /\d+/ utilisée avec "123abc" fait correspondre "123". Utiliser /\d+?/ à la même chaîne de caractères fait correspondre "1".Ce symbole est également utilisé dans les tests de présence autour de l'expression, décrits par les lignes x(?=y) et x(?!y) de ce tableau. |
. |
Par défaut, (Le point) correspond à n'importe quel caractère excepté un caractère de saut de ligne. Ainsi, Si le marqueur |
(x) |
Correspond à 'x' et garde la correspondance en mémoire. Les parenthèses permettent de capturer l'expression dans un « groupe ». |
(?:x) |
Correspond à 'x' mais ne garde pas la correspondance en mémoire. Les parenthèses ne capturent pas l'expression et permettent d'utiliser des sous-expressions d'une expression régulière pour travailler plus finement. L'expression /(?:zoo){1,2}/ sans parenthèses non-capturantes les caractères {1,2} ne s'appliqueraient qu'au dernier 'o' de 'zoo'. Avec les parenthèses capturantes, {1,2} s'applique au mot entier 'zoo'. Pour plus d'informations, voir Utiliser les parenthèses ci-après. |
x(?=y) |
Correspond à 'x' seulement s'il est suivi de 'y'. On appelle cela un test de succession (lookahead). Ainsi, |
x(?!y) |
Correspond à 'x' seulement si 'x' n'est pas suivi de 'y'. Ainsi, |
(?<=y)x |
Correspond à Ainsi / |
(?<!y)x |
Correspond à Ainsi, |
x|y |
Correspond à 'x' ou 'y'. Ainsi, |
{n} |
Correspond pour exactement n occurences de l'expression précédente. N doit être un entier positif. Ainsi, /a{2}/ ne correspond pas au 'a' de "Mozilla" mais correspond à tous les 'a' de "Mozilaa" et aux deux premiers 'a' de "Mozillaaa". |
{n,} |
Correspond lorsqu'il y a au moins Par exemple |
{n,m} |
Lorsque Ainsi, |
[xyz] |
Un ensemble de caractère. Ce type de motif correspond pour n'importe quel caractètre présent entre les crochets, y compris les séquences d'échappement. Les caractères spéciaux comme le point (.) et l'astérisque ne sont pas considérés comme spéciaux au sein d'un ensemble et n'ont donc pas besoin d'être échappés. Il est possible de donner un ensemble sur un intervalle de caractères en utilisant un tiret (-), comme le montre l'exemple qui suit. Le motif [a-d] , aura les mêmes correspondances que [abcd] , correspondant au 'b' de "bulle" et au 'c' de "ciel". Les motifis /[a-z.]+/ et /[\w.]+/ correspondront pour la chaîne entirère : "Adre.ss.e". |
[^xyz] |
Exclusion d'un ensemble de caractères. Cela correspond à tout ce qui n'est pas compris entre crochets. Il est possible de fournir un intervalle de caractères en utilisant un tiret (-). Les autres règles qui s'appliquent pour l'ensemble de caractères (ci-avant) s'appliquent également ici. Par exemple, |
[\b] |
Correspond pour un retour arrière (U+0008). (À ne pas confondre avec \b .) |
\b |
Correspond à la position d'uneAfter the limite de mot. Une limite de mot correspond à la position où un caractère d'un mot n'est pas suivi ou précédé d'un autre caractère de mot. Il faut savoir que la limite correspondante n'est pas incluse dans le résultat. Autrement dit, la longueur d'une telle correspondance est nulle. (À ne pas confondre avec Exemples : Note : Le moteur d'expressions rationnelles JavaScript définit un ensemble de caractères spécifiques qui doivent être considérés comme des caractères de mot. Tout caractère qui n'est pas dans cet ensemble est considéré comme une limite de mot. Cet ensemble de caractères est relativement limité car constitué uniquement des caractères de l'alphabet romain en minuscules et en majuscules, des chiffres décimaux et du tiret-bas (underscore). Les autres caractères, comme les caractères accentués (é ou ü par exemple), sont donc considérés comme des limites de mots. |
\B |
Correspond à une "non-limite de mot". Cela correspond pour les cas suivants :
Ainsi, |
\cX |
Étant donné un caractère X compris entre A et Z, cela correspond au caractère de contrôle dans une chaîne de caractères. Ainsi, |
\d |
Correspond à un chiffre et est équivalent à Ainsi, |
\D |
Correspond à tout caractère qui n'est pas un chiffre et est équivalent à Ainsi, |
\f |
Correspond à un saut de page (U+000C). |
\n |
Correspond à un saut de ligne (U+000A). |
\r |
Correspond à un retour chariot (U+000D). |
\s |
Correspond à un blanc (cela comprend les espace, tabulation, saut de ligne ou saut de page). C'est équivalent à Ainsi, |
\S |
Correspond à un caractère qui n'est pas un blanc. C'est équivalent à Ainsi, |
\t |
Correspond à une tabulation (U+0009). |
\v |
Correspond à une tabulation verticale (U+000B). |
\w |
Correspond à n'importe quel caractère alphanumérique, y compris le tiret bas. C'est équivalent à Ainsi, |
\W |
Correspond à n'importe quel caractère n'étant pas un caractère de mot. Cela est équivalent à Ainsi, |
\n |
Soit n un entier strictement positif, cela fait référence au groupe de la n-ième expression entre parenthèses (en comptant les parenthèses ouvrantes). Ainsi, |
\0 |
Correspond au caractère NULL (U+0000). Il ne doit pas être suivi d'un autre chiffre car \0<chiffres> est une séquence d'échappement pour les nombres en notation octale (si besoin d'utiliser un chiffre ensuite, on pourra utiliser la forme \x00 , cf. ci-après). |
\xhh |
Correspond au caractère dont le code hexadécimal est hh (deux chiffres hexadécimaux). |
\uhhhh |
Correspond au caractère dont le code est hhhh (quatre chiffres hexadécimaux). |
\u{hhhh} |
(Uniquement actif quand le marqueur u est activé) Correspond au caractère dont la valeur Unicode est hhhh (en chiffre hexadécimaux). |