Лаборатория CreatoR'а - Уроки регулярных выражений #3

» Меню сайта

» Разделы новостей

Downloads [4]

Новости о новых утилитах и об изменении существующих в разделе Downloads

Сайт [3]

Новости сайта

Operaтивные новости [0]

Новости касающиеся Opera

» Случайная цитата

Деньги в кармане - ещё не крылья, но походку меняют [13.06.13]	[Жизненные]
(1)

» Наш опрос

Урок 1. Введение
Урок 2. Шаблоны
Урок 3. Специальные приемы
Урок 4. Практика
Урок 5. Другие RegExp в AutoIt

Замечания, дополнения и исправления приветствуются (здесь)!

Урок 3. Специальные приемы

Все рассмотренные ниже приемы используются довольно редко и, возможно, вам они никогда не пригодятся, но если вы хотите изучить RexExp поглубже - то это для вас :sorcerer:

Лень, жадность и ревность квантификаторов (lazy, greedy and possessive quantifier)
Не путать с грехами wink

Условия просмотра вперед и назад (lookahead и lookbehind assertions)
Данные условия позволяют находить в тексте определенные позиции.

Условные подмаски (conditional subpatterns)
Использование таких подмасок дает возможность направить RegEx в нужном направлении, при выполнении (или невыполнении) условия.

Атомарная группировка (atomic grouping)
Это группировка без захвата и без возврата найденных значений.

"(?>pattern)" - такая группировка обладает свойствами группы без захвата - "(?:pattern)" и ревнивого квантификатора одновременно, т.е. всё что будет соответствовать такому шаблону останется при нем и не попадет в вывод RegExp.
Пример выводит из текста имена, чей возраст лежит в пределах от 20 до 39 лет:

Код

#include <Array.au3>
$sText = 'Anna 25 Joe 30 Carl 20 Piter 13 Lora 21 Nicole 33 Ted 22 Bob 42'
$sPattern = '\S+\s(?>2|3)\d'
$aResult = StringRegExp($sText, $sPattern, 3)
_ArrayDisplay($aResult)

Расшифровка шаблона:
"\S+\s" - любое количество непробельных символов, но не менее одного и один пробел
"(?>2|3)" - атомарная группировка - выбор между цифрами 2 и 3
"\d" - один цифровой символ
Поскольку атомарная группировка не захватывает символы, то в вывод не попадает то что находится внутри скобок, а то что соответствует шаблону в целом.
Второй пример демонстрирует ревность атомарной группировки:

Код

#include <Array.au3>
$sText = '1234'
$sPattern = '(?>\d+)4'
$aResult = StringRegExp($sText, $sPattern, 3)
_ArrayDisplay($aResult)

Атомарная группировка является сверхжадной и данный пример не выдаст результата, т.к. часть шаблона "(?>\d+)" "съест" все цифры до конца строки и не отдаст последний символ для "4" (чтобы убедиться в этом исправьте ">" на ":" - тогда данная группа перестанет быть сверхжадной и RegExp даст совпадение)

Кроме вышеуказанных свойств атомарная группировка как и сверхжадная квантификация не делает откатов, а значит экономит время на проверку выражения.

» Форма входа

» Календарь новостей

» Language

» Поиск

» Друзья сайта