Главная » Просмотр файлов » regulyarnyie-vyirazheniya-osnovyi

regulyarnyie-vyirazheniya-osnovyi (852744), страница 10

Файл №852744 regulyarnyie-vyirazheniya-osnovyi (Пособие по регуляркам) 10 страницаregulyarnyie-vyirazheniya-osnovyi (852744) страница 102021-10-05СтудИзба
Просмтор этого файла доступен только зарегистрированным пользователям. Но у нас супер быстрая регистрация: достаточно только электронной почты!

Текст из файла (страница 10)

Утилита fgrep (grep -F) предназначена для выполнения операций поис­ка в файлах с использованием литеральных строк; метасимволы наподобие $,* и I никакого особого смысла в ней не имеют. Утилита grep доступна в Linux,а также в Мае OS Х Darwin. Ее также можно получить в составе дистрибутив­ного пакета Cygwin GNU (http://www.cygwin.com) или загрузить по адресуhttp://gnuwin32.sourceforge.net/packages/grep.htm.• PCRE (http://www.pcre.org), или Perl CompatiЬle Regular Expressions, - би­блиотека функций языка С (8- и 16-разрядная версии) для работы с регулярнымивыражениями, совместимыми с Perl 5, которая также включает некоторые воз­можности других реализаций.

Средство pcregrep - 8-разрядная утилита наподо­бие grep, позволяющая использовать возможности библиотеки PCRE в команднойстроке. Утилиту pcregrep для компьютеров Мае можно получить на сайте Macports(http://www.macports.org), выполнив команду sudo port install pcre. (Накомпьютере должна быть предварительно установлена интегрированная среда раз­работки Xcode; см. https://developer.apple.com/technologies/tools/.На сайте требуется пройти процедуру регистрации пользователя.)Глава 3.

Границы53ГЛАВА 4Аnьтернативы, rруппы и обратные ссыпкиВы уже видели, как работают группы. Создание группы путем заключения текстав круглые скобки упрощает выполнение ряда операций, перечисленных ниже:• черодование, т.е. выбор одного из нескольких возможных шаблонов;• создание подшаблонов;• захват (запоминание) групп для последующих обращений к ним с помощью обратных ссылок;• применение операций к групповому шаблону, например квантификатору;• использование групп без функции захвата;• атомарные группы (дополнительная возможность).В примерах этой главы наряду с полным текстом поэмы "The Rime of the AпcientMariner" (файл rime.txt) используется ряд дополнительных текстов.

Нашим основным ин­струментов будет настольная версия приложения RegExr, написанная с использованиемтехнологии Adobe AIR (об установке приложения см. в главе 2), однако будут привле­каться и другие средства, такие как редактор sed.ЧередованиеТермин чередование (alteration) означает возможность выбора альтернативных ва­риантов (альтернатив) шаблона при поиске совпадений. Предположим, требуется опре­делить, сколько раз артикль the встречается в тексте поэмы "The Rime of the AпcientMariner".

Проблема заключается в том, что в поэме артикль может встречаться в различ­ных формах: ТНЕ, The и the. Альтернативы позволяют справиться с этой проблемой.Откройте настольное приложение RegExr, дважды щелкнув на его значке, и скопируй­те в него текст поэмы из файла rime.txt, находящегося в архиве примеров.Введите в верхнем текстовом поле такой шаблон:(thelThelTHE)и вы увидите, как в расположенном под ним поле с текстом поэмы выделятся все вхожде­ния артикля the (рис. 4.1 ). Для просмотра скрытой части текста воспользуйтесь полосойпрокрутки.R•gExrH•tchSampl@s(th• IThoiTHE)� showНу SitvedCommunity�п,/ glob�IТНЕ RIME OF ТНЕ ANCYENТ MARINERE, IN SEVEN PARTS.ARGUMENТ,•J\WldHov, а Ship having passed the Une vr.1s dri,..en Ьу Storms to the cold Count:rytowards the South Pole: and how from theлce she made her course to the tтopicalLatitude of the Greilt Pacific Ocean: and of the strange th1ngs that befell: and 1nv.i,at mannf!:r the Ancyent Marinere- came back to his own Country.\D\s15[АВС]1.It: is ilin ancyfi!nt Marineгe,And he stoppeth one of three:"Ву thv long grey Ьеагd and th•1 glittering еуе''Nov1 vlherefore stoppest me"[-Аве][•·z]Mat.ches any chaг.1cter, e><.c�pt for l,nebreaks if dotall 1s ,els.e"Trle Bridegroom's doors are op-en'd �de"And I am next of kin:"The Guests are met, the Feiilst is set.·­"May'st.

hear the merry din.--R@gExp: l(th•ITh�ITHE)/gpatt•rn: •the IThelTHE-Jfl.gs: g1 apturaлg groups:group 1: thelThelTHE)Рис. 4.1. Использование чередования шаблоновПрименив опции, эту группу можно записать в б олее компактном виде. Опции по­зволяют конкретизировать способ поиска совпадений с шаблоном в тексте. Например,следующая опция:(?i)делает шаблон нечувствительным к регистру, так что вместо прежнего шаблона, включа­ющего набор альтернатив, можно использовать шаблон следующего вида:(?i)theВведите его в RegExr и сравните полученный результат с предыдущим.

Вместо тогочтобы изменять шаблон, можно установить флажок ignoreCase ( игнорировать регистр).Результат будет тем же. Перечень доступных опций (модификаторов) приведен в табл. 4.1.Таблица 4.1. Опции, используемые в регулярных выраженияхОпцияОписаниеПоддержка(?d)Строки UnixJava(?i)Игнорировать регистр символовPCRE, Perl, Java(?J)Разрешить одинаковые имена подшаблоновPCRE*(?m)Обрабатывать текст как многострочныйPCRE, Perl, Java56Глава 4. Альтернативы, группы и обратные ссылкиокончание табл.

4.1Опция(?s)ОписаниеПоддержкаОбрабатывать текст как одну строкуPCRE, Perl, Java(?u)Обрабатывать шаблоны как строки UnicodeJava(?U)Делает модификаторы "нежадными" по умолчаниюPCRE(?х)Игнорировать пробельные символы и ком­ментарииPCRE, Perl, Java( ?-... )Сброс или отключение опцийPCRE•См.раздел "Named Subpatterns" на странице http: //www.pcre.org/pcre. txt.Далее мы рассмотрим применение альтернатив в grep. Кстати, опции, приведенныев табл.4.1, в grep не работают, поэтому мы будем использовать исходный шаблон, содер­жащий перечисление альтернатив.

Для подсчета количества строк, в которых встреча­ется артикль the, причем независимо от регистра символов и того, сколько именно разшаблон встречается в строке, используйте такую команду:grep -Ее "(thelThelTHE)" rime.txtчто должно привести к следующему результату:327Однако это еще не вся история, поэтому не расслабляйтесь.Ниже приведен подробный анализ того, как работает данная команда.• Опция -Е означает, что вы хотите использовать расширенные регулярные выра­жения (ERE), а не базовые (BRE).

Это позволяет избавиться от необходимостиэкранировать скобки и вертикальную черту (\ ( ТНЕ \ 1 The \ 1 the \) ), что надобыло бы сделать в случае использования BRE.• Опция -с указывает на необходимость вывода количества строк, в которых обна­ружены совпадения (а не собственно количества совпадений}.• Скобки объединяют варианты выбора, или альтернативы, заданные в виде the, Theи ТНЕ, в одну группу.• Символ вертикальной черты разделяет альтернативы, обработка которых осу­ществляется слева направо.Чтобы получить фактическое количество вхождений артикля в тексте поэмы, необхо­димо использовать следующую команду:grep -Ео "(thelThelTHE)" rime.txt I wc -1возвращающую каждое совпадение в виде отдельной строки, что приводит к следующе­му результату:412Проанализируем эту команду.Глава 4.

Альтернативы, группы и обратные ссыпки57• Опция -о указывает на то, что отображать необходимо лишь ту часть строки, ко­торая совпадает с шаблоном, хотя это и не очевидно по той причине, что канал ( 1 )перенаправляет вывод команде wc.• В данном контексте вывод команды grep перенаправляется в поток ввода коман­ды wc.

Команда wc - это команда подсчета слов, опция -1 которой задает под­счет количества входных строк.Откуда взялась столь большая разница в значениях: 327 и 412? Это произошло пото­му, что опция -с задает лишь подсчет строк, в которых встречаются совпадения с ша­блоном, но ведь в одной строке может встретиться несколько совпадений. Если в коман­де wc -1 дополнительно использовать опцию -о, то каждое вхождение искомого словав любой из его форм будет появляться на отдельной строке и учитываться при подсчете,что и приводит к получению большего значения.Выполним аналогичный поиск совпадений с помощью Perl, используя следующую ко­манду:perl -ne 'print if /(thelThelTHE)/' rime.txtЭту команду можно оптимизировать за счет применения опции ( ? i) , делающей не­нужным использование списка альтернатив:perl -ne 'print if /(?i)the/' rime.txtНо и последнюю команду можно дополнительно улучшить, добавив модификатор iвслед за последним разделителем шаблона:perl -ne 'print if /the/i' rime.txtРезультат останется тем же.

Однако чем проще, тем лучше. Список дополнительныхмодификаторов (называемых также флагами) приведен в табл. 4.2. Одновременно у васпоявляется возможность сравнить (разумеется, с учетом различий в синтаксисе) эти мо­дификаторы с опциями, приведенными в табл. 4.1.Таблица 4.2. Модификаторы (флаги) Perl*МодификатораОписаниеПоиск соответствий для сокращений \d, \s, \w и классов POSIX только в ди­апазоне символов ASCIIсНе сбрасывать текущую позицию поиска при неудачном исходе сопостав­ленияdИспользовать собственные правила платформы, заданные по умолчаниюgГлобальное сопоставление, т.е. поиск всех вхождений шаблонаiИгнорировать регистр при сопоставлении1Использовать правила текущей локалиmОбрабатывать исходный текст как многострочныйРСохранять строку, которая совпалаsОбрабатывать исходный текст как единую строку58Глава 4. Альтернативы, группы и обратные ссылкиокончание табл.

4.2Модификатор ОписаниеuИспользовать правила Unicode при сопоставленииИгнорировать пробельные символы и комментариих'Cм.http://perldoc.perl.org/perlre.html#ModifiersПодшабnоныКогда говорят о подшаблонах в регулярных выражениях, то под этим термином чащевсего подразумевают группу или группы, входящие в другую группу. Подшаблон - этошаблон в шаблоне. Часто, хотя и не всегда, совпадение с подшаблоном проверяется лишьв том случае, если найдено совпадение для предшествующего ему шаблона.

Подшаблоныможно конструировать множеством способов, но нас интересуют в первую очередь те изних, которые определяются с помощью круглых скобок.В некотором смысле вы уже познакомились с подшаблонами, когда работали со сле­дующим шаблоном:(thelThelTHE)Здесь мы имеем дело с тремя подшаблонами. Первый из них - the, второй - The,третий - ТНЕ, но в данном случае поиск совпадений для второго подшаблона осущест­вляется независимо от поиска совпадений для первого подшаблона.

Характеристики

Список файлов книги

Свежие статьи
Популярно сейчас
Как Вы думаете, сколько людей до Вас делали точно такое же задание? 99% студентов выполняют точно такие же задания, как и их предшественники год назад. Найдите нужный учебный материал на СтудИзбе!
Ответы на популярные вопросы
Да! Наши авторы собирают и выкладывают те работы, которые сдаются в Вашем учебном заведении ежегодно и уже проверены преподавателями.
Да! У нас любой человек может выложить любую учебную работу и зарабатывать на её продажах! Но каждый учебный материал публикуется только после тщательной проверки администрацией.
Вернём деньги! А если быть более точными, то автору даётся немного времени на исправление, а если не исправит или выйдет время, то вернём деньги в полном объёме!
Да! На равне с готовыми студенческими работами у нас продаются услуги. Цены на услуги видны сразу, то есть Вам нужно только указать параметры и сразу можно оплачивать.
Отзывы студентов
Ставлю 10/10
Все нравится, очень удобный сайт, помогает в учебе. Кроме этого, можно заработать самому, выставляя готовые учебные материалы на продажу здесь. Рейтинги и отзывы на преподавателей очень помогают сориентироваться в начале нового семестра. Спасибо за такую функцию. Ставлю максимальную оценку.
Лучшая платформа для успешной сдачи сессии
Познакомился со СтудИзбой благодаря своему другу, очень нравится интерфейс, количество доступных файлов, цена, в общем, все прекрасно. Даже сам продаю какие-то свои работы.
Студизба ван лав ❤
Очень офигенный сайт для студентов. Много полезных учебных материалов. Пользуюсь студизбой с октября 2021 года. Серьёзных нареканий нет. Хотелось бы, что бы ввели подписочную модель и сделали материалы дешевле 300 рублей в рамках подписки бесплатными.
Отличный сайт
Лично меня всё устраивает - и покупка, и продажа; и цены, и возможность предпросмотра куска файла, и обилие бесплатных файлов (в подборках по авторам, читай, ВУЗам и факультетам). Есть определённые баги, но всё решаемо, да и администраторы реагируют в течение суток.
Маленький отзыв о большом помощнике!
Студизба спасает в те моменты, когда сроки горят, а работ накопилось достаточно. Довольно удобный сайт с простой навигацией и огромным количеством материалов.
Студ. Изба как крупнейший сборник работ для студентов
Тут дофига бывает всего полезного. Печально, что бывают предметы по которым даже одного бесплатного решения нет, но это скорее вопрос к студентам. В остальном всё здорово.
Спасательный островок
Если уже не успеваешь разобраться или застрял на каком-то задание поможет тебе быстро и недорого решить твою проблему.
Всё и так отлично
Всё очень удобно. Особенно круто, что есть система бонусов и можно выводить остатки денег. Очень много качественных бесплатных файлов.
Отзыв о системе "Студизба"
Отличная платформа для распространения работ, востребованных студентами. Хорошо налаженная и качественная работа сайта, огромная база заданий и аудитория.
Отличный помощник
Отличный сайт с кучей полезных файлов, позволяющий найти много методичек / учебников / отзывов о вузах и преподователях.
Отлично помогает студентам в любой момент для решения трудных и незамедлительных задач
Хотелось бы больше конкретной информации о преподавателях. А так в принципе хороший сайт, всегда им пользуюсь и ни разу не было желания прекратить. Хороший сайт для помощи студентам, удобный и приятный интерфейс. Из недостатков можно выделить только отсутствия небольшого количества файлов.
Спасибо за шикарный сайт
Великолепный сайт на котором студент за не большие деньги может найти помощь с дз, проектами курсовыми, лабораторными, а также узнать отзывы на преподавателей и бесплатно скачать пособия.
Популярные преподаватели
Добавляйте материалы
и зарабатывайте!
Продажи идут автоматически
6366
Авторов
на СтудИзбе
310
Средний доход
с одного платного файла
Обучение Подробнее