Регулярные выражения. RegEx (Regular Expressions). Что это такое и зачем они нужны?
Допустим, вы ищете в тексте слово "кот". Как это сделать? Вы вызываете окно поиска, пишете в нем "кот" и жмете "Enter". А что, если вам надобны не только коты, но и киты? Обычный поиск потребует от вас удалить из диалогового окна слово "кот" и набрать слово "кит". Теперь мы можем найти всех китов, но потеряем всех котов. А можно ли найти и котов, и китов? Мы же видим, что слова, в принципе, похожи. По бокам "к" и "т", в середине — какая-то гласная. Даже минимальные познания в компьютерных науках подсказывают нам, что, вообще-то, это должно быть несложно.
Решение действительно есть, его и предлагает язык регулярных выражений RegEx. Этот язык настолько важен и удобен, что им пользуются не только многие языки программирования и утилиты командной строки, но и широко распространенные редакторы текстов и таблиц (например, он встроен в Open и Libre Office, о чем не подозревают 99 из 100 рядовых пользователей). Он работает почти свершенно одинаково в разных программах и операционных системах, поэтому его достаточно освоить один раз.
Я каждый день редактирую с его помощью тексты и массивы данных. Роботы, в состав которых входят модули, написанные на RegEx, ежедневно собирают для меня информацию в Интернете (в проектах по коронавирусу и многих других). Иногда я ищу что-то на компьютере с его помощью или переименовываю файлы по определенному образцу. Дорога до этого уровня от поиска китов и котов не очень длинная, но тем, кто никогда не ходил ею, нужен проводник.
Использованию регулярных выражений для добычи информации в Интернете и посвящен курс, на который я продолжаю набирать слушателей. Ссылка на запись — ниже:
https://forms.gle/sHir4zRuUFha3EJt6