Блог


TextPipe Группа фильтров Extract Извлечь (часть 6)

Прочитано 494 раз

Следующая группа фильтров, которые будут рассмотрены, называется Extract (Извлечь). Фильтры этой группы предназначены для извлечения информации из текста.

 

Мы можем извлечь следующее:

  • Extract lines matching/nonmatching Извлечь строки соответствующие/несоответствующие поисковой строке. См. скриншот. Если мы напишем слово text в строке (цифра 3 на скриншоте), то из тестового примера будут извлечены 3 строки. Это число может быть увеличено, т.к. есть возможность включить в выдачу несколько строк до и после строки, удовлетворяющей запросу (цифра 2 на скриншоте);
  • Extract email address (Извлечь адреса электронной почты) Для сбора адресов электронной почты;
  • Extract URL (Извлечь адреса на ресурсы) Извлечение всех ссылок, использую, когда из текста надо извлечь адреса и передать их другой программе - менеджеру закачек;
  • Extract matches (Извлекаются точные совпадения) Например, для тестового примера: если задать слово text мы получим список из трех слов text. Фильтр имеет возможность подсчета числа совпадений, т.е. можно подсчитать сколько раз то или иное слово встречается в тексте;
  • Extract lines from list (Извлечение точно соответствующих строк);
  • Extract lines matching pattern list (Извлечь соответствия заданные списком). Если задать список из слов to и text мы получим 5 строк, где эти слова встречаются.

 

Оставить комментарий

Календарь

« Май 2017 »
Пн Вт Ср Чт Пт Сб Вс
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31