3 горизонтальные линии, бургер
3 горизонтальные линии, бургер

3 горизонтальные линии, бургер
Удалить все
ЗАГРУЗКА ...

Парсер всего текста с сайта или отдельных страниц онлайн ( + заголовки и прочее) | ВорТекста

Часы
13.05.2025
/
Часы
21.05.2025
Глазик
951
Сердечки
1
Соединённые точки
0
Соединённые точки
0
Соединённые точки
0
Веб инструмент
Веб инструмент
Джанго приложение
Джанго приложение
Интерфейс терминальной строки
Интерфейс терминальной строки
Парсер
Парсер

CSS селектор
Правила
  • Указывать список УРЛов через обычный пробел
  • Максимальное количество УРЛов для обхода по списку - 100
  • Результаты парсинга будут храниться только до 0 часов следующих суток, после успешного парсинга.
ЗАГРУЗКА ...

О парсере текста с сайта

Онлайн парсер который собирает текст, заголовковки, исходный код и прочее (просто используй CSS селектор) с сайтов, веб страниц и списков страниц. С последующей базовой его обработкой, которая включает количество слов, количество уникальных слов и сбора списка частоты появления этих слов в тексте.
Данный инструмент работает в 3-х режимах. В режиме парсинга с одной страницы, со списка страниц и с целого сайта.
Ещё этот парсер текста с веб страниц, представляет из себя веб-реализацию python-библиотеи text-thief. Которая предоставляет общий функционла для работы с текстом. Ещё есть реализация ввиде инструмента командной строки, которая гораздо легче для понимания и изучения. Эта библиотека доступна через PiPI, или можно установить её исходники прямо отсюда.

Похожие инструменты

Часы
27.11.2023
/
Часы
21.05.2025
/
Веб инструмент
Джанго приложение
Интерфейс терминальной строки
Парсер
Глазик
8297
Сердечки
12
Соединённые точки
2
Соединённые точки
0
Соединённые точки
7
Инструмент по парсингу всех картинок, фоток и изображений с сайта, или отдельных страниц. С возможностью использовать данный инструмент как python скрипт, на собственной машине. Как django приложение. И как обычный веб инструмент, который всегда доступен.
Часы
04.05.2025
/
Часы
21.05.2025
/
Веб инструмент
Джанго приложение
Телеграм бот
С графическим интерфейсом
Интерфейс терминальной строки
Парсер
Глазик
2109
Сердечки
0
Соединённые точки
0
Соединённые точки
0
Соединённые точки
0
Онлайн парсер всех ссылок с сайта. Этот инструмент является web-версией и шкуркой для моей библиотеки по парсингу ссылок с сайтов. Данная библиотека имеет ещё несколько шкурок, таких как CLI-скрипт, GUI-приложение, Телеграм бот и в виде обычной python библиотеки доступной через PyPI.

Не забудь поделиться, лайкнуть и оставить комментарий)

Отзывы

(0)

captcha
Отправить
ЗАГРУЗКА ...
Сейчас тут пусто. Буть первым (o゚v゚)ノ