Необходимо разработать парсер, извлекающий в сайта bus.gov.ru информацию об общеобразовательных школах.
Как работает сайт и как может работать этот парсер?
1. На сайте в разделе "Расширенный поиск" необходимо ввести фразу "общеобразовательное учреждение" и указать конкретный регион по списку (например
bus.gov.ru/pub/search/age... 2. Перейти по каждой полученной ссылке и извлечь с карточки школы следующие данные: Регион, Название, Адрес, Email, Сайт, Телефон, Полные ФИО директора
3. Свести все полученные данные в таблицу со следующими столбцами: Регион, Название, Адрес, Email, Сайт, Телефон, Полные ФИО директора
Результатом работы должны быть таблица и сама программа, извлекающая данные.
Проблема может быть в том, что для крупных регионов с большим количеством школ выводится слишком много результатов. Просмотреть можно только первую 1000. Здесь нужно что то придумать.