Программа для обработки текстовых логов Apache.
Пользователь указывает папку, программа находит все логи в ней, выдирает из них IP-адреса и обрабатывает их:
1. Составляет список уникальных IP-адресов (т.е. при обработке отсеиваются дубликаты), при этом подсчитывается: кол-во повторяющихся IP (т.е. кол-во запросов c каждого IP); кол-во лог-файлов, в которых был найден каждый уникальный IP.
2. Узнаёт дополнительную информацию об IP-адресах: выдает провайдера, которому был выделен диапазон, куда входит IP-адрес (по базе RIPE).
3. Составляет список диапазонов IP-адресов (по базе RIPE), для каждого диапазона подсчитывается: кол-во вошедших уникальных IP; кол-во запросов (каждый уникальный IP может сделать несколько запросов); кол-во лог-файлов, в которых были эти IP; информация о провайдере.
Скорость обработки достаточно высока: чтение базы RIPE (150 МБ, 3.4 млн. диапазонов), логов (10 файлов, 450 МБ, 1.2 млн. записей) и обработка данных занимает 40 сек. на одном ядре младшего Core2Duo.