Парсер на сайт ALLTIME.RU


Стоимость парсера, руб | 64003.2081 |
Коэффициент суммарного рейтинга KPI парсера (себестоимость) | 20.67 |
Сайт ALLTIME.ru предоставляет услуги и товары для любителей сенсорных устройств и технологий. Он предлагает широкий ассортимент продукции, включая смартфоны, планшеты, аксессуары и другие гаджеты. На сайте можно найти информацию о новинках, обзоры, советы по выбору техники и сравнение различных моделей.
Кроме того, AllTime может содержать разделы с новостями о технологиях, акциями и специальными предложениями, а также поддержкой для клиентов. Пользователи могут оформить заказы онлайн и получить доставку по указанному адресу.
Описание
Технические характеристики парсера
Файлы в архиве |
index.php, каталог framework, файл framework.php |
Вес архива парсера |
7 кб |
Настраиваемые функции в index.php |
set_time_limit(ЧИСЛО) - запас времени для работы парсера (по умолчанию 3600 * 12 * 2) LIMIT_MAPS - по умолчанию 0 (парсить весь сайт), больше 0 - максимальное количество карточек товаров. |
Парсинг путя категории |
есть |
Парсинг наименований товаров |
есть |
Парсинг статуса о наличии товаров |
есть |
Парсинг цен товаров |
есть |
Парсинг гарантии на товары |
есть |
Парсинг технических характеристик товаров |
есть |
Парсинг ссылок на инструкции товаров |
есть |
Парсинг ссылок на фотографии товаров |
есть |
Парсинг товарных описаний |
есть |
База выгрузки |
fid.csv - после окончания работы, парсер в окне браузера выдаст ссылку на скачивание базы. |
Как настроить парсер?
Установите на компьютер локальный сервер, можно использовать Denwer. Создайте папку alltime по пути www/denwer/alltime. Все файлы (index.php и framework/framework.php) закиньте в папку alltime.
Запустите файл START DENWER.exe и зайдите в браузер. Затем введите url-адрес:
localhost/denwer/alltime/
Если Вы все сделали правильно, то парсер будет запущен. На работу скрипта может потребоваться от суток до двух, в зависимости от скорости Вашего интернета. На сайте ALLTIME.RU не менее 40000 - 50000 карточек товаров. У меня например, скрипт отрабатывал в течение 8-12 часов, у вас может быть другое время.
Когда скрипт завершит свою работу, в окне браузера должна появиться строчка:
Скачать фид fid.csv
Нажав на эту надпись, у Вас начнется скачивание базы CSV (EXCEL). Скачайте пример выгрузки.
Чтобы установить лимит времени работы скрипта, найдите в index.php команду set_time_limit (3 строчка в коде)
set_time_limit(3600 * 12 * 2);
Откуда, 3600 - количество секунд в 1 часе, 12 - сутки и 2 - количество суток. Настоятельно рекомендую это значение не трогать, оно выставлено оптимально. За двое суток вполне реально скачать 50 000 страниц. Но если недостаточно, то поменяйте двойку на тройку.
На 11 строке прописана константа LIMIT_MAPS, по умолчанию ноль - качать карточки со всего сайта.
define(LIMIT_MAPS, 0);
Если Вы хотите установить лимит скачивания, то ставьте любое другое число больше нуля - оно будет кратно количеству скаченных карточек. Если Вы хотите скачать тысячу карточек, то установите значение 1000.
define(LIMIT_MAPS, 1000);
Остальные параметры лучше не трогать в скрипте во избежание неполадок.