Додайте свій проект безкоштовно і почніть отримувати пропозиції від фрілансерів-виконавців вже через хвилини після публікації!

Парсер с сайта Allegro.pl

минув час актуальності


Список требований к парсеру:

1. Парсер должен работать онлайн на сервере в связке с движком магазина. На каком движке Вы смогли бы реализовать такой парсер? Это может быть любая подходящая и хорошо знакомая Вам опенсорсная CMS.

2. Парсер должен парсить только раздел автозапчасти   http://allegro.pl/czesci-samochodowe-620   . В разделе около 24 тысяч категорий и подкатегорий, которые должны формировать такую же древовидную структуру как на сайте доноре.

3. При парсинге должны копироваться такие данные из карточки товара, а именно: Заголовок, номер лота, фотографии, состояние (новый или б/у). Желательно чтобы сами фотографии не скачивались, а парсились только ссылки на изображения на сервере allegro.

4. Также должна парсится и цена товара +доставка "pobraniowa" с возможностью ее дальнейшей конвертации, Злотый - Гривна или $ и умножения на нужный коэффициент заданный  в админке.

5.Так как все названия на сайте доноре  на польском языке то желательно чтобы при парсинге названия товаров переводились  с польского на русский.

С гугл переводчиком наверно ничего не получится из-за неоправданной дороговизны (17миллионов названий товаров, каждое из которых состоит из как минимум 15-20 символов, нетрудно подсчитать в какую сумму обойдётся перевод   такого объёма текста) и корявым переводом. В разделе почти все слова, это названия запчастей которые повторяются тысячи раз, всего же в автомобиле 5-10 тысяч наименований запчастей которые нужно перевести, плюс некоторое количество общепринятых слов таких как левый, правый, задний, передний и т д. Возможно ли осуществлять перевод при помощи какого-то специализированного промышленного словаря или может даже составить его самостоятельно? Какие могут быть варианты реализации подобного переводчика?

6. Товары при парсинге должны попадать в «правильные» соответствующие им категории и подкатегории товаров.

7. Должна быть возможность запускать парсер в автоматическом режиме по расписанию, скажем один раз в сутки. При этом парсер должен по номеру лота проверять наличие на сайте донора.

8. Парсер должен иметь возможность работать через прокси или другие анонимайзеры, на случай если сайт донор будет вводить какие либо ограничения.

9. Парсер должен иметь такую же форму поиска как и в http://www.global-cars.com.ua (марка, модель, поисковое окно для названия детали)

То есть пользователь выбирает в выпадающем списке формы марку автомобиля, далее в другом окошке формы становится доступен список моделей для данной марки и пользователь выбрав ее и введя название требуемой детали осуществляет поиск.

Хотелось бы получить от вас развёрнутый ответ с комментариями по  каждому из требований к парсеру из списка выше.



  1. 15 днів20000 ₴
    Павел Спринчан
     553   13   0

    Готов сотрудничать пишите в Skype: casper6132 обсудим детали.

    Україна Кропивницький (Кіровоград) | 12 березня о 09:55 |
  1. 30 днів30000 ₴
    Юрий Фрилансер
     370   2   0

    асинхронный многопоточный, на питоне
    с прокси, прокси скрипт будет собирать сам,
    по переводам есть несколько вариантов
    Если заинтересованы, пишите в скайп, обсудим необходимые подробности, и я прокомментирую ваш список
    [email protected]
    skype wku-lg

    Україна Україна | 10 березня о 14:05 |

Замовник
Проект опублікований
9 березня о 21:05
240 переглядів
Місцеположення виконавця
Україна Україна
Поділитися