Додайте свій проект безкоштовно і почніть отримувати пропозиції від фрілансерів-виконавців вже через хвилини після публікації!

Скрипт парсера новостей

закрито без виконання


Ребят, нужен скрипт парсинга новостей.

Идет в том что бы делать выборку новостей только по электромобилям с сайта https://www.ukr.net/news/avto.html

На самом сайте есть много ссылок и уже переходя по ним парсить заголовок и текст новости.

Далее уже я сделаю запись в базу и т.п.

Надо сделать на php

Напишите сколько будет не деньгам и срокам.

Только ребят, пожалуйста, делайте ставки ТОЛЬКО СЮДА, не пишите с предложениями в ЛС. Спасибо.



  1. ставка прихована фрілансером
  2. 1 день500 ₴
    Taras Lonevsky
     409 

    Готов к написанию скрипта

    Україна Львів | 12 травня о 23:40 |
  1. ставка прихована фрілансером
  2. 1 день200 ₴
    Павел Степанов
     69   0   1

    Выполню

    Україна Балаклія | 12 травня о 22:02 |
  • Ничего не получится. Во первых, на странице ссылки на новости об электромобилях никак не отличить от других (разве что искать в заголовках по ключевым словам типа електрокар). Во вторых, ссылки ведут на статьи на разных сайтах с разной вёрсткой и структурой HTML документа так что для всех сайтов нужно сделать свой парсер. Ещё, малейшие изменения в документаї с сайтов могут привести к тому что парсер перестанет работать; и такое может случаться очень часто.

  • Nikolay Prut — замовник проекту
    Поскаржитися | 13 травня о 09:49 |

    Спасибо! я сам с php дружу очень хорошо и сам понимал это, думал что может ребята смогут предложить какой-то рабочий вариант. Буду закрывать проект. Спасибо что мнение.

  • Добрый день. Не согласен с предыдущим комментарием, парсер вполне реально реализовать. Поиск новостей действительно можно реализовать только через ключевые слова, так как тегов на электромобили там нет. Однако дальше все вполне нормально, хоть и муторно.

    Первый вариант - выборка контейнеров новостей. Просто определяется основной контейнер новости для каждого сайта, это достаточно просто. По объему там до сотни источников, поэтому реально перебрать вручную за день-полтора. Никакие изменения дизайна не испортят это, так как редко кто переименовывает основные блоки. Разве что будет полная смена дизайна, но можно сделать оповещения об этом в файл.

    Второй вариант - алгоритм, который будет искать контейнер новости самостоятельно. Тоже выполнимая задача, уже есть наброски и немного тестов. Но надо протестировать на десятке-другом источников.

    Я видел ваш заказ и вполне могу с ним справиться, но сейчас дорабатываю другой, весьма объемный парсер. Дня за 3 должен закончить, в процессе проверю на работоспособность второй вариант (т.е. алгоритм поиска контейнеров). Если вы еще заинтересованы этим, то займусь этим и отпишусь о результатах в понедельник-вторник. 

  • Додати

Замовник
Nikolay Prut
Україна Київ  1   0
Проект опублікований
12 травня о 21:51
103 перегляди
Мітки
Поділитися