NodeJS Парсинг на ноде

Kecer

Участник
Автор темы
241
11
Ку, хочу сделать некий помощник для администрации аризоны, суть такая условно говоря у меня есть раздел жалоб

1676555129739.png


Как можно парсить название темы, и ссылку на тему и выводить её в console.log, и при появление новой темы скрипт будет автоматически проверять и выводить название темы и ссылку на новую тему в console.log. Условно говоря я запускаю бота, и при создание новой темы, бот будет выводить эту тему в console.log. Буду очень благодарен за помощь, ибо реализовать хочу достаточно давно
 

neverlane

t.me/neverlane00
Друг
997
1,132
1. нужен обход ReactLab для ноды (потому что форум защищён им)
2. каждые 5 секунд получать страничку жалоб и потом парсить её
3. после парсинга сверяешь темы: если какой-то до этого не было - это новая тема и ты её выводишь в console.log
 

Kecer

Участник
Автор темы
241
11
1. нужен обход ReactLab для ноды (потому что форум защищён им)
2. каждые 5 секунд получать страничку жалоб и потом парсить её
3. после парсинга сверяешь темы: если какой-то до этого не было - это новая тема и ты её выводишь в console.log
Я в принцепи это почти реализовал без обхода, через куки и агент юзер, через rss, и парсил через xml парсер, но возникла следующая проблема, при парсинге всё казалось бы работает, я сделал проверку на ссылку последней темы, но когда допустим какой-то человек отвечает в старой теме, тема перекидывается на первое место, и бот её всё ровно парсит, в rss очень мало ключей за которые можно зацепится, может подскажешь как можно ещё, пытался парсить html и по селектору парсить, но когда я паршу через тот же axios, у меня не весь html странички форума парсится, криво вообщем

1. нужен обход ReactLab для ноды (потому что форум защищён им)
2. каждые 5 секунд получать страничку жалоб и потом парсить её
3. после парсинга сверяешь темы: если какой-то до этого не было - это новая тема и ты её выводишь в console.log
И ещё если не трудно, хотя бы какой-то пример сможешь показать как использовать твою либу которая позволяет обходить защиту форума, и тот же axios, или может посоветуешь какой-то другой парсер
 
Последнее редактирование: