Как восстановить свои темы/трипы и другой контент со старой лабы

Mister Old · 07.04.24

Zver2019 сказав(ла):
гугл кеш теперь только прописывать самому нужно, в выдаче нет уже ссылки на кэш

а как прописать для бинга? У меня нет кнопки как на скрине

HoodMood сказав(ла):
та ты заипесся бро. прикинь скока проксей надо, обхода капч, вычислить как быстро будут банить/давать отдохнуть и архитекруа кеша не структурированная, то есть надо продумать еще как древо парсить. заеб кароче конкретный. писал парсер каталога заибался обходить ограничения, а тут будет позаебистей на порядки, даже начинать не охота

Повідомлення об'єднано автоматично: 07.04.24

LinuxSU а, если ты за чисто репорты, и у тебя есть ресурсы на поиграться то можешь попробовать

какая не структурированная. ты че. берешь страницу просто подставдляешь в циклеhttps://labrc.name/forums/trip-reporty.178/page-* открываешь через пюппитр. пармсишь ссылкки на темы. - парсишь в цикле странички с темами

HoodMood · 07.04.24

LinuxSU сказав(ла):
какие капчи ты шо) зачем? кеш без капч открывается)

ты работал с парсингом объемов данных? а там более с поисковиков... тебя ждет немало сюрпризов, когда система поймет что ты ботом это делаешь. даже в ручную слишком много запросов - дают блок на время и как заметил MrDewitt приходится менять ip

Повідомлення об'єднано автоматично: 07.04.24

LinuxSU сказав(ла):
а как прописать для бинга? У меня нет кнопки как на скрине

открой первую страницу, она обновлялась за время. там скрины, где кнопка кеша в бинге

LinuxSU сказав(ла):
какая не структурированная. ты че. берешь страницу просто подставдляешь в циклеhttps://labrc.name/forums/trip-reporty.178/page-* открываешь через пюппитр. пармсишь ссылкки на темы. - парсишь в цикле странички с темами

я про общую архитктуру кеша. позже уточнил, что на примере конкретной папки - да, можно работать. но тут ряд ограничений придется обходить(прокси запас как минимум надо иметь, а еще бы вычислить тайминги блоков, чтобы снизить расходы)

SoITK№Uᵗᴬ · 07.04.24

LinuxSU сказав(ла):
Это каким интересно законам?)

Точно не помню как звучит.
Ничто не может появиться из ниоткуда и исчезнуть. Происходит трансформация из одной формы в другую.

Mister Old · 07.04.24

Booble ᵘᵃ сказав(ла):
Точно не помню как звучит.
Ничто не может появиться из ниоткуда и исчезнуть. Происходит трансформация из одной формы в другую.

вообщек то по законаим физитки все стремится к энтропии.

SoITK№Uᵗᴬ · 07.04.24

LinuxSU сказав(ла):
вообщек то по законаим физитки все стремится к энтропии.

Теоретически.

HoodMood · 07.04.24

Не флудим господа) давайте по теме

MrDewitt · 07.04.24

HoodMood сказав(ла):
Не флудим господа) давайте по теме

по теме, стянул с помощью wayback-machine-downloader все до чего дотянулся с web.archive.org. Ничего интересного. В кеше гугл/бинг гораздо лучше искать

paragon_ · 07.04.24

Почитал вашу переписку. Парксить прокси, прописал...И решил хуй забить на свои 25 репортов нещасных

MrDewitt · 07.04.24

paragon_ сказав(ла):
Почитал вашу переписку. Парксить прокси, прописал...И решил хуй забить на свои 25 репортов нещасных

дай ключевые слова, может помогу найти

HoodMood · 07.04.24

MrDewitt сказав(ла):
по теме, стянул с помощью wayback-machine-downloader все до чего дотянулся с web.archive.org. Ничего интересного. В кеше гугл/бинг гораздо лучше искать

да, там только структура полезна по сути. наводки на ключевые ссылки для поиска в кеше гугл/бинг

paragon_ · 07.04.24

MrDewitt сказав(ла):
дай ключевые слова, может помогу найти

Так а какие могут быть слова. Трип-репорт, соль, шишки, ешки, фен бро

MrDewitt · 07.04.24

paragon_ сказав(ла):
Так а какие могут быть слова. Трип-репорт, соль, шишки, ешки, фен бро

Название, если помнишь. Ок будет время гляну. Но там без картинок

HoodMood · 07.04.24

MrDewitt сказав(ла):
Название, если помнишь. Ок будет время гляну. Но там без картинок

просто трип и вещество так себе ключевые, ибо юзер мог комментить кучу всего и это вылазит мешая искать. а вот если к этому добавить никнейм селлера или назание магазина то результаты гораздо меньше воды имеют

MrDewitt · 07.04.24

paragon_ сказав(ла):
Так а какие могут быть слова. Трип-репорт, соль, шишки, ешки, фен бро

в ЛС кину парочку

HoodMood · 07.04.24

Прошелся по репортам Dr GONZO , и очень много из того что он вспомнил удалось с легкостью восстановить!

Он очень грамотно сформулировал примерные названия своих репортов и имена селлеров, а дальше я просто подставлял его никнейм и иногда шуршал по соседним темам или по главной теме селлера чтобы посмотреть ссылки на репорты тестеров

Mister Old · 07.04.24

HoodMood сказав(ла):
ты работал с парсингом объемов данных? а там более с поисковиков... тебя ждет немало сюрпризов, когда система поймет что ты ботом это делаешь. даже в ручную слишком много запросов - дают блок на время и как заметил MrDewitt приходится менять ip

Повідомлення об'єднано автоматично: 07.04.24

открой первую страницу, она обновлялась за время. там скрины, где кнопка кеша в бинге

я про общую архитктуру кеша. позже уточнил, что на примере конкретной папки - да, можно работать. но тут ряд ограничений придется обходить(прокси запас как минимум надо иметь, а еще бы вычислить тайминги блоков, чтобы снизить расходы)

а есть апи на получение бесплатных проксиков?)

paragon_ · 07.04.24

MrDewitt сказав(ла):
в ЛС кину парочку

Спасибо бро за заботу, а то тяжело быть трохи деревянным)

Dr GONZO · 07.04.24

HoodMood сказав(ла):
Прошелся по репортам Dr GONZO , и очень много из того что он вспомнил удалось с легкостью восстановить!

Он очень грамотно сформулировал примерные названия своих репортов и имена селлеров, а дальше я просто подставлял его никнейм и иногда шуршал по соседним темам или по главной теме селлера чтобы посмотреть ссылки на репорты тестеров

Премного благодарен тебе за помощь! Сам бы не разобрался. Дремучий лес..

Mister Old · 07.04.24

HoodMood сказав(ла):
просто трип и вещество так себе ключевые, ибо юзер мог комментить кучу всего и это вылазит мешая искать. а вот если к этому добавить никнейм селлера или назание магазина то результаты гораздо меньше воды имеют

я не трипыч хочу воссатновить. А культурное наследие - творчество сектантов. там именно и цель в том, чтобы обойти все)

HoodMood · 07.04.24

LinuxSU сказав(ла):
а есть апи на получение бесплатных проксиков?)

их много в сети, вопрос тока прочекать рабочие. но я тебе заранее говорю - тема с слишком большой вероятностью не стоит труда бро... просто представь себе, что новые репорты заходили с начала и смещались по страницам при появлении новых. поисковики такой контент не любят, он слишком динамичен чтобы его кешировать. Прикинь, что на первой странице скока смен репортов - ты думашь они бы стали это все кешировать?... задумайся над архитектурой такого поиска

Как восстановить свои темы/трипы и другой контент со старой лабы

Посвященный

Посвященный

Мудрец

Посвященный

Мудрец

Посвященный

Сектант

У меня не покупать!

Сектант

Посвященный

У меня не покупать!

Сектант

Посвященный

Сектант

Посвященный

Посвященный

У меня не покупать!

Конфуций

Посвященный

Посвященный

Схожі теми