№388 - ПАРСИНГ сайтов, 40+ советов для ЗАРАБОТКА на парсинге в России. Делимся опытом.

№388 - ПАРСИНГ сайтов, 40+ советов для ЗАРАБОТКА на парсинге в России. Делимся опытом.

32,317 Просмотров

Ссылки и html тэги не поддерживаются


Комментарии:

Pooya Asady
Pooya Asady - 15.09.2023 21:42

Вот тебе свезло конечно) надеюсь дальше будет так же) удачи

Ответить
Владислав Лебеденко
Владислав Лебеденко - 09.09.2023 19:08

Минус - нужна обратная связь. Ваша дополнительная прибіль.

Ответить
Alevtina Uvarova
Alevtina Uvarova - 06.09.2023 16:59

Вовремя ты переключался, красавчик) так бы мог до талого играть и все слить) А сейчас окуп славил. Класс)

Ответить
Сергей ГЛОБОВ SCAM ПОСТАРДАВШИЕ обьеденяемся !!
Сергей ГЛОБОВ SCAM ПОСТАРДАВШИЕ обьеденяемся !! - 04.09.2023 14:34

👍👍👍👍

Ответить
R Ism
R Ism - 03.09.2023 12:10

Очень интересно было послушать, спасибо за прозрачность

Ответить
Шмель Balanar
Шмель Balanar - 29.08.2023 22:34

Все верно! Удачи и процветания, коллега!

Ответить
Giuseppa Frankenfield
Giuseppa Frankenfield - 27.08.2023 08:58

Спасибо тебе за видосы. У меня сейчас тяжеловое время в жизни, но они реально помогают!)

Ответить
Zhanatan Backer
Zhanatan Backer - 23.08.2023 14:24

Я полностью доволен этим казиком. Играю здесь уже пару месяцев. Пока все гуд)🍊

Ответить
Василий Балин
Василий Балин - 12.08.2023 19:42

Здорово, конечно, слушать про OVER NINE THOUSAND рублей выручки, но что насчёт прибыли? Может, она у вас отрицательная вообще? По своему опыту знаю, что, замалчивая прибыль и заменяя её в презентации выручкой, докладчик стремится манипулировать кадрами низшего звена и кандидатами на равнозначные им должности.

Ответить
Lexseich
Lexseich - 06.08.2023 10:06

Здравствуйте, подскажите куда пойти учиться чтобы научиться парсить! И освоить эту профессию с нуля!

Ответить
Gc Code
Gc Code - 01.08.2023 08:22

Вакансии есть к вам на работу? Где посмотреть ? Язык не важен, ну экономия на серверах в зависимости от языка.

Ответить
David Hume
David Hume - 30.07.2023 16:20

Кстати вопрос, конечный продукт проектной работы у вас это исходные коды и документация или подписка на данные?

Ответить
David Hume
David Hume - 30.07.2023 16:19

Судю по комментам тема с выручкой зацепила и сейчас все ринутся парсить все подряд😀

Ответить
David Hume
David Hume - 30.07.2023 16:12

It в россии и том же снг оч слабое именно из-за слабого фундаментального образования. Там на западе студент в 18 лет написал ядро операционной системы , на которой сейчас более 90% мобильных устройств работает. Там подход к программированию совсем другой и к пониманию. На стоковерфлоу задавал один и тот же вопрос по регуляркам в русскоязычном сегменте и англоязычном. В русскоязычном даж вообще не поняли как такое сделать и ждать еще пришлось кучу времени пока кто-то ответ. А на англоязычной версии только написал через минуту описали углубленную теорию по вопросу, а еще через минуту принцип решения. Причем они это еще назвали элементарной задачей. И таких примеров масса. Да и зачем они нужны эти примеры. Нсли мы сейчас сидим не в рутубе, а в ютубе, и пишем с андроида или ios. Это к вопросу все почему не получается сделать из парсинга продукт и уйти от проектной разработки. Даже у меня уже есть нароботки для новой версии парсер-движка, где очень высокая степень автоматизации.

Ответить
Rinat Yagafarov
Rinat Yagafarov - 30.07.2023 14:40

Благодарю за видео.
Выписал для себя 20 пунктов на вооружение.

Ответить
Алексей
Алексей - 27.07.2023 16:24

Я понимаю что вы профессионал в своём деле! Но вы в серьёз считаете что proxy или всякие торы вам помогут быть анонимными? Они конечно же помогают в анонимности людям, которые нахрен никому не нужны. Но грамотному специалисту просто понадобится больше времени чтобы вычислить. Где нужно было бы 10 минут, ему понадобится 30 чтобы выследить всю цепочку. Просто как вы правильно заметили, что вы работаете в рамках правового поля, и выслеживать вас никто не будет. Ну может кроме конкурентов. Вот от них возможно анонимайзеры и защитят, ибо не у всех кулхакеров есть скилы и инструменты для подобной работы. А вот у IT криминалистов они есть)) И они Очень мощные, и Очень мощные сервера

Ответить
Антуан де Сент-Экзюпери -
Антуан де Сент-Экзюпери - - 23.07.2023 19:21

спасибо за информацию и открытость. понравилось. подписался.

Ответить
Виталий Ч
Виталий Ч - 20.07.2023 13:05

парсю более 4 лет, все что угодно, основные клиенты это конкуренты или НР

Ответить
Павел К
Павел К - 06.07.2023 08:16

шикардос, благодарен

Ответить
Mr Templ
Mr Templ - 05.07.2023 13:49

А как рассчитать цену за парсинг? Объём то может быть разный. Чтобы зарабатывать, нужно же рачитывать цену за одну строку данных.

Ответить
Николай К
Николай К - 21.06.2023 15:20

Пробовал найти подработку, по пирсингу. Бесполезно. Учень узкий рынок.

Ответить
Dmitry Kirillov
Dmitry Kirillov - 12.06.2023 20:25

А почему именно мобильные прокси, а не серверные? С какими проблемами сталкивались?
Спасибо.

Ответить
Антон Змиенко
Антон Змиенко - 12.06.2023 19:48

Хорошие у Вас видео, не боитесь говорить так как есть, спасибо! Максим подскажите, а как Вы формируете цену на парсер (или любой другой продукт) для клиента, чтобы это была аренда, а не разовая оплата, с учетом того, что это будет индивидуальная разработка под конкретного клиента и как договариваетесь об этой цене, имеется в виду как обосновываете?

Ответить
MelnikovDmitriy
MelnikovDmitriy - 27.05.2023 21:02

Очень интересные мысли. Сегодня ваш канал в рекомендациях появился и я подзалип на канале. Очень полезно. :)
Периодически тоже заказы на парсинг приходят, сталкивался с частью проблем, озвученных в видео. Но и нового для себя тоже взял. Спасибо за ваш труд по созданию полезного контента. Очень крутой канал. :)

Ответить
Виталий Смирнов
Виталий Смирнов - 27.05.2023 18:29

А что если российские сайты наконец поумнеют и будут продавать доступ к своему API? Тогда ваш бизнес просто умрёт.

Ответить
MagicMight
MagicMight - 27.05.2023 16:32

Было интересно послушать как человеку, который полтора года работал в отделе парсинга)
Некоторые вещи вызывают улыбку, но, в целом, очень здраво

Ответить
Teriys
Teriys - 26.05.2023 11:16

Интересный видос, тоже в компании много парсим и сейчас строим проект сначала для себя, потом возможно выкатим публично связан с парсером организаций. Скажите пользуетсь ли selenium или другим движком для эмуляций действий. Ведь иногда парсить приходится не в лоб html контент, а получая данные после некоторых манипуляций со страницей (например карты) . Еще есть phantomJS, но пока это не использовал. Если не секрет поделитесь хотя бы намеком. Будет полезно

Ответить
Vitaliy Yasinskiy
Vitaliy Yasinskiy - 25.05.2023 10:02

слушаю взахлеб
для статистики: тоже программист, бизнеса нет

Ответить
ᅠ
- 24.05.2023 12:45

А есть сайты которые банят по IP если не скачиваешь картинку?

Ответить
Slava L
Slava L - 22.05.2023 18:57

Парсинг это что то типа паразитического извлечения информации. Непонятно, почему порталы не борятся с парсингом.

Ответить
Кирилл Филиппов
Кирилл Филиппов - 22.05.2023 01:23

Не пойму, почему матчинг товаров не получается? Мне эта задача кажется тривиальной.

Ответить
Кирилл Филиппов
Кирилл Филиппов - 22.05.2023 01:20

Чтобы не нагружать сайт запросами чрезмерно, можно интересующую страничку с информацией получить единожды в формате html на жёсткий диск. А потом уже никуда не отправляя никакие запросы распарсить эту страничку и извлечь интересующее.

Ответить
Santy
Santy - 21.05.2023 21:01

Пишу парсеры больше года за 2к рублей, услышал про прибыль в несколько миллионов, поплохело. Пойду заварю дошик, надо все обдумать

Ответить
Костя Клинов
Костя Клинов - 21.05.2023 10:06

а как продавать 2gis, если не парсить 1 в 1? Заказчики же хотят именно ту инфу, что на сайте...

Ответить
Maksim Sergeevich
Maksim Sergeevich - 19.05.2023 17:23

Про парсеры сам думал, была идея saas сделать но по факту это такой геморрой, потому что парсеры постоянно ломаются если парсят более менее серьезный сайт и все это нужно поддерживать. Можно конечно сделать некий менеджер парсеров, но это как раз таки уже не так сложно и думаю такие решения уже существуют. Хотя в целом представляю себе гипотетически некий конструктор парсеров в котором предусмотрены компоненты которые часто используются для написания парсера, но опять же, слабо верится что можно будет добиться эффекта швейцарского ножа. Все равно придется писать кастомный код и накручивать костыли.
Я писал парсер объявлений с Яндекс.Услуг. 3 месяца проработало, а потом сломалось. Хотя парсил с таймаутом по 2 секунды между запросом и 30 минут между обходом всех страниц в выдаче, чтобы не наглеть. В итоге тот еще геморрой был. Периодически меняется api, блочат по ip, усложняют каптчу и так далее. Как будто специально хотят усложнить парсинг. Потом чтобы они меня по ip не банили перевел парсинг запросы на их же лямду. Ежемесячного бесплатного гранта хватало на парсинг))

Ответить
Maksim Sergeevich
Maksim Sergeevich - 19.05.2023 16:44

Что касается it и тем более ИИ, хочу сказать что я понял одну вещь: никогда не говорите никогда, потому что потом будет стыдно и смешно. Про ИИ уже говорили: он никогда там не сравнится с человеком, он никогда не сможет творить и тд...
На любую задачу найдется алгоритм который будет справляться с ней лучше чем человек. Потому что вычислительная мощность процессоров на порядки быстрее чем у мозга. И задержка в передаче сигнала ниже. Человек пока что алгоритмтчески опережает компьютеры в решении некоторых задач, потому что уже натренирован на их решении и архитектурно оптимизирован. Это лишь вопрос "когда", а не "будет ли".

Ответить
Oleg
Oleg - 18.05.2023 19:34

Алоха - на лоха

Ответить
Oeaoo
Oeaoo - 15.05.2023 03:08

Почему этика для Вас - это ничто?

Ответить
Алексей
Алексей - 09.05.2023 23:29

Парсить не сложно, сложно клиентов искать.

Ответить
Dmitriy Konopinskiy
Dmitriy Konopinskiy - 27.04.2023 04:02

а вы не пытались спрашивать почему они так реагируют негативно?
это же вроде не продавцы на рынке, которые думают, что цены у них нельзя снимать

Ответить
Anton N.
Anton N. - 26.04.2023 15:11

Сервисы по подбору автострахования также работают через парсинг? где по номеру авто выходит вся информация по автомобилю

Ответить
Сергей Макаренко
Сергей Макаренко - 25.04.2023 21:00

👍🔥💯💥💯🔥👍

Ответить
Кипр на мтб
Кипр на мтб - 23.04.2023 22:01

А вакансии есть? Я 2 года назад этим занимался

Ответить
Андрей Ковалёв
Андрей Ковалёв - 22.04.2023 18:01

Правильно, что сказали про таймауты между парсинговыми запросами, про перерывы и т.п. Есть сайты, которые сами предоставляют данные, дают аккаунт и они жестко указывают частоту запросов, если вы их нарушите, вас забанят. Конечно, вы можете использовать несколько прокси с несколькими аккаунтами и тянуть параллельно данные. Но я, когда занимаюсь парсингом обычного сайта, придерживаюсь такого же алгоритма, чтобы ненамеренно не заддосить. А данные, в зависимости от области, могут идти на пополнение баз знаний, для ИИ и т.п. Обычно в компании такая задача даётся одному программисту и он, имея наработки в этой теме, может быстро спарсить новый сайт, настроить регулярное обновление данных с этого сайта и т.п.

Ответить
Evgeny
Evgeny - 22.04.2023 01:16

Вот что мне нравится, так это то, что в этом видео показано, как делать бизнес чисто на айти тематике. Никакого rocket science тут нет и в помине, идея бизнеса лежит на поверхности. Любой программист ещё в юные годы пытался что-то парить. А тут ребята сделали из этого достаточно доходный и стабильный бизнес. И рассказывают все нюансы. Респект за это.

Ответить
Max Ugolnikov
Max Ugolnikov - 21.04.2023 16:40

Посмотрев одно его видео, вы уже знаете суть его 99% видео. Чувак с пустого в порожнее в каждом видео переливает. Парсинг, скликивание, нужен продукт, грант от государства на 4 млн и в айти все нет хорошо, как вы думаете. Вот про это он в каждом видео толчет воду в ступе.

Ответить
Andrey Goose
Andrey Goose - 21.04.2023 12:10

Спасибо!

Ответить
Artem Ni
Artem Ni - 21.04.2023 11:40

Интересная тема. Думаю вот как к ней грамотно подойти пока в продуктовом смысле и разогнать на физических лиц....

Ответить
Kleymor12
Kleymor12 - 21.04.2023 10:01

А если в html коде нет информации (сделано на js. - react, vie js) - тоже спарсите?

Ответить