В наши дни Instagram является наиболее широко используемой платформой социальных сетей, поэтому в ней доступно много полезных данных, так почему бы не получить некоторые данные из Instagram и не сделать их полезными, для этого мы должны сначала войти в систему.
что такое кукловод js?
Puppeteer – это библиотека Node, предоставляющая высокоуровневый API для управления Chrome или Chromium по протоколу DevTools.
Итак, для веб-скрейпинга в Instagram, во-первых, мы должны сделать так, чтобы наш бот вошел в систему, для этого мы будем использовать puppeteer js в качестве библиотеки веб-скрейпинга и nodejs для выполнения нашего кода JavaScript.
инициализация npm -y
теперь мы установим наши пакеты
нпм я кукольник
нпм я выражаю
нпм и корс
нпм мангуст
давайте создадим наш файл App.js, в котором мы создадим наш сервер, а затем развернем его локально, например. локальный: 3000
Сервер успешно запущен…
После развертывания сервера мы создадим наш файл маршрутов, в котором мы будем выполнять нашу маршрутизацию express.js.
давайте протестируем это сначала:
Сервер отвечает!!!
Для входа в Instagram сначала мы должны установить наш базовый URL-адрес, который перенаправит нас на страницу входа в Instagram.
Настройка базового URL
Теперь мы создадим объект Instagram, в котором мы создадим свойства, например. Страница, браузер и метод инициализации, который запустит безголовый браузер puppeteer
Создание объекта под названием Instagram
Если headless: true, вы не увидите открытия браузера Chrome, если вы хотите увидеть, какое событие запускается в браузере Chrome, вы должны сделать headless: false
Теперь мы создадим асинхронную функцию входа в систему, в которой мы будем выполнять все наши события входа в систему.
теперь мы будем переходить к базовому URL.
Переход к базовому URL.
выполнив проверку элемента, мы можем получить HTML этого конкретного элемента
Проверьте элемент панели ввода имени пользователя и пароля.
мы используем функцию ‹‹.page.type›› для выполнения события ввода на панели имени пользователя и пароля.
После ввода нашего имени пользователя и пароля мы должны выполнить событие click на кнопке входа в систему.
Копирование селектора кнопки входа
для нажатия на это мы должны получить селектор кнопки входа в систему
Сначала перейдите к html кнопки, выполнив проверку элемента на ней.
затем щелкните левой кнопкой мыши кнопку входа в систему Html, затем перейдите к копированию, затем выберите селектор копирования.
теперь мы будем выполнять событие клика.
Нажато Событие выполнено
мы использовали событие .page.click для выполнения нажатия на кнопку или чего-либо еще.
Давайте бежать сейчас.
Войти в Инстаграм
Итак, мы успешно вошли в систему.
если вы видите какое-либо другое сообщение после входа в систему, например. Сохранить информацию и т. д., просто скопируйте селектор кнопки и выполните событие щелчка по нему, как мы делали раньше,
Пожалуйста, введите await, loadDOMcontent, networkidle2 или networkidle0. Все это позволит контенту или странице полностью загрузиться перед запуском какого-либо события.
Ожидание полного выполнения навигации.