Публикации с тегом “html”

Разбор сайта Python + Grab

Всем привет! Давно наша команда ничего не писала в блог. Сейчас правила и стиль написания немного упростятся, поэтому мы планируем написать еще много мелких, но интересных публикаций в ближайшем будущем. Сегодня я хочу рассказать вам об одной из самых интересных тем — парсинг сайтов. Делать мы это будем на моем любимом скриптовом языке Python. Заинтересовавшихся прошу под кат.

Читать далее >

Скрипт накрутки рейтинга (голосов)

Продолжим написание постов по использованию Python и UrlLib. Может, плохо рассказывать о таких вещах как накрутке, но это весьма интересно. Опять же не забуду напомнить, что всё это исключительно в учёбных целях!

Что я рассмотрю в этой статье:

  • Авторизация на сайте через UrlLib
  • Работа с Cookies в UrlLib
  • Составление POST-запросов
  • Разбор html через Beautiful Soup
  • Загрязнение совести

Читать далее >

Работа с UrlLib. Скрипт накрутки рекламы

Python LogoПриветствие! Сегодня напишем программу по накручиванию рекламы, которая сможет скрывать свои реальные данные (ip, user-agent, гео-положение). Хочу заметить, что всё это исключительно в учёбных целях.

В этой статье я разберу:

  • UrlLib, базовая информация
  • Подмена user-agent
  • Proxy в UrlLib
  • Анонимизация через Tor
  • Выборка элементов из массива
  • Использование библиотеки Beautiful Soup для работы с html
  • Работа с DOM в Python

Читать далее >