Aprenda Python: Web Scraping com Projeto Real

POR CÓDIGO DA HORA • 23 ABRIL 2025

O que é Web Scraping?

Web scraping é a técnica de extração automatizada de dados de páginas da web. É amplamente usada para análise de preços, monitoramento de notícias, coleta de dados públicos e automação de tarefas de inteligência de mercado.

Passo 1 – Criando o Projeto no VSCode

Abra o VSCode, crie uma nova pasta chamada scraping-livros e um arquivo chamado scraping.py.

Passo 2 – Criando e Ativando um Ambiente Virtual

Ambientes virtuais isolam as bibliotecas do seu projeto:

python -m venv venv
# No Windows: .\\venv\\Scripts\\activate
# No Linux: source venv/bin/activate

Passo 3 – Instalando Bibliotecas

pip install requests beautifulsoup4

Código do Projeto Completo

import requests
from bs4 import BeautifulSoup

url = "https://codigodahr.github.io/scraping-exemplo/"
response = requests.get(url)

if response.status_code == 200:
    soup = BeautifulSoup(response.text, 'html.parser')
    categorias = soup.find_all('div', class_='categoria')
    for categoria in categorias:
        titulo_categoria = categoria.find('h2').text.strip()
        print(f"\\n{titulo_categoria}")
        livros = categoria.find_all('li')
        for livro in livros:
            titulo = livro.find('span', class_='titulo').text.strip()
            autor = livro.find('span', class_='autor').text.strip()
            print(f" - {titulo} (Autor: {autor})")
else:
    print("Erro ao acessar o site:", response.status_code)