Entrar a una pagina web con Python y Selenium

En esta entrada veremos cómo entrar a una pagina web con Python y Selenium. Este módulo nos permite automatizar tareas con nuestro explorador, de forma que podemos interactuar con el explorador simulando tareas que harían un usuario final. Aparte de la instalación del módulo, se requiere un driver pero eso lo veremos más adelante.

Instalar el módulo Selenium

La instalación la haremos con pip desde una terminal.

pip install selenium

Para verificar que el módulo se instaló sin problemas, abramos un interprete en modo interactivo e importemos el módulo.

import selenium

Si quieres darte una vuelta por la documentación oficial, aquí te dejo el enlace.

Instalar el driver del explorador

Adicionalmente debemos instalar el driver del explorador con el que queramos trabajar. En la documentación oficial encontraras los enlaces para descargar los drivers de distintos exploradores. Debemos descargar el driver para la versión de explorador que tengamos instalada.

Los ejemplos de esta entrada se harán con Chrome. Para conocer la versión de Chrome que tienes instalada, abre un explorador y ve a al botón de menú en la esquina superior derecha. Selecciona «Ayuda» y después «Información de Google Chrome». Se abrirá una nueva pestaña con los detalles de la versión que tienes. Ahora busca el driver de esa versión y descárgalo.

Llamaremos contantemente al driver por lo que en cada programa tendremos que especificar la ruta en la que se encuentra. Otra opción es crear una ubicación especifica para los driver y añadir esa ruta a la variable de entorno path.

En Windows, puedes añadir la ruta a la variable path colocando lo siguiente en una línea de comandos con derechos de Administrador. La ruta que coloques debe ser la que contiene el driver que descargaste.

setx /m path "%path%;C:\Python\chromeWebDriver"

Es posible que se requiera un reinicio de tu equipo para que tome los cambios.

Abrir una pagina web

Hemos creado una página con la que haremos pruebas, el enlace es el siguiente:

https://proyectosconpython.com/pagina-de-pruebas

Después de varios preparativos, ahora si ya estamos listos para abrir nuestra primera página.

from selenium import webdriver
driver = webdriver.Chrome()

O si no pudiste agregar la ruta del driver a la variable de entorno path, puedes colocar la ruta del driver directo en el código, en mi caso quedaría de la siguiente manera:

from selenium import webdriver
driver = webdriver.Chrome("C:\Python\chromeWebDriver\chromedriver")

En este punto habrás conseguido abrir un explorador pero sin mostrar información, vamos a abrir la pagina de pruebas:

driver.get("https://proyectosconpython.com/pagina-de-pruebas")

Ahora si veremos la información disponible de la pagina, de esta forma podemos abrir las paginas que queramos. Por ultimo, recuerda cerrar el explorador.

driver.close()

Hasta aquí dejaremos esta entrada sobre cómo cómo entrar a una pagina web con Python y Selenium. Próximamente tendremos mas entradas para conocer mas sobre este módulo, apenas vamos comenzando. Déjame en los comentarios, ¿qué te ha parecido esta entrada? ¿Ya habías utilizado Selenium?

¡No olvides suscribirte a nuestro boletín!

¡No enviamos spam! Lee más en nuestra política de privacidad