Python proporciona varias formas de descargar archivos de Internet. Esto se puede hacer a través de HTTP usando el paquete urllib o la biblioteca de solicitudes. Este tutorial tratará sobre cómo usar estas bibliotecas para descargar archivos desde URL usando Python.
La biblioteca de solicitudes es una de las bibliotecas más populares de Python. Las solicitudes le permiten enviar Solicitudes HTTP / 1.1 sin la necesidad de agregar manualmente cadenas de consulta a sus URL, o codificar de forma sus datos POST.
Con la biblioteca de solicitudes, puede realizar muchas funciones, incluyendo:
Lo primero que debes hacer es instalar la biblioteca y es tan simple como:
solicitudes de instalación de pip
Para probar si la instalación ha sido exitosa, puede hacer una prueba muy sencilla en su intérprete de python simplemente escribiendo:
solicitudes de importación
Si la instalación ha sido exitosa, no habrá errores..
Las solicitudes HTTP incluyen:
Hacer solicitudes es muy fácil como se ilustra a continuación..
las solicitudes de importación req = requests.get ("http://www.google.com")
El comando anterior obtendrá la página web de Google y almacenará la información en elreq
variable. Entonces podemos ir a obtener otros atributos también.
Por ejemplo, para saber si la búsqueda de la página web de Google fue exitosa, consultaremos el código de estado.
importar solicitudes req = requests.get ("http://www.google.com") req.status_code 200 # 200 significa una solicitud exitosa
¿Qué pasa si queremos averiguar el tipo de codificación de la página web de Google??
req.codificación ISO-8859-1
También es posible que desee saber el contenido de la respuesta..
req.text
Esto es solo un contenido truncado de la respuesta..
'