Club para webmasters › Foros › Creación de páginas web › Escrapear datos de Directorio
- Este debate tiene 5 respuestas, 4 mensajes y ha sido actualizado por última vez el hace 1 mes, 2 semanas por
David Cuesta.
-
AutorEntradas
-
Buenos días!
Os cuento:
Estoy montando un directorio, y estoy buscando una manera de scrapear los datos de empresas de otro directorio para poder hacer las fichas de forma no manual.
(Sacar email, url, ficha con info, telefono…).
¿Sabéis de algun programa o plugin que haga esto de manera más o menos sencilla?
Muchas gracias de antemano!! 🙂
Hay una extensión que lo hace, aunque muy pronto Israel nos traerá un curso para mostrarnos cómo lo hace él jeje
La web de la extensión en cuestión es: https://webscraper.io/
La chicha…la chicha…
ganas tengo de verlo que el otro día me dejó flipao..en menos de 5min me dijo cuantos resultados me podia extraer scrapeando de un sitio que le dije….Muchas gracias David!!
Estaré muy atento a ese curso!!
He estado probando webscrapper.io y tiene muy buena pinta pero no logro sacar los datos. me falla cada dos por tres. Seguramente no lo esté haciendo correctamente. Voy a ver si me remiro el tutorial con más tranquilidad (Básicamente al ser directorios que no tienen URLs permanentes es como que no las detecta. No sé si tiene algo que ver.
¿Algún truco para limpiar el contenido scrapeado una vez lo tengo en el Excel?
El contenido de los post fue scrapeado con el formato “Type Text” y necesito eliminar las imagenes, enlaces y demás HTML que me importó.
Asi que necesito borrar en las celdas del Excel multitud de
que no quiero replicar porque tienen marca de agua.
¿Es posible eso que pido? O ¿Es mejor hacerlo manualmente? Son poco más de 100 post
Gracias
Para 100 posts creo que puedes hacerlo manualmente.
Yo para limpiezas sobre todo uso buscar y reemplazar, separar en columnas y la tecla suprimir jeje
Un saludo!
-
AutorEntradas
- Debes estar registrado para responder a este debate.