Web scraping con C#

Posted on January 10, 2012 by

AleBanzas Posted in Programacion — 1 Comment ↓

Web Scraping es un proceso de recopilación de información de forma automática a partir de la Web. En este post vamos a ver como obtener información desde otro sitio automáticamente.

Como ejemplo vamos a tomar la siguiente página:

http://webcams.iberocruceros.com/FleetMonitor/WebCam.aspx?ShipCode=MI

La página pertenece a la empresa Ibero Cruceros, y muestra, información sobre el estado y ubicación de uno de sus barcos (Grand Mistral).

Lo que vamos a hacer es tomar las coordenadas del barco para mostrarlas en un mapa usando la API de Google Maps, y además agregar en el mapa otras informaciones que se pueden obtener de la misma pagina (velocidad del barco, rumbo, dirección del viento, temperatura, humedad, presión, y velocidad del viento).

Ejemplo del DOM (el pedazo DOM que nos interesa para lo que vamos a hacer).

<ul class=”shipInfo”>

<li class=”speed”>Velocidad:18.4 Knots</li>

<li class=”heading”>Rumbo:51.0°</li>

<li class=”latitude”>Latitud:34°7’35” S</li>

<li class=”longitude”>Longitud:52°55’57” W</li>

<li class=”winddirection”>Direcciòn del vento:321.6°</li>

<li class=”temperature”>Temperatura:21.0°C</li>

<li class=”humidity”>Humedad:66.1%</li>

<li class=”pressure”>Presiòn:1012.4 hPa</li>

<li class=”windspeed”>Velocidad del viento:16.7 Km/h</li>

</ul>

Para hacer scraping en C#, creamos un nuevo proyecto web, y agregamos referencias a ScrapySharp, y a HtmlAgilityPack (podemos agregarlas directamente desde NuGet).

Armé una clase “Scraper” que devuelve el DOM de un sitio que nosotros le solicitamos (Uri), para luego, usando selectores del tipo CSS, obtener el/los elemento/s del DOM que estemos buscando.

Ejemplo de uso:

HtmlNode html = new Scraper().GetNodes(new Uri(“http://webcams.iberocruceros.com/FleetMonitor/WebCam.aspx?ShipCode=MI”));

var lat = html.CssSelect(“li.latitude span.right”).FirstOrDefault().InnerText;
var lon = html.CssSelect(“li.longitude span.right”).FirstOrDefault().InnerText;

En el ejemplo se puede ver como obtener la latitud y longitud de la ubicación del barco. De la misma forma podríamos obtener mas información.

Dejo la implementación del método GetNodes de la clase Scraper:

public HtmlNode GetNodes(Uri url)
{
// Create the WebRequest for the URL we are using
var req = WebRequest.Create(url);

// Get the stream from the returned web response
var stream = new StreamReader(req.GetResponse().GetResponseStream());

var htmlDocument = new HtmlDocument();
htmlDocument.Load(stream);
return htmlDocument.DocumentNode;
}

Tagged with: c#, programacion, web scraping

One comment on “Web scraping con C#”

Rhadimer says:

January 16, 2016 at 3:38 pm

Hola este post es muy interesante. Me gustaria hacer lo mismo pero en una aplicación Windows forms de escritorio usando c#. Necesito hacer esto por favor ayudame.

Reply

Web scraping con C#

One comment on “Web scraping con C#”

Leave a Reply to Rhadimer Cancel reply

ABOUT ME…

Web scraping con C#

One comment on “Web scraping con C#”

Leave a Reply to Rhadimer Cancel reply

ABOUT ME…

Tags