Added an example of HTML parsing with libxml2 to parse a Google movies page.
[maevies] / examples / gmovies.c
1 /* Parses a Google movies web (previously downloaded on a file)
2  * using libxml2. Examples of Google movies web files can be
3  * found in the gmovies_data directory.
4  */ 
5
6 #include <libxml/HTMLparser.h>
7 #include <libxml/tree.h>
8 #include <stdio.h>
9
10
11 int main (int argc, char ** argv)
12 {
13
14         if (argc != 2) {
15                 printf("usage: gmovies file.html\n");
16                 exit(-1);
17         }
18
19         htmlDocPtr doc = htmlReadFile(argv[1], "UTF-8", 0);
20
21         xmlNodePtr root = xmlDocGetRootElement(doc);//html
22
23         xmlNodePtr body = xmlLastElementChild(root);//body
24
25         xmlNodePtr elem = xmlFirstElementChild(body);
26         int i =0;
27         for(i=0; i<6; i++) {
28                 elem = xmlNextElementSibling(elem);
29         }
30
31         //tbody
32         elem = xmlFirstElementChild(elem); //tr
33         elem = xmlFirstElementChild(elem); //td
34         elem = xmlFirstElementChild(elem); //a
35         elem = xmlFirstElementChild(elem); //b
36
37         printf("First theater = %s\n", xmlNodeGetContent(elem));
38
39 }