Fix parsing of cartoon pages (Site changed)

Tested on version 0.b and 0.c
2012-04-25 13:33:45 +02:00 · 2012-04-25 13:33:45 +02:00 · e181fe4b89
commit e181fe4b89
parent 92d5e9ea0f
2 changed files with 21 additions and 1 deletions
--- a/modules/presseurop/pages/article.py
+++ b/modules/presseurop/pages/article.py
@ -39,3 +39,22 @@ class ArticlePage(GenericNewsPage):
        title = GenericNewsPage.get_title(self)
        title = title.split('|')[0]
        return title
+
+
+class CartoonPage(GenericNewsPage):
+    "CartoonPage object for presseurop"
+
+    def on_loaded(self):
+        self.main_div = self.document.getroot()
+        self.element_title_selector = "title"
+        self.element_author_selector = "div.profilecartoontext>p>a"
+        self.element_body_selector = "div.panel"
+
+    def get_body(self):
+        element_body = self.get_element_body()
+        return self.parser.tostring(element_body)
+
+    def get_title(self):
+        title = GenericNewsPage.get_title(self)
+        title = title.split('|')[0]
+        return title