move GenericBackend and GenericArticle modules into weboob.tools.capabilities.messages

2011-05-11 11:54:33 +02:00 · 2011-05-11 11:54:33 +02:00 · 72850a0a79
commit 72850a0a79
parent e0cb6d6dfe
18 changed files with 22 additions and 312 deletions
--- a/weboob/tools/genericArticle.py
+++ b/weboob/tools/genericArticle.py
@ -1,142 +0,0 @@
-# -*- coding: utf-8 -*-
-
-# Copyright(C) 2011  Julien Hebert
-#
-# This file is part of weboob.
-#
-# weboob is free software: you can redistribute it and/or modify
-# it under the terms of the GNU Affero General Public License as published by
-# the Free Software Foundation, either version 3 of the License, or
-# (at your option) any later version.
-#
-# weboob is distributed in the hope that it will be useful,
-# but WITHOUT ANY WARRANTY; without even the implied warranty of
-# MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the
-# GNU Affero General Public License for more details.
-#
-# You should have received a copy of the GNU Affero General Public License
-# along with weboob. If not, see <http://www.gnu.org/licenses/>.
-
-from weboob.tools.browser import BasePage
-from weboob.tools.browser import BrokenPageError
-from lxml.etree import Comment
-
-
-def try_remove(parser, base_element, selector):
-    try :
-        base_element.remove(parser.select(base_element, selector, 1 ))
-    except (BrokenPageError, ValueError):
-        pass
-
-
-def try_drop_tree(parser, base_element, selector):
-    try:
-        parser.select(base_element, selector, 1).drop_tree()
-    except BrokenPageError:
-        pass
-
-def remove_from_selector_list(parser, base_element, selector_list):
-    for selector in selector_list:
-        base_element.remove(parser.select(base_element, selector, 1))
-
-
-def try_remove_from_selector_list(parser, base_element, selector_list):
-    for selector in selector_list:
-        try_remove(parser, base_element, selector)
-
-def drop_comments(base_element):
-    for comment in base_element.getiterator(Comment):
-        comment.drop_tree()
-
-
-
-class NoAuthorElement(BrokenPageError):
-    pass
-
-class NoBodyElement(BrokenPageError):
-    pass
-
-class NoTitleException(BrokenPageError):
-    pass
-
-class NoneMainDiv(AttributeError):
-    pass
-
-class Article(object):
-    author = u''
-    title = u''
-
-    def __init__(self, browser, _id):
-        self.browser = browser
-        self.id = _id
-        self.body = u''
-        self.url = u''
-        self.date = None
-
-class GenericNewsPage(BasePage):
-    __element_body = NotImplementedError
-    __article = Article
-    element_title_selector  = NotImplementedError
-    main_div = NotImplementedError
-    element_body_selector = NotImplementedError
-    element_author_selector = NotImplementedError
-
-    def get_body(self):
-        return self.parser.tostring(self.get_element_body())
-
-    def get_author(self):
-        try:
-            return self.get_element_author().text_content().strip()
-        except (NoAuthorElement, NoneMainDiv):
-            #TODO: Mettre un warning
-            return self.__article.author
-
-    def get_title(self):
-        try :
-            return self.parser.select(
-                self.main_div,
-                self.element_title_selector,
-                1).text_content().strip()
-        except AttributeError:
-            if self.main_div == None:
-                #TODO: Mettre un warning
-                return self.__article.title
-            else:
-                raise
-        except BrokenPageError:
-            try :
-                self.element_title_selector = "h1"
-                return self.get_title()
-            except BrokenPageError:
-                raise NoTitleException("no title on %s" % (self.browser))
-
-    def get_element_body(self):
-        try :
-            return self.parser.select(self.main_div, self.element_body_selector, 1)
-        except BrokenPageError:
-            raise NoBodyElement("no body on %s" % (self.browser))
-        except AttributeError:
-            if self.main_div == None:
-                raise NoneMainDiv("main_div is none on %s" % (self.browser))
-            else:
-                raise
-
-    def get_element_author(self):
-        try:
-            return self.parser.select(self.main_div, self.element_author_selector, 1)
-        except BrokenPageError:
-            raise NoAuthorElement()
-        except AttributeError:
-            if self.main_div == None:
-                raise NoneMainDiv("main_div is none on %s" % (self.browser))
-            else:
-                raise
-
-    def get_article(self, _id):
-        __article = Article(self.browser, _id)
-        __article.author = self.get_author()
-        __article.title  = self.get_title()
-        __article.url    = self.url
-        __article.body   = self.get_body()
-
-        return __article