Explorar el Código

[fix] google news dom xpath fix

misnyo hace 7 años
padre
commit
3182ba7069
Se han modificado 2 ficheros con 58 adiciones y 8 borrados
  1. 2
    2
      searx/engines/google_news.py
  2. 56
    6
      tests/unit/engines/test_google_news.py

+ 2
- 2
searx/engines/google_news.py Ver fichero

@@ -67,8 +67,8 @@ def response(resp):
67 67
     for result in dom.xpath('//div[@class="g"]|//div[@class="g _cy"]'):
68 68
         try:
69 69
             r = {
70
-                'url': result.xpath('.//div[@class="_cnc"]//a/@href')[0],
71
-                'title': ''.join(result.xpath('.//div[@class="_cnc"]//h3//text()')),
70
+                'url': result.xpath('.//a[@class="l _PMs"]')[0].attrib.get("href"),
71
+                'title': ''.join(result.xpath('.//a[@class="l _PMs"]//text()')),
72 72
                 'content': ''.join(result.xpath('.//div[@class="st"]//text()')),
73 73
             }
74 74
         except:

+ 56
- 6
tests/unit/engines/test_google_news.py
La diferencia del archivo ha sido suprimido porque es demasiado grande
Ver fichero