Python Scrappy Xpath - невозможно извлечь выбранные данные из таблицы

-1 mohd [2017-11-04 14:33:00]

Я пытаюсь извлечь все данные прилагаемой таблицы, сгруппированные по стране, которая содержит название страны, http://applications.slbfe.lk/jobbank/jsearchdisplay_an_m.asp?an=1712, которую я пытался выполнить

response.xpath('//div').xpath('.//tr[@bgcolor="#CCCCCC"]/td/b/font/text()').extract()

здесь я выбираю название страны, но как я могу получить все данные под таким названием страны, как Утвержденная вакансия для каждой страны

table

python xpath web-scraping scrapy beautifulsoup


1 ответ


1 SIM [2017-11-04 23:12:00]

Поскольку вы не указали свой код, как вы написали, чтобы проанализировать табличные данные, я дал здесь демо, чтобы дать вам представление о том, как вы можете анализировать выборочные данные из таблицы. Просто дергайте селекторов в своем коде, как я сделал здесь:

from bs4 import BeautifulSoup
import requests

link = "http://applications.slbfe.lk/jobbank/jsearchdisplay_an_m.asp?an=1712"
res = requests.get(link).text
soup = BeautifulSoup(res,"lxml")
table = soup.select("table")[3]
for items in table.select('tr'):
    item_name = [' '.join(item.text.split()) for item in items.select('td')[:3]] #this is where you change the index which column to parse
    print(' '.join(item_name))

Частичные результаты:

Details Approved Vacancies Available Vacancies
Kuwait
House Boy 10 10
House Boy 10 8
House Cook - Male 10 10
House Cook - Male 10 8