Python Scrappy Xpath - невозможно извлечь выбранные данные из таблицы
-1 mohd [2017-11-04 14:33:00]
Я пытаюсь извлечь все данные прилагаемой таблицы, сгруппированные по стране, которая содержит название страны, http://applications.slbfe.lk/jobbank/jsearchdisplay_an_m.asp?an=1712, которую я пытался выполнить
response.xpath('//div').xpath('.//tr[@bgcolor="#CCCCCC"]/td/b/font/text()').extract()
здесь я выбираю название страны, но как я могу получить все данные под таким названием страны, как Утвержденная вакансия для каждой страны
python xpath web-scraping scrapy beautifulsoup
1 ответ
1 SIM [2017-11-04 23:12:00]
Поскольку вы не указали свой код, как вы написали, чтобы проанализировать табличные данные, я дал здесь демо, чтобы дать вам представление о том, как вы можете анализировать выборочные данные из таблицы. Просто дергайте селекторов в своем коде, как я сделал здесь:
from bs4 import BeautifulSoup
import requests
link = "http://applications.slbfe.lk/jobbank/jsearchdisplay_an_m.asp?an=1712"
res = requests.get(link).text
soup = BeautifulSoup(res,"lxml")
table = soup.select("table")[3]
for items in table.select('tr'):
item_name = [' '.join(item.text.split()) for item in items.select('td')[:3]] #this is where you change the index which column to parse
print(' '.join(item_name))
Частичные результаты:
Details Approved Vacancies Available Vacancies
Kuwait
House Boy 10 10
House Boy 10 8
House Cook - Male 10 10
House Cook - Male 10 8