(Извините, я часто только что Stack Overflow em Português, но на этот раз мне не помогли, и мой английский не так хорош. Но дайте мне попробовать :)
Я хочу извлечь текст, который в основном соответствует времени футбольного матча, но я не могу найти его с помощью XPath. И, честно говоря, HTML сайта не очень помогает.
Этот HTML-код:
<div class="style_title__3UbkX"> "name_team_home" "0" <span>x</span> "2" "name_team_away" </div>
Если это команды "Барселона" и "Реал Мадрид", в HTML-коде это выглядит следующим образом:
<div class="style_title__3UbkX"> "Real Madrid" "0" <span>x</span> "2" "Barcelona" </div>
А на сайте появится в центре сайта что-то типа
Реал Мадрид 0 x 2 Барселона
(я пока не могу отправлять изображения)
Но оно может быть разным в разные минуты игры, но это не имеет значения, поэтому, если команда «Реал Мадрид» забьет гол, число в кавычках изменится на 1.
Этот HTML для меня такой странный, потому что он не разделен. Вот так, это реальная копия с сайта. Я не привык использовать HTML, поэтому не знаю, нормально ли это.
Я хочу извлечь числа в кавычках, 0 и 2 для переменной, но мой код не находит эту информацию. Я пытаюсь использовать методы XPath, как в этом коде, но оба не могут найти информацию:
goals_h = driver.find_element_by_xpath(
'//*[@id="root"]/div/section/section/main/div/div/div[2]/div/div/div[2]/text()[2]').text
or
goals_h = wait.until(EC.visibility_of_element_located((By.XPATH,
'//*[@id="root"]/div/section/section/main/div/div/div[2]/div/div/div[2]/text()[2]'))).text
Мне нужно значение в text()[2]
в этом XPath.
Кто-нибудь знает, как решить эту проблему?
Заранее спасибо.
Если вы можете настроить таргетинг на элемент и получить весь текст, вы можете просто использовать синтаксический анализ строки для извлечения тех битов, которые вам нужны. Я думаю, вам придется использовать комбинацию синтаксического анализа строк и xpath, чтобы получить то, что вы хотите, так, как вы этого хотите.
Можете ли вы поделиться URL?
Ок, хорошая идея, попробую
Я не могу поделиться URL-адресом, потому что это платный сайт с логином и паролем, чтобы иметь доступ к этой статистике :(
This HTML for me is so strange because it's not separated
как<home name='Real' score='0' /> <away name='Barça' score='2' />
? Почему-то XHTML еще не стал популярным. Я не могу с уверенностью разобратьa text that is variable conform the time of the soccer game basically
- можете ли вы получить помощь, если из машинного перевода?я согласен с вами, я не очень разбираюсь в html, но этот сайт так странно ищет чужие сайты из-за него, я не знаю как, но статистика меняется каждую минуту, если счет изменился, даже будучи текстом в кавычках . Я сделал что-то с помощью Excel, но это неправильная форма, я все еще хочу что-то сделать с python