JSOUP Название извлечения ссылки?

avatar
Zeshan Fayyaz
8 апреля 2018 в 05:42
163
1
0

я использую Java и Jsoup, и часть HTML, которую я пытаюсь использовать, это

<i class="fa fa-star"></i> <a href="#taskruns" data-toggle="tab">396900 runs submitted</a>

Мне просто нужно извлечь заголовок "396900 прогонов"

Как мне это сделать? Я новичок в синтаксическом анализе и просмотре веб-страниц

.
Источник
Bogdan Lukiyanchuk
8 апреля 2018 в 06:39
2

Возможный дубликат Как извлечь тексты между тегами <p> с помощью jsoup

Ответы (1)

avatar
Tony Stark
8 апреля 2018 в 07:20
0

Вот как можно преобразовать текст в HTML.

import java.io.IOException;  
import org.jsoup.Jsoup;  
import org.jsoup.nodes.Document;  
import org.jsoup.nodes.Element;

public class WebScraping{  
    public static void main( String[] args ) throws IOException{  
            String html = "<i class='fa fa-star'></i> <a href='#taskruns' data-toggle='tab'>396900 runs submitted</a>";


            Document doc = Jsoup.parse(html); //First you have to parse html 
            Element link = doc.select("a").first(); //Then find the css selector from which you want to extract data

            String linkText = link.text(); //Then extract the text from selector

            System.out.println(linkText);
    }  
}  

Вы можете узнать больше от здесь.