博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
jsoup
阅读量:4507 次
发布时间:2019-06-08

本文共 1101 字,大约阅读时间需要 3 分钟。

Jsoup网页数据解析技术

 

import java.io.IOException;import org.jsoup.nodes.Document;import org.jsoup.nodes.Element;import org.jsoup.select.Elements;import org.jsoup.Jsoup;public class JsoupUtil {	/**	 * @param args	 */	public static void main(String[] args) {		//初始化docment对象				Document doc=null;				String string="";				//初始化数据库id编号开始索引				int i=46258;				//(以福建省为例) 获取福建省下的各城市				String[] city={"1278","1293","1302","1308","1322","1335","1348","1360","1369"};				//(以福建省为例) 获取网页中每个城市下容纳初中的页面数				String[] page={"25","6","10","14","24","16","13","17","14"};				try {					for(int j=1;j<=city.length;j++)					{						for(int z=1;z
a"); //进行遍历 for(Element el:eles) { //数据库中福建省下的第一个市id为445,所有以445开始,初中所在城市id递增 int s=445+j-1; String str=s+""; //获取元素中的text文本 string=el.text(); //将数据打印在控制台,再复制进text文本,导入数据库 System.out.println(i+" "+string+" "+str); i++; } } } } catch (IOException e) { // TODO Auto-generated catch block e.printStackTrace(); } }}

输出

 

 

转载于:https://www.cnblogs.com/zz-cl/p/6012504.html

你可能感兴趣的文章
单片机的模块化编程
查看>>
[转]从3个IT公司里学到的57条经验
查看>>
Test指令
查看>>
c++11——可变参数模板
查看>>
from imp import * 重新加载导入的模块reload
查看>>
二叉树三种遍历调试运行版
查看>>
关于PHP、python使用的CRC32函数
查看>>
JS自动关闭授权弹窗,并刷新父页面
查看>>
c#语言几种常见循环代码
查看>>
SQL多表连接查询(详细实例)
查看>>
Http中涉及到的知识点总结
查看>>
测试计划
查看>>
adb命令记录
查看>>
Ecstore Nginx Rewrite(去掉链接中的index.php) ECSTORE 伪静态
查看>>
Dash
查看>>
BZOJ 1876: [SDOI2009]SuperGCD
查看>>
swift初学日志
查看>>
CCF真题之出现次数最多的数
查看>>
Eclipse上GIT插件_客户端配置
查看>>
使用HANA Web-based Development Workbench创建最简单的Server Side JavaScript
查看>>