国产成人精品久久免费动漫-国产成人精品天堂-国产成人精品区在线观看-国产成人精品日本-a级毛片无码免费真人-a级毛片毛片免费观看久潮喷

您的位置:首頁(yè)技術(shù)文章
文章詳情頁(yè)

java讀取html文件,并獲取body中所有的標(biāo)簽及內(nèi)容的案例

瀏覽:49日期:2022-08-26 17:07:00

這里的獲取的是html文件中body中的所有標(biāo)簽以及內(nèi)容

package com.lmt.service.file;import java.io.BufferedReader;import java.io.File;import java.io.FileInputStream;import java.io.InputStreamReader;import java.io.Reader;import org.springframework.stereotype.Component;import com.lmt.config.UrlConstants;@Componentpublic class ParseFile { /** * 解析html文件 * @param file * @return */ public String readHtml(File file){ String body = ''; try { FileInputStream iStream = new FileInputStream(file); Reader reader = new InputStreamReader(iStream); BufferedReader htmlReader = new BufferedReader(reader); String line; boolean found = false; while (!found && (line = htmlReader.readLine()) != null) {if (line.toLowerCase().indexOf('<body') != -1) { // 在<body>的前面可能存在空格 found = true;} } found = false; while (!found && (line = htmlReader.readLine()) != null) {if (line.toLowerCase().indexOf('</body') != -1) { found = true;} else { // 如果存在圖片,則將相對(duì)路徑轉(zhuǎn)換為絕對(duì)路徑 String lowerCaseLine = line.toLowerCase(); if (lowerCaseLine.contains('src')) {//這里是定義圖片的訪問(wèn)路徑 String directory = 'D:/test'; // 如果路徑名不以反斜杠結(jié)尾,則手動(dòng)添加反斜杠 /*if (!directory.endsWith('')) { directory = directory + ''; }*/ // line = line.substring(0, lowerCaseLine.indexOf('src') + 5) + directory + line.substring(lowerCaseLine.indexOf('src') + 5); /*String filename = extractFilename(line); line = line.substring(0, lowerCaseLine.indexOf('src') + 5) + directory + filename + line.substring(line.indexOf(filename) + filename.length()); */ // 如果該行存在多個(gè)<img>元素,則分行進(jìn)行替代 String[] splitLines = line.split('<imgs+'); // <img后帶一個(gè)或多個(gè)空格 // 因?yàn)閖ava中引用的問(wèn)題不能使用for each for (int i = 0; i < splitLines.length; i++) { if (splitLines[i].toLowerCase().startsWith('src')) {splitLines[i] = splitLines[i].substring(0, splitLines[i].toLowerCase().indexOf('src') + 5) + directory + splitLines[i].substring(splitLines[i].toLowerCase().indexOf('src') + 5); } }// 最后進(jìn)行拼接 line = ''; for (int i = 0; i < splitLines.length - 1; i++) { // 循環(huán)次數(shù)要-1,因?yàn)樽詈笠粋€(gè)字符串后不需要添加<img line = line + splitLines[i] + '<img '; } line = line + splitLines[splitLines.length - 1]; } body = body + line + 'n';} } htmlReader.close(); // System.out.println(body); } catch (Exception e) { e.printStackTrace(); } return body; } /** * * @param htmlLine 一行html片段,包含<img>元素 * @return 文件名 */ public static String extractFilename(String htmlLine) { int srcIndex = htmlLine.toLowerCase().indexOf('src='http://www.cgvv.com.cn/bcjs/); if (srcIndex == -1) { // 圖片不存在,返回空字符串 return ''; } else { String htmlSrc = htmlLine.substring(srcIndex + 4); char splitChar = ’'’; // 默認(rèn)為雙引號(hào),但也有可能為單引號(hào) if (htmlSrc.charAt(0) == ’’’) {splitChar = ’’’; } String[] firstSplit = htmlSrc.split(String.valueOf(splitChar)); String path = firstSplit[1]; // 第0位為空字符串 String[] secondSplit = path.split('[/]'); // 匹配正斜杠或反斜杠 return secondSplit[secondSplit.length - 1]; } } }

補(bǔ)充知識(shí):StandardEngine[Catalina].StandardHost[localhost].StandardContext[]

jar包沒(méi)有正確導(dǎo)入

1、在 build path 中添加

java讀取html文件,并獲取body中所有的標(biāo)簽及內(nèi)容的案例

2、如果這里不添加在編譯的時(shí)你的jar包將不會(huì)被導(dǎo)入

java讀取html文件,并獲取body中所有的標(biāo)簽及內(nèi)容的案例

3、如果依然沒(méi)有成功請(qǐng)刪除user jar包重新導(dǎo)入

以上這篇java讀取html文件,并獲取body中所有的標(biāo)簽及內(nèi)容的案例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持好吧啦網(wǎng)。

標(biāo)簽: Java
主站蜘蛛池模板: 欧美les视频xxxx在线观看 | 一本综合久久 | 日韩欧美亚洲中字幕在线播放 | 久久精品全国免费观看国产 | 久久精品一区二区免费看 | 精品一区二区三区在线视频观看 | 欧美一级大尺度毛片 | 欧美性色黄大片www 欧美性色黄大片一级毛片视频 | 最新在线精品国自拍视频 | 欧美顶级毛片在线播放 | 草草视频免费在线观看 | 欧美一区中文字幕 | 亚洲精品久久99久久一区 | 女人扒开腿让男人捅啪啪 | 欧美在线观看一区二区三区 | 欧美国产日韩一区二区三区 | 亚洲精品午夜一区二区在线观看 | 久久精品国产免费观看99 | 国产裸体美女视频全黄 | 欧美一级专区免费大片野外交 | 久久久亚洲天堂 | 成年视频在线 | 成人欧美午夜视频毛片 | 国产91久久精品 | 国产一级第一级毛片 | 久久精品国产亚洲欧美 | 特级淫片国产免费高清视频 | 国内精品久久久久久久久蜜桃 | 米奇色网| 99国产高清久久久久久网站 | 美女视频一区二区三区在线 | 日韩18在线观看 | 亚洲日韩视频免费观看 | 欧美中文字幕在线视频 | 4四虎44虎www在线影院麻豆 | 国产亚洲人成网站在线观看 | 日韩三级视频 | 99视频九九精品视频在线观看 | 久久一日本道色综合久久 | 中文字幕一区二区在线视频 | 成年人三级网站 |