求助]将html源文件中的所有文字节点替换为为<text>
需要构造web页面的后缀树,将html源文件中的所有文字节点替换为为<text>,请教各位正则该如何写。- String bHtml = "<body><p>content1</p><form><textarea>content2</textatea>"
- +"<a>content3</a></body></html>";
-
- bHtml = bHtml.replaceAll("(?!<(\\S*?)[^>]*>.*?|<.*? />)+","<text>");
- System.out.println(bHtml);
- 期望输出为:
- <body><p><text></p><form><textarea><text></textatea>
- <a><text></a></body></html>
复制代码 |