当前位置：首页 > 其他教程 >

请问如何用正则表达式选出一大段文字中的特定内容？

GG网络技术分享 2025-03-18 16:15 0

问题描述：

小弟最近在写一个爬取电商网站的用户评论的作业，发现天猫的用户评论都在一个特定的网页下，但是这个网页的body就是一大段文字，直接用element.text()输出的话也输出不了中文（好像是UTF-8的格式。。。），请问怎么把网页中的所有评论输出？图片说明就是输出图片中的中文，每个评论一行，请问怎么做？
谢谢各位大神了！

网友观点：

这不是json吗？为什么会想到用正则，方向都错了。在java里如果正则写得有问题会卡死，我感觉是个非常不得已而为之的方法。

正则得话就是

,\\\"content\\\":\\\".*?\\\"

逗号双引号冒号都不是关键字，唯一要注意的就是.*后的问号表示非贪婪，否则会出问题

如何用正则表达式提取指定位数内容？

谢邀，字符串的话，可以直接用subString方法提取出5到9和10到14位，不同的语言有各自的处理方法。网址的匹配表达式："[a-zA-Z]{2,5}://\\\\w*\\\\.\\\\w*\\\\.[a-z]{2,3}"，这个是针对题主给出的字符串对应的很简单的正则，如果要匹配更复杂的或其他比如email地址等，可以百度到很多更严格和漂亮的表达式。

标签：

其他教程

请问如何用正则表达式选出一大段文字中的特定内容？

问题描述：

网友观点：

如何用正则表达式提取指定位数内容？

为您推荐

提交需求或反馈

产品中心

H5单页免费源码

免费源码

联系我们

QQ在线客服

关注微信