blockphp

 找回密码
 立即注册

QQ登录

只需一步,快速开始

搜索
热搜: 插件 discuz
查看: 2316|回复: 0

【数据处理】正则匹配提取

[复制链接]

21

主题

36

帖子

1091

积分

管理员

Rank: 9Rank: 9Rank: 9

积分
1091
关注我 催更
发表于 2023-4-20 09:56:24 | 显示全部楼层 |阅读模式
正则表达式相关资料:https://www.blockphp.com/thread-41-1-1.html

例:从下面代码字符串提取链接
<td class="num"><a href="https://www.blockphp.com/thread-36-1-1.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-2.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-3.html" class="xi2">0</a><em>11</em></td>


分析链接中,红字色部分是固定的   https://www.blockphp.com/thread-36-1-1.html
蓝色部分是数字是变化的

应此,正则表达式为:/https\:\/\/www\.blockphp\.com\/thread-[-0-9]\.html/U


在采集帖子链接安例中:

6444e949a27e2.png

[参数1] 是匹配到的完整字符串
[参数2] 是正则表达式中第一个()里匹配到的符串
[参数3] 同理是正则表达式中第二个()里匹配到的符串




回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

QQ|Archiver|手机版|小黑屋|blockphp ( 粤ICP备2022155990号 )

GMT+8, 2024-11-21 17:03 , Processed in 0.146918 second(s), 24 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表