admin 发表于 2023-4-20 09:56:24

【数据处理】正则匹配提取

正则表达式相关资料:https://www.blockphp.com/thread-41-1-1.html

例:从下面代码字符串提取链接
《---myCode-Html---》
<td class="num"><a href="https://www.blockphp.com/thread-36-1-1.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-2.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-3.html" class="xi2">0</a><em>11</em></td>
《---myCode---》

分析链接中,红字色部分是固定的   https://www.blockphp.com/thread-36-1-1.html
蓝色部分是数字是变化的

应此,正则表达式为:/https\:\/\/www\.blockphp\.com\/thread-[-0-9]\.html/U


在采集帖子链接安例中:



[参数1] 是匹配到的完整字符串
[参数2] 是正则表达式中第一个()里匹配到的符串
[参数3] 同理是正则表达式中第二个()里匹配到的符串




页: [1]
查看完整版本: 【数据处理】正则匹配提取