【数据处理】正则匹配提取
正则表达式相关资料:https://www.blockphp.com/thread-41-1-1.html例:从下面代码字符串提取链接
《---myCode-Html---》
<td class="num"><a href="https://www.blockphp.com/thread-36-1-1.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-2.html" class="xi2">0</a><em>11</em></td>
<td class="num"><a href="https://www.blockphp.com/thread-36-1-3.html" class="xi2">0</a><em>11</em></td>
《---myCode---》
分析链接中,红字色部分是固定的 https://www.blockphp.com/thread-36-1-1.html
蓝色部分是数字是变化的
应此,正则表达式为:/https\:\/\/www\.blockphp\.com\/thread-[-0-9]\.html/U
在采集帖子链接安例中:
[参数1] 是匹配到的完整字符串
[参数2] 是正则表达式中第一个()里匹配到的符串
[参数3] 同理是正则表达式中第二个()里匹配到的符串
页:
[1]