且构网

分享程序员开发的那些事...
且构网 - 分享程序员编程开发的那些事

python - 如何用正则表达式匹配标签里面的a标签

更新时间:2023-09-04 21:33:28

哈哈,这要是php就简单了。直接过滤标签完事了。然而这PY
看你的意思是要从表格里面,提取文字。。
那么可以
<td>(.*?)(<.+?>)*(.*?)</td>
也可以分步,先 <td>(.+?)</td> 把内容取出来。然后把 <.+?> 全替换空。

或者。。用回你的正则
<td>(.+?)(<a href="(.*?)>(.*?)</a>)?(.+?)</td>

+代表匹配至少1次,而*代表0次或者更多