Python:用于查找关联的HTML链接的正则表达式
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python:用于查找关联的HTML链接的正则表达式相关的知识,希望对你有一定的参考价值。
我需要一些帮助来编写正则表达式模式,该模式可以从网页中找到关联链接。]>
示例代码:import requests,re
from bs4 import BeautifulSoup
res = requests.get('https://www.example.com')
soup = BeautifulSoup(res.text,'lxml')
links = soup.find_all('a', href=True)
# example_of_affiliate_links = ['http://example.com/click/click?p=1&t=url&s=IDHERE&url=https://www.mywebsite.com/920&f=TXL&name=electronic/ps4/','https://example.net/click/camref:IDhere/destination:https://www.mywebsite.com/product/138/sony-ps4.html']
import requests,re
from bs4 import BeautifulSoup
res = requests.get('https://www.example.com')
soup = BeautifulSoup(res.text,'lxml')
links = soup.find_all('a', href=True)
# example_of_affiliate_links = ['http://example.com/click/click?p=1&t=url&s=IDHERE&url=https://www.mywebsite.com/920&f=TXL&name=electronic/ps4/','https://example.net/click/camref:IDhere/destination:https://www.mywebsite.com/product/138/sony-ps4.html']
我想使用以下正则表达式模式收集“ mywebsite.com”的所有关联链接,但未捕获任何链接。
pattern = re.compile(r'([http,https]://www.mywebsite.com\S[\.html,\.php,\&]$)')
有更好的方法吗?
我需要一些帮助来编写正则表达式模式,该模式可以从网页中找到关联的链接。示例代码:导入请求,从bs4导入import BeautifulSoup res = requests.get('https://www.example.com')...
答案
这是您要查找的正则表达式:
以上是关于Python:用于查找关联的HTML链接的正则表达式的主要内容,如果未能解决你的问题,请参考以下文章