python web1(解析url)
Posted junkdog
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python web1(解析url)相关的知识,希望对你有一定的参考价值。
环境:pycharm
尝试对地址进行切片 去掉头 http 或 https
a.遇到了一些问题
url = ‘https://www.cnblogs.com/derezzed/articles/8119592.html‘ #检查协议 protocl = "http" if url[:7] =="http://": u = url.split(‘://‘)[1] elif url[:8] == "https://": protocl = "https" u = url.split("://") else: u = url print(u)
发现无任何输出
url = ‘https://www.cnblogs.com/derezzed/articles/8119592.html‘ #检查协议 protocl = "http" if url[:7] =="http://": u = url.split(‘://‘)[1] print(u) elif url[:8] == "https://": protocl = "https" u = url.split("://") print(u) else: u = url print(u)
修改后看到了结果 至于为何 暂不知道原因
b.按着教程 边理解 边写出的解析url程序 (此程序有问题)
#url = ‘http://movie.douban.com/top250‘
#解析url 返回一个tuple 包含 protocol host path port
def parsed_url(url):
#检查协议
protocol = ‘http‘
if url[:7] == ‘http://‘:
a = url.split(‘://‘)[1]
elif url[:8] == ‘https://‘:
a = url.split(‘https://‘)[1]
protocol = ‘https‘
#检查默认path
i = a.find(‘/‘)
if(i == -1):
path = ‘/‘
host = a
else:
host = a[:16]
path = a[6:]
#检查端口
port_dict = {
‘http‘: 80,
‘https‘ : 443,
}
#默认端口
port = port_dict[protocol]
if ‘:‘ in host:
h = host.split(‘:‘)
host = h[0]
port = int (h[1])
return protocol, host, port, path
写完后发现编译器一直报错 对着源程序反复确认还是找不到问题所在 一直报错
“python illegal target for variable annotation”
最后发现是缩进问题 详情查看我的 python learn 或者搜索python的缩进要求
而后加入测试程序 发现还是不对 虽然报错很明显 但依然不知道错在哪里 冷静下来观察错误
这里看到 错误已经很明显 给出了来源 自己写的(其实是仿着写的qwq)所以没有意识到自己写的expected函数连正确答案都显示出来了 (汗)
最终 马上意识到 host path是有问题的 将 i 替换成了具体数字 修改后错误消失
error 0 了 啊太棒了 !!! 加油~~~
以上是关于python web1(解析url)的主要内容,如果未能解决你的问题,请参考以下文章
Android 逆向使用 Python 解析 ELF 文件 ( Capstone 反汇编 ELF 文件中的机器码数据 | 创建反汇编解析器实例对象 | 设置汇编解析器显示细节 )(代码片段
[未解决问题记录]python asyncio+aiohttp出现Exception ignored:RuntimeError('Event loop is closed')(代码片段