检查txt文件中是不是存在许多URL(Python)[关闭]
Posted
技术标签:
【中文标题】检查txt文件中是不是存在许多URL(Python)[关闭]【英文标题】:Check if many URLs exists from a txt file (Python) [closed]检查txt文件中是否存在许多URL(Python)[关闭] 【发布时间】:2012-12-31 11:28:40 【问题描述】:我是python的新手,我想做上面说的,但是我没有任何想法,那我该怎么做呢?
【问题讨论】:
txt文件长什么样子? 请在寻求帮助之前至少尝试分析问题。如果您有一些具体问题,请在此处提问。 哦,对不起,txt 文件每行包含一个 URL 列表。例如。 “Google.com , Microsoft.com” 每行。 When you tried solving this yourself,你卡在哪个部分了?打开文件?读取文件并找到看起来像 URL 的东西?验证网址?如果您提供一些代码,我们更有可能提供帮助。请注意,“Google.com”是域名,而不是 URL。 我正在使用 mechanize 模块,“google.com”就是一个例子,抱歉。代码如下。 import mechanize br = mechanize.Browser() br.set_handle_redirect(False) try: br.open_novisit('google.com.br') print 'Funfando!'除了:打印'未找到...' 【参考方案1】:Open 文件。 Iterate through the lines。 Fetch the files 并检查错误。
【讨论】:
【参考方案2】:从您评论中的代码(您应该将其放在您的问题中),它是从您正在苦苦挣扎的文件中读取行。
这样做的惯用方式是这样的:
with open("hello.txt") as f:
for line in f:
print line,
[参见the official Python documentation] 中的File Objects。
将其插入您的代码(并使用 str.strip()
从每行中删除换行符和任何空格):
#!/usr/bin/env python
import mechanize
br = mechanize.Browser()
br.set_handle_redirect(False)
with open('urls.txt') as urls:
for url in urls:
stripped = url.strip()
print '[]: '.format(stripped),
try:
br.open_novisit(stripped)
print 'Funfando!'
except Exception, e:
print e
请注意,URL 以 方案名称(通常称为 协议,例如 http
)开头,后跟一个冒号,然后是两个斜杠:
[***.com]:无法获取相对引用:未查看任何文档
但是
[http://***.com/]:Funfando!
【讨论】:
哇!绝对棒极了,谢谢大佬!我怎样才能学到更多?!我很困惑在哪里可以找到有关它的文档。我真的很想有你作为联系人,这是我的 Skype:Themilbol 很高兴能提供帮助。我在我的回答中引用了官方文档,这是一个很好的起点,其中包括一个出色的 tutorial。祝你好运!以上是关于检查txt文件中是不是存在许多URL(Python)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章