检查txt文件中是不是存在许多URL(Python)[关闭]

Posted

技术标签:

【中文标题】检查txt文件中是不是存在许多URL(Python)[关闭]【英文标题】:Check if many URLs exists from a txt file (Python) [closed]检查txt文件中是否存在许多URL(Python)[关闭] 【发布时间】:2012-12-31 11:28:40 【问题描述】:

我是python的新手,我想做上面说的,但是我没有任何想法,那我该怎么做呢?

【问题讨论】:

txt文件长什么样子? 请在寻求帮助之前至少尝试分析问题。如果您有一些具体问题,请在此处提问。 哦,对不起,txt 文件每行包含一个 URL 列表。例如。 “Google.com , Microsoft.com” 每行。 When you tried solving this yourself,你卡在哪个部分了?打开文件?读取文件并找到看起来像 URL 的东西?验证网址?如果您提供一些代码,我们更有可能提供帮助。请注意,“Google.com”是域名,而不是 URL。 我正在使用 mechanize 模块,“google.com”就是一个例子,抱歉。代码如下。 import mechanize br = mechanize.Browser() br.set_handle_redirect(False) try: br.open_novisit('google.com.br') print 'Funfando!'除了:打印'未找到...' 【参考方案1】:

Open 文件。 Iterate through the lines。 Fetch the files 并检查错误。

【讨论】:

【参考方案2】:

从您评论中的代码(您应该将其放在您的问题中),它是从您正在苦苦挣扎的文件中读取行。

这样做的惯用方式是这样的:

with open("hello.txt") as f:
    for line in f:
        print line,

[参见the official Python documentation] 中的File Objects

将其插入您的代码(并使用 str.strip() 从每行中删除换行符和任何空格):

#!/usr/bin/env python

import mechanize

br = mechanize.Browser()
br.set_handle_redirect(False)
with open('urls.txt') as urls:
    for url in urls:
        stripped = url.strip()
        print '[]: '.format(stripped),
        try:
            br.open_novisit(stripped)
            print 'Funfando!'
        except Exception, e:
            print e

请注意,URL 以 方案名称(通常称为 协议,例如 http)开头,后跟一个冒号,然后是两个斜杠:

[***.com]:无法获取相对引用:未查看任何文档

但是

[http://***.com/]:Funfando!

【讨论】:

哇!绝对棒极了,谢谢大佬!我怎样才能学到更多?!我很困惑在哪里可以找到有关它的文档。我真的很想有你作为联系人,这是我的 Skype:Themilbol 很高兴能提供帮助。我在我的回答中引用了官方文档,这是一个很好的起点,其中包括一个出色的 tutorial。祝你好运!

以上是关于检查txt文件中是不是存在许多URL(Python)[关闭]的主要内容,如果未能解决你的问题,请参考以下文章

如何检查目录中是不是存在扩展名为 .txt 的文件?

如何检查java中是不是存在某个.txt文件[重复]

如何在php中检查url是不是存在

检查文件是不是存在后如何删除

检查 .txt 文件是不是存在。 FileWriter.exists 方法不起作用

Android 使用其 URL 检查文件是不是存在于远程服务器中