检查txt文件中是不是存在许多URL（Python）[关闭]

Posted 2023-02-22

技术标签:

【中文标题】检查txt文件中是不是存在许多URL（Python）[关闭]【英文标题】：Check if many URLs exists from a txt file (Python) [closed]检查txt文件中是否存在许多URL（Python）[关闭] 【发布时间】：2012-12-31 11:28:40 【问题描述】：

我是python的新手，我想做上面说的，但是我没有任何想法，那我该怎么做呢？

【问题讨论】：

txt文件长什么样子？请在寻求帮助之前至少尝试分析问题。如果您有一些具体问题，请在此处提问。哦，对不起，txt 文件每行包含一个 URL 列表。例如。 “Google.com , Microsoft.com” 每行。 When you tried solving this yourself，你卡在哪个部分了？打开文件？读取文件并找到看起来像 URL 的东西？验证网址？如果您提供一些代码，我们更有可能提供帮助。请注意，“Google.com”是域名，而不是 URL。我正在使用 mechanize 模块，“google.com”就是一个例子，抱歉。代码如下。 import mechanize br = mechanize.Browser() br.set_handle_redirect(False) try: br.open_novisit('google.com.br') print 'Funfando!'除了：打印'未找到...' 【参考方案1】：

Open 文件。 Iterate through the lines。 Fetch the files 并检查错误。

【讨论】：

【参考方案2】：

从您评论中的代码（您应该将其放在您的问题中），它是从您正在苦苦挣扎的文件中读取行。

这样做的惯用方式是这样的：

with open("hello.txt") as f:
    for line in f:
        print line,

[参见the official Python documentation] 中的File Objects。

将其插入您的代码（并使用 str.strip() 从每行中删除换行符和任何空格）：

#!/usr/bin/env python

import mechanize

br = mechanize.Browser()
br.set_handle_redirect(False)
with open('urls.txt') as urls:
    for url in urls:
        stripped = url.strip()
        print '[]: '.format(stripped),
        try:
            br.open_novisit(stripped)
            print 'Funfando!'
        except Exception, e:
            print e

请注意，URL 以 方案名称（通常称为协议，例如 http）开头，后跟一个冒号，然后是两个斜杠：

[***.com]：无法获取相对引用：未查看任何文档

但是

[http://***.com/]：Funfando！

【讨论】：

哇！绝对棒极了，谢谢大佬！我怎样才能学到更多？！我很困惑在哪里可以找到有关它的文档。我真的很想有你作为联系人，这是我的 Skype：Themilbol 很高兴能提供帮助。我在我的回答中引用了官方文档，这是一个很好的起点，其中包括一个出色的 tutorial。祝你好运！

以上是关于检查txt文件中是不是存在许多URL（Python）[关闭]的主要内容，如果未能解决你的问题，请参考以下文章