python 解析维基百科字符串中的文章链接

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 解析维基百科字符串中的文章链接相关的知识,希望对你有一定的参考价值。

import mwlib.parser.nodes
import mwlib.uparser 
import codecs


with codecs.open('us.dat', 'rb', encoding='utf-8') as fp: 
    text = fp.read()
    article = mwlib.uparser.parseString(title='us', raw=text) 
    nodes = article.find(mwlib.parser.nodes.ArticleLink) 
    for n in nodes:
        print n

以上是关于python 解析维基百科字符串中的文章链接的主要内容,如果未能解决你的问题,请参考以下文章

如何获得Python中的维基百科讨论页内容

在哪里/如何通过网页浏览获得前10,000名维基百科文章?

Python - BS4 - 仅使用表头+保存为字典从维基百科表中提取子表

wikipedia 维基百科 语料 获取 与 提取 处理 by python3.5

ruby 简单的ruby脚本来获取维基百科今天的精选文章

python 维基百科部分循环