python 从下载的facebook数据副本中的wall.htm中提取所有状态更新

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python 从下载的facebook数据副本中的wall.htm中提取所有状态更新相关的知识,希望对你有一定的参考价值。

import codecs
import sys

from bs4 import BeautifulSoup


wall_file = open(sys.argv[1], "r")
wall = BeautifulSoup(wall_file, 'html.parser')
comment_divs = wall.find_all(class_="comment")
comments = [div.string for div in comment_divs]
out_file = codecs.open(sys.argv[2], "w", "utf-8")
for comment in comments:
    out_file.write("%s\n#######\n" % comment)

以上是关于python 从下载的facebook数据副本中的wall.htm中提取所有状态更新的主要内容,如果未能解决你的问题,请参考以下文章

使用 Python pandas 数据框时返回副本与视图警告

Facebook SDK FBGraphUser 无法存储本地副本

从python中的字符串中查找facebook页面句柄/ id

铁大FaceBook的使用体验副本

Python:SettingWithCopyWarning:试图在 DataFrame 中的切片副本上设置值

iOS facebook sdk 如何下载相册、个人资料照片数据