从 RSS 提要获取实际内容

Posted

技术标签:

【中文标题】从 RSS 提要获取实际内容【英文标题】:Getting actual content from RSS feed 【发布时间】:2014-09-18 18:04:18 【问题描述】:

例如,这里有一个 ABC 新闻链接,它提供各种 RSS 供稿供使用。

http://rss.cnn.com/rss/edition.rss`

在 Windows 8 商店应用程序中使用这个提要,我可以使用内置的 SyndicationClient 类来阅读它。但是,它仅提供新闻故事/文章的标题和少量摘要文本,而不是所有内容。现在我想要所有内容,即文本和图像。我看到了许多适用于 Windows 商店的新闻阅读器应用程序,当我点击任何故事时,它们都非常容易做到这一点,它就在那里为我提供了实际内容。

知道如何做到这一点吗?我需要某种 html 解析器吗?

例如,您可以查看 News、News Bento 应用程序。我想实现类似的目标。

以下是应用中的图片:

这是从新闻文章中提取的文本和图像:

这是单击“查看原始文章”时的视图。我知道下面的视图正在使用 webview 控件。但我想如何提取像上图这样的数据。

【问题讨论】:

我的猜测是,这些应用程序并未向您显示摘要提要数据,但它们实际上是使用浏览器控件打开网站文章。 没有。他们在网站上显示来自实际新闻文章的文本和图像内容。几分钟后我会在这里发布截图。 该图像与 cnn 提要不匹配。此外,第二张图片向您展示了一个 WebView,其中显示了整个 PopCrush 网站。 是的。它不匹配,也不需要。我写过它已经提取了文本。见文章内容相同。我也知道其他图像是 webview 的。我已经写了这个问题本身。我想要的是如何从 RSS 提要中获取该 html 并在 WinRT 控件中显示,如 Richtextblock。 例如,我给了 cnn 提要。屏幕截图适用于不同的提要。如果您有 Windows 8,您可以尝试免费的 News Bento 应用程序来了解我的意思。 【参考方案1】:

嗯,答案是可读的。更多内容也在这里:

https://github.com/scottksmith95/CSharp.Readability

我花了很多时间才找到这些东西,但这正是我想要的。

【讨论】:

以上是关于从 RSS 提要获取实际内容的主要内容,如果未能解决你的问题,请参考以下文章

是否仍然可以从 Facebook 群组创建 RSS 提要?

从数据库创建 RSS 提要,将多少项放入提要以便它们都可能被消费?

windows phone 上的流媒体广播

从 Feedburner RSS 提要中获取原始 XML 数据

如何从 php 中的 rss 提要获取图像

如何从 RSS 源获取全文:Android 和 IOS