从 RSS 提要获取实际内容
Posted
技术标签:
【中文标题】从 RSS 提要获取实际内容【英文标题】:Getting actual content from RSS feed 【发布时间】:2014-09-18 18:04:18 【问题描述】:例如,这里有一个 ABC 新闻链接,它提供各种 RSS 供稿供使用。
http://rss.cnn.com/rss/edition.rss`
在 Windows 8 商店应用程序中使用这个提要,我可以使用内置的 SyndicationClient 类来阅读它。但是,它仅提供新闻故事/文章的标题和少量摘要文本,而不是所有内容。现在我想要所有内容,即文本和图像。我看到了许多适用于 Windows 商店的新闻阅读器应用程序,当我点击任何故事时,它们都非常容易做到这一点,它就在那里为我提供了实际内容。
知道如何做到这一点吗?我需要某种 html 解析器吗?
例如,您可以查看 News、News Bento 应用程序。我想实现类似的目标。
以下是应用中的图片:
这是从新闻文章中提取的文本和图像:
这是单击“查看原始文章”时的视图。我知道下面的视图正在使用 webview 控件。但我想如何提取像上图这样的数据。
【问题讨论】:
我的猜测是,这些应用程序并未向您显示摘要提要数据,但它们实际上是使用浏览器控件打开网站文章。 没有。他们在网站上显示来自实际新闻文章的文本和图像内容。几分钟后我会在这里发布截图。 该图像与 cnn 提要不匹配。此外,第二张图片向您展示了一个WebView
,其中显示了整个 PopCrush 网站。
是的。它不匹配,也不需要。我写过它已经提取了文本。见文章内容相同。我也知道其他图像是 webview 的。我已经写了这个问题本身。我想要的是如何从 RSS 提要中获取该 html 并在 WinRT 控件中显示,如 Richtextblock。
例如,我给了 cnn 提要。屏幕截图适用于不同的提要。如果您有 Windows 8,您可以尝试免费的 News Bento 应用程序来了解我的意思。
【参考方案1】:
嗯,答案是可读的。更多内容也在这里:
https://github.com/scottksmith95/CSharp.Readability
我花了很多时间才找到这些东西,但这正是我想要的。
【讨论】:
以上是关于从 RSS 提要获取实际内容的主要内容,如果未能解决你的问题,请参考以下文章
从数据库创建 RSS 提要,将多少项放入提要以便它们都可能被消费?