使用 SyndicationFeed 读取 SyndicationItem 中的非标准元素

Posted

技术标签:

【中文标题】使用 SyndicationFeed 读取 SyndicationItem 中的非标准元素【英文标题】:Reading non-standard elements in a SyndicationItem with SyndicationFeed 【发布时间】:2010-09-24 02:12:02 【问题描述】:

在 .net 3.5 中,有一个 SyndicationFeed 将加载到 RSS 提要中并允许您在其上运行 LINQ。

这是我正在加载的 RSS 示例:

<rss version="2.0" xmlns:media="http://search.yahoo.com/mrss/"> 
<channel> 
    <title>Title of RSS feed</title> 
    <link>http://www.google.com</link> 
    <description>Details about the feed</description> 
    <pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate> 
    <language>en</language> 
    <item> 
        <title>Article 1</title> 
        <description><![CDATA[How to use ***.com]]></description> 
        <link>http://youtube.com/?v=y6_-cLWwEU0</link> 
        <media:player url="http://youtube.com/?v=y6_-cLWwEU0" /> 
        <media:thumbnail url="http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg"   /> 
        <media:title>Jared on ***</media:title> 
        <media:category label="Tags">tag1, tag2</media:category> 
        <media:credit>Jared</media:credit> 
        <enclosure url="http://youtube.com/v/y6_-cLWwEU0.swf" length="233" type="application/x-shockwave-flash"/> 
    </item> 
</channel>

当我遍历项目时,我可以通过 SyndicationItem 的公共属性取回标题和链接。

我似乎无法弄清楚如何获取附件标签的属性或媒体标签的值。我尝试使用

SyndicationItem.ElementExtensions.ReadElementExtensions<string>("player", "http://search.yahoo.com/mrss/")

对其中任何一个有帮助吗?

【问题讨论】:

【参考方案1】:

这应该让你知道如何去做:

using System.Linq;
using System.ServiceModel.Syndication;
using System.Xml;
using System.Xml.Linq;

SyndicationFeed feed = reader.Read();

foreach (var item in feed.Items)

    foreach (SyndicationElementExtension extension in item.ElementExtensions)
    
        XElement ele = extension.GetObject<XElement>();
        Console.WriteLine(ele.Value);
    

【讨论】:

我喜欢这个答案,因为它很简单,因为它使用了 OP 使用的 SyndicationFeed 类。但是,这不会返回他们需要暴露的“外壳”属性。我错过了什么吗?【参考方案2】:

无论您是检索扩展元素或 XElement 项的非 XML 内容,您都可能需要考虑使用通用帮助函数,例如:

private static T GetExtensionElementValue<T>(SyndicationItem item, string extensionElementName)

       return item.ElementExtensions.First(ee => ee.OuterName == extensionElementName).GetObject<T>();

根据是否保证元素存在或是否将其放入可重用库中,您可能需要添加额外的防御性编程。

【讨论】:

不知道为什么没有把它改装得更高。一个不错的,干净的,单线解决方案。为我工作! 迄今为止的最佳答案【参考方案3】:

这是我如何使用 SyndicationFeed 从提要中检索附件链接的方法。

static void Main(string[] args)

    var feedUrl = "https://blog.***.com/index.php?feed=podcast";

    using (var feedReader = XmlReader.Create(feedUrl))
    
        var feedContent = SyndicationFeed.Load(feedReader);

        if (null == feedContent) return;

        foreach (var item in feedContent.Items)
        
            Debug.WriteLine("Item Title: " + item.Title.Text);

            Debug.WriteLine("Item Links");
            foreach (var link in item.Links)
            
                Debug.WriteLine("Link Title: " + link.Title);
                Debug.WriteLine("URI: " + link.Uri);
                Debug.WriteLine("RelationshipType: " + link.RelationshipType);
                Debug.WriteLine("MediaType: " + link.MediaType);
                Debug.WriteLine("Length: " + link.Length);
            
        
    

    

输出如下:

项目标题:播客 #50 项目链接 链接标题: 网址:https://blog.***.com/2009/04/podcast-50/ 关系类型:备用 媒体类型: 长度:0 链接标题:URI:http://itc.conversationsnetwork.org/audio/download/ITC.SO-Episode50-2009.04.21.mp3RelationshipType:enclosure 媒体类型:音频/mpeg 长度:36580016

您可以从其关系类型中识别附件链接。

【讨论】:

【参考方案4】:

您可以结合使用 LINQ 和 XPathNavigator 来提取提要项的联合扩展(基于扩展的命名空间 URI)。对于项目附件,您需要检查项目链接集合中是否有关系类型为 enclosure 的链接。

例子:

HttpWebRequest webRequest   = WebRequest.Create("http://www.pwop.com/feed.aspx?show=dotnetrocks&filetype=master") as HttpWebRequest;

using (Stream stream = webRequest.GetResponse().GetResponseStream())

    XmlReaderSettings settings  = new XmlReaderSettings();
    settings.IgnoreComments     = true;
    settings.IgnoreWhitespace   = true;

    using(XmlReader reader = XmlReader.Create(stream, settings))
    
        SyndicationFeed feed    = SyndicationFeed.Load(reader);

        foreach(SyndicationItem item in feed.Items)
        
            // Get values of syndication extension elements for a given namespace
            string extensionNamespaceUri            = "http://www.itunes.com/dtds/podcast-1.0.dtd";
            SyndicationElementExtension extension   = item.ElementExtensions.Where<SyndicationElementExtension>(x => x.OuterNamespace == extensionNamespaceUri).FirstOrDefault();
            XPathNavigator dataNavigator            = new XPathDocument(extension.GetReader()).CreateNavigator();

            XmlNamespaceManager resolver    = new XmlNamespaceManager(dataNavigator.NameTable);
            resolver.AddNamespace("itunes", extensionNamespaceUri);

            XPathNavigator authorNavigator      = dataNavigator.SelectSingleNode("itunes:author", resolver);
            XPathNavigator subtitleNavigator    = dataNavigator.SelectSingleNode("itunes:subtitle", resolver);
            XPathNavigator summaryNavigator     = dataNavigator.SelectSingleNode("itunes:summary", resolver);
            XPathNavigator durationNavigator    = dataNavigator.SelectSingleNode("itunes:duration", resolver);

            string author   = authorNavigator != null ? authorNavigator.Value : String.Empty;
            string subtitle = subtitleNavigator != null ? subtitleNavigator.Value : String.Empty;
            string summary  = summaryNavigator != null ? summaryNavigator.Value : String.Empty;
            string duration = durationNavigator != null ? durationNavigator.Value : String.Empty;

            // Get attributes of <enclosure> element
            foreach (SyndicationLink enclosure in item.Links.Where<SyndicationLink>(x => x.RelationshipType == "enclosure"))
            
                Uri url             = enclosure.Uri;
                long length         = enclosure.Length;
                string mediaType    = enclosure.MediaType;
            
        
    

【讨论】:

这对我帮助很大!如果您想获取 url 属性,请检查 XPathNavigator.GetAttribute("url", "");【参考方案5】:

您缺少命名空间。使用 LINQPad 和您的示例提要:

string xml = @"
    <rss version='2.0' xmlns:media='http://search.yahoo.com/mrss/'> 
    <channel> 
        <title>Title of RSS feed</title> 
        <link>http://www.google.com</link> 
        <description>Details about the feed</description> 
        <pubDate>Mon, 24 Nov 08 21:44:21 -0500</pubDate> 
        <language>en</language> 
        <item> 
            <title>Article 1</title> 
            <description><![CDATA[How to use ***.com]]></description> 
            <link>http://youtube.com/?v=y6_-cLWwEU0</link> 
            <media:player url='http://youtube.com/?v=y6_-cLWwEU0' /> 
            <media:thumbnail url='http://img.youtube.com/vi/y6_-cLWwEU0/default.jpg' width='120' height='90' /> 
            <media:title>Jared on ***</media:title> 
            <media:category label='Tags'>tag1, tag2</media:category> 
            <media:credit>Jared</media:credit> 
            <enclosure url='http://youtube.com/v/y6_-cLWwEU0.swf' length='233' type='application/x-shockwave-flash'/> 
        </item> 
    </channel>
    </rss>
    ";



XElement rss = XElement.Parse( xml );
XNamespace media = "http://search.yahoo.com/mrss/";

var player = rss.Element( "channel" ).Element( "item" ).Element(media + "player").Attribute( "url" );
player.Dump();

结果:url="http://youtube.com/?v=y6_-cLWwEU0"

要查看的构造是:Element(media + "player"),它告诉 Linq 使用由 'media' 表示的命名空间以及元素名称 'player'。

脑损伤一定是我造成的,我以为你在使用 Linq。无论如何,您需要考虑命名空间。

【讨论】:

感谢您的回答。我唯一希望我能拥有的是强类型名称而不是字符串。

以上是关于使用 SyndicationFeed 读取 SyndicationItem 中的非标准元素的主要内容,如果未能解决你的问题,请参考以下文章

C# SyndicationFeed - RSS 解析日期问题

结合两个 SyndicationFeed

是否有可能在TCP 3路握手中获取SYN / ACK数据包的TCP序列号?

如何使用 C# 或 Java 发送 SYN 数据包

SYN(synchronous)TCP/IP

有没有办法使用 c# 过滤掉 syn 请求数据包?