如何在 C# 中从外部站点的 url 读取 PDF 文件 [关闭]

Posted

技术标签:

【中文标题】如何在 C# 中从外部站点的 url 读取 PDF 文件 [关闭]【英文标题】:How to read a PDF file from a url of external site in C# [closed] 【发布时间】:2017-12-06 06:38:27 【问题描述】:

我希望能够在我的 asp.net 应用程序中下载通过路由 url(外部站点)访问的 pdf。 有什么办法吗?

现状: 路由的url在公司内部站点(joomla站点)http://example/sites/index.php/2011-10-30-12-29-04/finish/11/1234 此链接将用户重定向到 pdf 文件 我需要使用路由 url 在我的应用程序 (PdfReader) 中获取此 pdf。


更新#1:

我按照您的建议对我的代码进行了一些更改(我在原始问题中添加了它),只是我需要将内容流传递给我的 pdfReader。但是它仍然显示下载失败..


更新#2: 现在问题解决了,我必须按如下方式传递内容流 将 pdfReader 调暗为新的 PdfReader(isp:=contentStream)

非常感谢..

   Public Async Function GetPDFFromCompanyWebsite() As Task(Of HttpResponseMessage)

    Using client As HttpClient = New HttpClient()
        Dim msg As HttpResponseMessage = Await client.GetAsync("http://example/sites/index.php/2011-10-30-12-29-04/finish/4/4088")
        If msg.IsSuccessStatusCode Then


            Dim contentStream = Await msg.Content.ReadAsStreamAsync()

            Dim pdfReader As New PdfReader(isp:=contentStream)
            Dim MST As MemoryStream = New MemoryStream()
            Dim pdfStamper As New PdfStamper(pdfReader, MST)
            For pageIndex As Integer = 1 To pdfReader.NumberOfPages
                Dim pageRectangle As Rectangle = pdfReader.GetPageSizeWithRotation(pageIndex)
                Dim pdfData As PdfContentByte = pdfStamper.GetOverContent(pageIndex)

                pdfData.SetFontAndSize(BaseFont.CreateFont(BaseFont.HELVETICA_BOLD, BaseFont.CP1252, BaseFont.NOT_EMBEDDED), 40)
                Dim graphicsState As New PdfGState()


                graphicsState.FillOpacity = 0.1F
                pdfData.SetGState(graphicsState)

                pdfData.SetColorFill(BaseColor.BLUE)

                Dim bf As BaseFont = BaseFont.CreateFont(BaseFont.TIMES_ROMAN, BaseFont.CP1252, BaseFont.NOT_EMBEDDED)

                pdfData.SetFontAndSize(bf, pageRectangle.Width / 25)
                pdfData.BeginText()
                pdfData.SetFlatness(1000)

                Dim windowsuser As String = User.Identity.Name.Substring(4)
                windowsuser = windowsuser + "        " + windowsuser + "        " + windowsuser + "        " + windowsuser + "        " + windowsuser + "        " + windowsuser + "        " + windowsuser
                '    pdfData.ShowTextAligned(Element.ALIGN_BOTTOM, User.Identity.Name, 100, 100, 45)
                Response.Write("width:height: " + pageRectangle.Width.ToString + " / " + pageRectangle.Height.ToString)
                pdfData.ShowTextAligned(Element.ALIGN_CENTER, windowsuser, pageRectangle.Width / 2, pageRectangle.Height / 2, 45)
                pdfData.ShowTextAligned(Element.ALIGN_CENTER, windowsuser, pageRectangle.Width / 4, pageRectangle.Height - (pageRectangle.Height / 4), 45)
                pdfData.ShowTextAligned(Element.ALIGN_CENTER, windowsuser, pageRectangle.Width - (pageRectangle.Width / 4), pageRectangle.Height / 4, 45)
                pdfData.ShowTextAligned(Element.ALIGN_CENTER, windowsuser, (3 * pageRectangle.Width) / 8, pageRectangle.Height - ((3 * pageRectangle.Height) / 8), 45)
                pdfData.ShowTextAligned(Element.ALIGN_CENTER, windowsuser, pageRectangle.Width - ((3 * pageRectangle.Width) / 8), (3 * pageRectangle.Height) / 8, 45)




                pdfData.EndText()

            Next
            pdfStamper.Close()
            Dim bytesInStream As Byte() = MST.ToArray()

            MST.Close()

            Response.Clear()
            Response.ClearContent()
            Response.ClearHeaders()
            Response.ContentType = "application/pdf"
            Response.AddHeader("content-disposition", "attachment;filename=File.pdf")
            Response.BufferOutput = True
            Response.Cache.SetCacheability(HttpCacheability.NoCache)
            Response.BinaryWrite(bytesInStream)
            Response.End()
            Response.Close()

            '        End Using
        End If

        Return msg
    End Using
End Function

【问题讨论】:

尝试使用 HttpClient 类发出 GET 请求并将结果存储在 ByteArray 中。 你能解释一下怎么做吗 你的更新不是用 C# 编写的,乍一看有点混乱。 【参考方案1】:

尝试使用 C# 中的 HttpClient 类向您公司的网站发出 GET 请求。你可以做一些类似的事情。

using System.Net.Http;
using System.IO;

public async Task<HttpResponseMessage> GetPDFFromCompanyWebsite()

string currentDirectory = System.Web.Hosting.HostingEnvironment.MapPath("~");
string filePath = Path.Combine(currentDirectory, "App_Data", "someDocument.pdf");

using(HttpClient client = new HttpClient())

    HttpResponseMessage msg = await client.GetAsync($"http://example/sites/index.php/2011-10-30-12-29-04/finish/11/1234");

    if(msg.IsSuccessStatusCode)
    
     using(var file = File.Create(filePath))
      
       // create a new file to write to
       var contentStream = await msg.Content.ReadAsStreamAsync(); // get the actual content stream
       await contentStream.CopyToAsync(file); // copy that stream to the file stream
       await file.FlushAsync(); // flush back to disk before disposing
     
   
  return msg;
 

【讨论】:

谢谢 Kunal,我按照您的建议对代码进行了一些更改(我在原始问题中添加了它),只是我需要将内容流传递给我的 pdfReader,然后再传递给内存流。但是它仍然显示下载失败。 尝试检查该公司链接,通过Postman 向其发送 GET 请求并检查您是否收到回复? 链接有效,因为我尝试了您的方法(将其写入文件)并且有效。 @NajatAl-Naamani 如果我的解决方案对您有用,您可以接受它作为您的答案。

以上是关于如何在 C# 中从外部站点的 url 读取 PDF 文件 [关闭]的主要内容,如果未能解决你的问题,请参考以下文章

在 C# 中从外部应用程序获取 UI 文本

如何在 PHP 应用程序中从另一个站点呈现 javascript?

如何为用户“伪装”或“重命名”页面名称/位置/ URL,但仍允许外部站点通过HTTP_REFERER正确读取真实的URL

如何在 C# 中从 XmlNode 读取属性值?

在 C# 中从类外部访问私有构造函数

如何在 C# 中从 HTML 文件中提取图像 url