ExpressJS 路由器规范化/规范 url

Posted

技术标签:

【中文标题】ExpressJS 路由器规范化/规范 url【英文标题】:ExpressJS router normalized/canonical urls 【发布时间】:2017-06-30 00:33:51 【问题描述】:

我正在寻找带有 ExpressJS 服务器的 SPA 的规范化/规范化 URL。

虽然它是由服务器端路由器备份的 SPA - 应用程序 URL 的模板可能会有所不同。区别之一是<link rel="canonical" href="https://example.com originalPath "> 标签。不是相关细节,而是解释问题的背景。我预计只有一个 URL 响应为 200,其变体被重定向到 301/302(适用于活人和搜索引擎)。

我想让 url 区分大小写且严格(没有额外的斜线),类似于 Router 选项,但非规范的 url(大小写或额外的斜线不同)应该做 301/302 重定向到规范url 而不是 404。

在大多数应用程序中,我只想强制 * 路由的 url 小写(查询除外),没有额外的斜杠。 IE。 app.all('*', ...),重定向为:

/Foo/Bar/ -> /foo/bar
/foo/Bar?Baz -> /foo/bar?Baz

但是,如果明确定义了路由,则可能会有例外。例如,有骆驼套路线:

possiblyNestedRouter.route('/somePath')...
possiblyNestedRouter.route('/anotherPath/:Param')...

并且所有非规范的url都应该重定向到规范的(参数大小写保持不变):

/somepath/ -> /somePath
/anotherpath/FOO -> /anotherPath/FOO

规范 url 背后的逻辑非常简单,所以奇怪的是我在这个主题上找不到任何关于 ExpressJS 的内容。

最好的方法是什么?是否已经有可以提供帮助的中间件?

【问题讨论】:

【参考方案1】:

我一直在寻找 npms,但我找不到任何东西,所以这让我心烦意乱,我为 express 编写了一个小任务来处理每个请求,这似乎工作正常。请将此添加到您的代码中。

var urls = 
  '/main' : '/main',
  '/anotherMain' : '/anotherMain'


app.use(function(req, res, next)

  var index = req.url.lastIndexOf('/');

  //We are checking to see if there is an extra slash first
  if(req.url[index+1] == null || req.url[index+1] == undefined || req.url[index+1] == '/')
     //slashes are wrong
     res.send("please enter a correct url");
     res.end();
  else

      for(var item in urls)
         if(req.url != item && req.url.toUpperCase() == item.toUpperCase())
           res.redirect(item);
           console.log("redirected");
           //redirected
         else if (req.url == item) 
           console.log("correct url");
           next();
         else
           //url doesn't exist
         
     

  
  next();

);

app.get('/main', function(req, res)
  res.render('mainpage');
);

app.get('/anotherMain', function(req, res)
  res.send("here here");
);

用法

您所要做的就是将您的 urls 添加到urls 对象,就像上面所做的那样,并为其赋予相同的键值。而已。看看它是多么容易。现在您的所有客户请求都将被重定向到正确的页面区分大小写

更新

我也为POST请求做了一个,我觉得很准确,你也应该试一试。如果您想在用户混淆斜线时进行重定向,则需要为它写一些regex。我没有时间,我的大脑也被炸了,所以我做了一个简单的。你可以随心所欲地改变它。每个网络结构都有自己的一套规则。

var urlsPOST = 
  '/upload' : '/upload'


app.use(function(req, res, next)

  if(req.method == 'POST')

    var index = req.url.lastIndexOf('/');

    if(req.url[index+1] == null || req.url[index+1] == undefined || req.url[index+1] == '/')

       //slashes are wrong
       res.sendStatus(400);
       res.end();
       return false;

    else

      for(var item in urlsPOST)
          if(req.url != item && req.url.toUpperCase() == item.toUpperCase())
            res.redirect(307, item);
            res.end();
            return false;
            //redirected

          else if (req.url == item) 
            console.log("correct url");
            next();

          else
            res.sendStatus(404).send("invalid URL");
            return false;
            //url doesn't exist
          
      
    
  
  next();
);

【讨论】:

【参考方案2】:

您可能想为此编写自己的中间件,类似于以下内容:

app.set('case sensitive routing', true);

/* all existing routes here */

app.use(function(req, res, next) 
  var url = find_correct_url(req.url); // special urls only
  if(url)
    res.redirect(url); // redirect to special url
  else if(req.url.toLowerCase() !=== req.url)
    res.redirect(req.url.toLowerCase()); // lets try the lower case version
  else
    next(); // url is not special, and is already lower case
  ;
);

现在请记住,这个中间件可以放在所有当前路由之后,这样如果它与现有路由不匹配,您可以尝试查找它应该是什么。如果您使用不区分大小写的路由匹配,您可能希望在路由之前执行此操作。

【讨论】:

但是非 GET 请求呢?那么像somePath 这样的区分大小写的路由呢?它们可以挂载路由,即路由段不会是 url 中初始 / 之后的第一个。 这将获取所有路由类型,但是您只能对 GET 请求进行重定向并保留所有内容。如果您想尝试做一些更智能的匹配(在第 1 行插入区分大小写之后),您可以使用 app._router.stack 列出所有路由并尝试找到区分大小写的部分【参考方案3】:

使用与@user8377060 相同的代码 只需使用正则表达式即可。

  // an array of all my urls
  var urls = [
    '/main',
    '/anotherMain'
  ]

  app.use(function(req, res, next)

    var index = req.url.lastIndexOf('/');

    //We are checking to see if there is an extra slash first
    if(req.url[index+1] == null || req.url[index+1] == undefined || req.url[index+1] == '/')
     //slashes are wrong
     res.send("please enter a correct url");
     res.end();
    else

      for(var item in urls)
         var currentUrl = new RegExp(item, 'i');

         if(req.url != item && currentUrl.test(item))
           res.redirect(item);
           console.log("redirected");
           //redirected
         else if (req.url == item) 
           console.log("correct url");
           next();
         else
           //url doesn't exist
         
     

    
    next();

  );

【讨论】:

感谢您的想法。但是,我没有理由使用新的RegExp。它需要逃避。它将松散地匹配段,这通常是不可取的。如果urls 中的 URL 段应该是正则表达式,则可以将它们设为正则表达式。

以上是关于ExpressJS 路由器规范化/规范 url的主要内容,如果未能解决你的问题,请参考以下文章

php开发规范

ASP.NET 路由

新 HTTP 规范 (RFC 7231) 中的“欺骗性请求路由”是啥意思?

Rspec:在路由规范中添加一些头请求

如何使用带有历史回退和 expressjs 路由的 vuejs 路由

ExpressJS - 嵌套/链接资源的 RESTful 路由设计