具有重写规则的法语字符

Posted

技术标签:

【中文标题】具有重写规则的法语字符【英文标题】:French characters with rewrite rule 【发布时间】:2013-01-24 17:01:10 【问题描述】:

我的数据库中有类别名称,一些主题有法语字符,如 é è ê。 它可以正常工作,直到今天我尝试向其中添加另一个字符 à 然后我开始收到 SERVER ERROR

这是我的 .htaccess:

Options +FollowSymlinks
RewriteEngine on
RewriteRule ^([A-Za-z0-9éèêà_-\s]+)-(\d+)\.htm$   classified.php?id=$2 [L]

如您所见,没有 à 也可以正常工作。

如何将那个东西添加到正则表达式中?

【问题讨论】:

检查这个:htaccess Mod_rewrite with accents。事实上,将重音字符放在 .htaccess 中似乎是不可能的。 Apache docs on mod_rewrite's b flag 应该可以帮助您。 为什么不使用 [^accented]?我认为在某些情况下它更好 网址中的重音符号/外来字符通常会避开(除非在 ?'s 之后),因为如果某些用户在浏览器中手动输入/不要输入,则很难输入有一个可以轻松输入这些字符/等的外来键盘。 不是重复但值得考虑:***.com/questions/1386262/… 【参考方案1】:

似乎 URL 中的扩展 ASCII 字符以 UTF-8 和 url 编码形式发送。例如:

/éèêà-1.htm -> /%C3%A9%C3%A8%C3%AA%C3%A0-1.htm

上面的 URL 可以这样被 mod_rewrite 匹配:

RewriteEngine On
RewriteRule ^(?:\w|\xC3\xA9|\xC3\xA8|\xC3\xAA|\xC3\xA0)+-(\d+)\.htm$ classified.php?id=$1 [L]

【讨论】:

【参考方案2】:

如果您使用各种字符和重音字母,那么为什么不让任何东西过去呢?

注意:使用此规则也将允许空格;

Options +FollowSymlinks
RewriteEngine on
RewriteRule ^(.*)-(\d+)\.htm$   classified.php?id=$2 [L]

稍后如果你决定限制正则表达式,假设你不想要这些字符中的任何一个 # $ % 那么你必须做出例外:

   Options +FollowSymlinks
  RewriteEngine on
  RewriteRule ^([^#$%]+)-(\d+)\.htm$   classified.php?id=$2 [L]

【讨论】:

以上是关于具有重写规则的法语字符的主要内容,如果未能解决你的问题,请参考以下文章

PHP中查询字符串的HTACCESS重写规则

重写正则表达式,至少有一个字符的 URL

java覆盖重写规则

301 Htaccess 重写规则查询字符串

IIS URL重写非英文字符的规则问题

需要在 .htaccess 重写规则中转义 # (hash/pound) 字符