.htaccess 多语言网站规则

Posted

技术标签:

【中文标题】.htaccess 多语言网站规则【英文标题】:.htaccess rule for multilingual site 【发布时间】:2013-11-07 18:43:43 【问题描述】:

我正在重新设计一个 php 多语言站点的 URL (en|es|de|fr|ru)。该网站的网址是这样的:

www.mysite.com/page
www.mysite.com/page/subpage1
www.mysite.com/page/subpage1/subpage2
www.mysite.com/page/subpage1/subpage2/subpage3

最多四个级别的子目录(产品、子产品等)。语言作为 GET 参数传递:

www.mysite.com/page?lang=es

www.mysite.com/page/subpage1/subpage2?lang=de

当前的 .htaccess 是这样的:

Options +FollowSymlinks +MultiViews -Indexes
RewriteEngine on

RewriteBase /

# Redirect all versions of homepage to www.mysite.com
RewriteCond %REQUEST_URI ^/index\.html$
RewriteRule ^index.html$ http://www.mysite.com/ [R=301,L]

# Redirect non-www to www traffic
RewriteCond %HTTP_HOST !^(www\.mysite\.com)?$
RewriteRule (.*) http://www.mysite.com/$1 [R=301,L]

RewriteCond %SCRIPT_FILENAME !-d
RewriteCond %SCRIPT_FILENAME !-f

#Remove php extension
RewriteCond %REQUEST_URI ^(.*).php$
RewriteRule ^(.*)$ %1 [R=301,QSA] 

#Here I have a lot of 301 redirections, I ommit them for this example

# First level redirections
RewriteRule ^([0-9a-zA-Z\-\_]+)$ view?page=$1 [L,QSA]

# Second level redirections
#RewriteRule ^(page1|page2|page3)\/([0-9a-zA-Z\-\+\_\,\.\(\)]+)$ view?page=$1&subpage1=$2 [L,QSA]

# Third level redirections
RewriteRule ^([0-9a-zA-Z\-\_]+)\/([0-9a-zA-Z\-\+\_\,\.\(\)]+)\/([0-9a-zA-Z\-\_]+)$ view?page=$1&subpage1=$2&subpage2=$3 [L,QSA]

# Fourth level redirections
RewriteRule ^([0-9a-zA-Z\-\_]+)\/([0-9a-zA-Z\-]+)\/([0-9a-zA-Z\-]+)\/([0-9a-zA-Z\-]+)$ view?page=$1&subpage1=$2&subpage2=$3&subpage3=$4 [L,QSA]

现在,如果 URL (GET) 中没有语言参数,我想将整个站点重定向到带有前置语言子目录的 URL,如下所示(默认英语):

www.mysite.com/page -> www.mysite.com/en/page
www.mysite.com/page/subpage1 -> www.mysite.com/en/page/subpage1

如果在 URL 中传递了 GET 参数,我想重定向到正确的 URL:

www.mysite.com/page?lang=es -> www.mysite.com/es/page
www.mysite.com/page/subpage1?lang=es -> www.mysite.com/es/page/subpage1

我查看了其他类似的问题,但所有这些问题都是基于带有最后一个参数 ([R=301,L]) 的 301 重定向,我担心最后一个对我无效。

我有几个问题:

    有没有办法让 .htaccess 更容易,而不是为每个级别设置规则? 如果 URL 中没有传递 lang GET 参数,我如何将整个站点重定向到 www.mysite.com/en? 如何根据 lang GET 参数重定向到正确的本地化站点(www.mysite.com/page?lang=es -> 重定向到 www.mysite.com/es/page)

提前致谢

【问题讨论】:

【参考方案1】:

您可以将整个网站重定向到您的默认英文或网站的正确本地化版本,方法如下:

RewriteRule ^(en|es|de)/(.*)$  $2?lang=$1 [L,QSA]
RewriteRule ^(.*)$  $1?lang=en [L,QSA]

【讨论】:

感谢@Ilia Rostovtsev,这也有效,但anubhava 更适合我的问题。【参考方案2】:

您需要这些额外的规则:

# lang supplied in query string
RewriteCond %REQUEST_FILENAME !-f
RewriteCond %QUERY_STRING ^lang=([a-z]2)(?:&|$) [NC]
RewriteRule !^[a-z]2/ /%1/%REQUEST_URI? [L,NC,R=301]

# lang not supplied in query string
RewriteCond %REQUEST_FILENAME !-f
RewriteCond %QUERY_STRING !^lang=.+(&|$) [NC]
RewriteRule !^en/ /en/%REQUEST_URI [L,NC,R=301]

【讨论】:

如果ru lang 不受支持怎么办? :) 你的正则表达式会捕获,对吧? 如果不支持 ru lang 则/ru/ 目录也不存在,会发出 404。 这是对的,但对用户不是很友好。我认为如果语言或目录不存在,那么应该使用默认语言!这就是为什么最好不要捕获所有语言但拥有en|es|de。但我喜欢你的解决方案!总体来说非常好! 是的,没错,使用上面的^lang=(es|fr|de) type 条件可以轻松处理。 感谢@anubhava,它可以工作,但现在我无法加载所有图像和脚本,因为所有 URL 现在都是 html 页面 (/en/) 中的文件夹,但不在服务器的文件夹结构(例如,我无法从www.mysite.com/en/home 加载我的css 文件<link rel="stylesheet" href="./css/styles.css" type="text/css">,因为css 文件位于www.mysite.com/css/styles.css。如何从中恢复?

以上是关于.htaccess 多语言网站规则的主要内容,如果未能解决你的问题,请参考以下文章

.htaccess 多语言(slug URL/友好 URL)[关闭]

htaccess 带有子目录的多语言站点,默认为 301

纸壳CMS可视化建站系统搭建多语言网站

多语言 django 网站上的搜索功能

多语言网站和机器人检测

iOS 启动页多语言