1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
|
<?xml version="1.0" encoding="ISO-8859-1" ?>
<!DOCTYPE manualpage SYSTEM "./style/manualpage.dtd">
<?xml-stylesheet type="text/xsl" href="./style/manual.fr.xsl"?>
<!-- French translation : Lucien GENTIS -->
<!-- Reviewed by : Vincent Deffontaines -->
<!-- English Revision: 922907:932378 (outdated) -->
<!--
Licensed to the Apache Software Foundation (ASF) under one or more
contributor license agreements. See the NOTICE file distributed with
this work for additional information regarding copyright ownership.
The ASF licenses this file to You under the Apache License, Version 2.0
(the "License"); you may not use this file except in compliance with
the License. You may obtain a copy of the License at
http://www.apache.org/licenses/LICENSE-2.0
Unless required by applicable law or agreed to in writing, software
distributed under the License is distributed on an "AS IS" BASIS,
WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
See the License for the specific language governing permissions and
limitations under the License.
-->
<manualpage metafile="urlmapping.xml.meta">
<title> Mise en correspondance des URLs avec le système de fichiers</title>
<summary>
<p>Ce document explique comment le serveur HTTP Apache utilise l'URL contenue dans une
requête pour déterminer le noeud du système de fichier à partir duquel le
fichier devra être servi.</p>
</summary>
<section id="related"><title>Modules et directives concernés</title>
<related>
<modulelist>
<module>mod_alias</module>
<module>mod_proxy</module>
<module>mod_rewrite</module>
<module>mod_userdir</module>
<module>mod_speling</module>
<module>mod_vhost_alias</module>
</modulelist>
<directivelist>
<directive module="mod_alias">Alias</directive>
<directive module="mod_alias">AliasMatch</directive>
<directive module="mod_speling">CheckSpelling</directive>
<directive module="core">DocumentRoot</directive>
<directive module="core">ErrorDocument</directive>
<directive module="core">Options</directive>
<directive module="mod_proxy">ProxyPass</directive>
<directive module="mod_proxy">ProxyPassReverse</directive>
<directive module="mod_proxy">ProxyPassReverseCookieDomain</directive>
<directive module="mod_proxy">ProxyPassReverseCookiePath</directive>
<directive module="mod_alias">Redirect</directive>
<directive module="mod_alias">RedirectMatch</directive>
<directive module="mod_rewrite">RewriteCond</directive>
<directive module="mod_rewrite">RewriteRule</directive>
<directive module="mod_alias">ScriptAlias</directive>
<directive module="mod_alias">ScriptAliasMatch</directive>
<directive module="mod_userdir">UserDir</directive>
</directivelist>
</related>
</section>
<section id="documentroot"><title>Racine des documents (DocumentRoot)</title>
<p>La méthode par défaut de httpd pour déterminer quel fichier servir pour
une requête donnée, consiste à extraire le chemin du fichier de la requête
(la partie de l'URL qui suit le nom d'hôte et le port), puis de l'ajouter
à la fin de la valeur de la directive
<directive module="core">DocumentRoot</directive> définie dans vos fichiers
de configuration.
Ainsi, les fichiers et répertoires
situés en dessous de <directive module="core">DocumentRoot</directive>
constituent l'arborescence de base des documents qui seront visibles
depuis le web.</p>
<p>Par exemple, si la directive
<directive module="core">DocumentRoot</directive> contient
<code>/var/www/html</code>, une requête pour
<code>http://www.example.com/fish/guppies.html</code> retournera le
fichier <code>/var/www/html/fish/guppies.html</code> au client.</p>
<p>httpd supporte aussi les <a href="vhosts/">Hôtes virtuels</a>,
ce qui lui permet de traiter des requêtes pour plusieurs hôtes.
Dans ce cas, un <directive module="core">DocumentRoot</directive>
différent peut être défini pour chaque hôte virtuel;
les directives fournies par le module
<module>mod_vhost_alias</module> peuvent aussi être utilisées afin de
déterminer dynamiquement le noeud approprié du système de fichiers
à partir duquel servir un contenu en fonction de l'adresse IP
ou du nom d'hôte.</p>
<p>La directive <directive module="core">DocumentRoot</directive> est
définie dans le fichier de configuration de votre serveur principal
(<code>httpd.conf</code>), mais peut aussi être redéfinie pour chaque
<a href="vhosts/">Hôte virtuel</a> supplémentaire que vous avez créé.</p>
</section>
<section id="outside"><title>Fichiers situés en dehors de
l'arborescence DocumentRoot</title>
<p>Il existe de nombreuses circonstances pour lesquelles il est nécessaire
d'autoriser l'accès web à des portions du système de fichiers qui ne se
trouvent pas dans l'arborescence <directive
module="core">DocumentRoot</directive>. httpd propose de nombreuses
solutions pour réaliser cela. Sur les systèmes Unix, les liens
symboliques permettent de rattacher d'autres portions du système de
fichiers au <directive
module="core">DocumentRoot</directive>. Pour des raisons de sécurité,
httpd ne suivra les liens symboliques que si les <directive
module="core">Options</directive> pour le répertoire concerné contiennent
<code>FollowSymLinks</code> ou <code>SymLinksIfOwnerMatch</code>.</p>
<p>Une autre méthode consiste à utiliser la directive <directive
module="mod_alias">Alias</directive> pour rattacher toute portion
du système de fichiers à l'arborescence du site web. Par exemple, avec</p>
<example>Alias /docs /var/web</example>
<p>l'URL <code>http://www.example.com/docs/dir/file.html</code>
correspondra au fichier <code>/var/web/dir/file.html</code>. La
directive
<directive module="mod_alias">ScriptAlias</directive>
fonctionne de la même manière, excepté que tout contenu localisé dans le
chemin cible sera traité comme un script <glossary ref="cgi"
>CGI</glossary>.</p>
<p>Pour les situations qui nécessitent plus de flexibilité, vous disposez
des directives <directive module="mod_alias">AliasMatch</directive>
et <directive module="mod_alias">ScriptAliasMatch</directive>
qui permettent des substitutions et comparaisons puissantes basées
sur les <glossary ref="regex">expressions rationnelles</glossary>.
Par exemple,</p>
<example>ScriptAliasMatch ^/~([a-zA-Z0-9]+)/cgi-bin/(.+)
/home/$1/cgi-bin/$2</example>
<p>fera correspondre une requête du style
<code>http://example.com/~user/cgi-bin/script.cgi</code> au chemin
<code>/home/user/cgi-bin/script.cgi</code>, et traitera le fichier résultant
comme un script CGI.</p>
</section>
<section id="user"><title>Répertoires des utilisateurs</title>
<p>Sur les systèmes Unix, on peut traditionnellement faire référence
au répertoire personnel d'un <em>utilisateur</em> particulier à l'aide de
l'expression <code>~user/</code>.
Le module <module>mod_userdir</module>
étend cette idée au web en autorisant l'accès aux fichiers situés dans les
répertoires home des utilisateurs à l'aide d'URLs
comme dans ce qui suit :</p>
<example>http://www.example.com/~user/file.html</example>
<p>Pour des raisons de sécurité, il est déconseillé de permettre un accès
direct à un répertoire home d'utilisateur depuis le web. A cet effet, la
directive <directive module="mod_userdir">UserDir</directive>
spécifie un répertoire où sont situés les fichiers accessibles depuis le web
dans le répertoire home de l'utilisateur.
Avec la configuration par défaut
<code>Userdir public_html</code>, l'URL ci-dessus correspondra à un fichier
dont le chemin sera du style
<code>/home/user/public_html/file.html</code> où
<code>/home/user/</code> est le répertoire home de l'utilisateur tel qu'il
est défini dans <code>/etc/passwd</code>.</p>
<p>La directive <code>Userdir</code> met à votre disposition de nombreuses
formes différentes pour les systèmes où <code>/etc/passwd</code> ne
spécifie pas la localisation du répertoire home.</p>
<p>Certains jugent le symbole "~" (dont le code sur le web est souvent
<code>%7e</code>) inapproprié et préfèrent utiliser une chaîne de
caractères différente pour représenter les répertoires utilisateurs.
mod_userdir ne supporte pas cette fonctionnalité. Cependant, si les
répertoires home des utilisateurs sont structurés de manière rationnelle,
il est possible d'utiliser la directive
<directive module="mod_alias">AliasMatch</directive>
pour obtenir l'effet désiré. Par exemple, pour faire correspondre
<code>http://www.example.com/upages/user/file.html</code> à
<code>/home/user/public_html/file.html</code>, utilisez la directive
<code>AliasMatch</code> suivante :</p>
<example>AliasMatch ^/upages/([a-zA-Z0-9]+)/?(.*)
/home/$1/public_html/$2</example>
</section>
<section id="redirect"><title>Redirection d'URL</title>
<p>Les directives de configuration décrites dans les sections précédentes
demandent à httpd d'extraire un contenu depuis un emplacement spécifique
du système de fichiers
et de la retourner au client. Il est cependant parfois
souhaitable d'informer le
client que le contenu demandé est localisé à une URL différente, et de
demander au client d'élaborer une nouvelle requête avec la nouvelle URL.
Ce processus se nomme <em>redirection</em> et est implémenté par la
directive <directive module="mod_alias">Redirect</directive>.
Par exemple, si le contenu du répertoire <code>/foo/</code> sous
<directive module="core">DocumentRoot</directive> est déplacé vers le
nouveau répertoire <code>/bar/</code>, vous pouvez demander aux clients
de le requérir à sa nouvelle localisation comme suit :</p>
<example>Redirect permanent /foo/ http://www.example.com/bar/</example>
<p>Ceci aura pour effet de rediriger tout chemin d'URL commençant par
<code>/foo/</code> vers le même chemin d'URL sur le serveur
<code>www.example.com</code> en remplaçant <code>/foo/</code> par
<code>/bar/</code>. Vous pouvez rediriger les clients non seulement sur le
serveur d'origine, mais aussi vers n'importe quel autre serveur.</p>
<p>httpd propose aussi la directive <directive
module="mod_alias">RedirectMatch</directive> pour traiter les problèmes
de réécriture d'une plus grande complexité. Par exemple, afin de rediriger
les requêtes pour la page d'accueil du site vers un site différent, mais
laisser toutes les autres requêtes inchangées, utilisez la
configuration suivante :</p>
<example>RedirectMatch permanent ^/$
http://www.example.com/startpage.html</example>
<p>De même, pour rediriger temporairement toutes les pages d'un site
vers une page particulière d'un autre site, utilisez ce qui suit :</p>
<example>RedirectMatch temp .*
http://othersite.example.com/startpage.html</example>
</section>
<section id="proxy"><title>Mandataire inverse (Reverse Proxy)</title>
<p>httpd vous permet aussi de rapatrier des documents distants
dans l'espace des URL du serveur local.
Cette technique est appelée <em>mandataire inverse ou reverse
proxying</em> car le serveur web agit comme un serveur mandataire en
rapatriant les documents depuis un serveur distant puis les renvoyant
au client. Ceci diffère d'un service de proxy usuel car, pour le client,
les documents semblent appartenir au serveur mandataire inverse.</p>
<p>Dans l'exemple suivant, quand les clients demandent des documents situés
dans le répertoire
<code>/foo/</code>, le serveur rapatrie ces documents depuis le répertoire
<code>/bar/</code> sur <code>internal.example.com</code>
et les renvoie au client comme s'ils appartenaient au serveur local.</p>
<example>
ProxyPass /foo/ http://internal.example.com/bar/<br />
ProxyPassReverse /foo/ http://internal.example.com/bar/<br />
ProxyPassReverseCookieDomain internal.example.com public.example.com<br />
ProxyPassReverseCookiePath /foo/ /bar/
</example>
<p>La directive <directive module="mod_proxy">ProxyPass</directive> configure
le serveur pour rapatrier les documents appropriés, alors que la directive
<directive module="mod_proxy">ProxyPassReverse</directive>
réécrit les redirections provenant de
<code>internal.example.com</code> de telle manière qu'elles ciblent le
répertoire approprié sur le serveur local. De manière similaire, les directives
<directive module="mod_proxy">ProxyPassReverseCookieDomain</directive>
et <directive module="mod_proxy">ProxyPassReverseCookiePath</directive>
réécrivent les cookies élaborés par le serveur d'arrière-plan.</p>
<p>Il est important de noter cependant, que les liens situés dans les documents
ne seront pas réécrits. Ainsi, tout lien absolu sur
<code>internal.example.com</code> fera décrocher le client
du serveur mandataire et effectuer sa requête directement sur
<code>internal.example.com</code>. Un module tiers
<a href="http://apache.webthing.com/mod_proxy_html/">mod_proxy_html</a>
permet de réécrire les liens dans les documents HTML et XHTML.</p>
</section>
<section id="rewrite"><title>Moteur de réécriture</title>
<p>Le moteur de réécriture <module>mod_rewrite</module> peut s'avérer
utile lorsqu'une substitution plus puissante est nécessaire.
Les directives fournies par ce module utilisent des caractéristiques de la
requête comme le type de navigateur ou l'adresse IP source afin de décider
depuis où servir le contenu. En outre, mod_rewrite peut utiliser des
fichiers ou programmes de bases de données externes pour déterminer comment
traiter une requête. Le moteur de réécriture peut effectuer les trois types
de mise en correspondance discutés plus haut :
redirections internes (aliases), redirections externes, et services mandataires.
De nombreux exemples pratiques utilisant mod_rewrite sont discutés dans la
<a href="rewrite/">documentation détaillée de mod_rewrite</a>.</p>
</section>
<section id="notfound"><title>Fichier non trouvé (File Not Found)</title>
<p>Inévitablement, apparaîtront des URLs qui ne correspondront à aucun
fichier du système de fichiers.
Ceci peut arriver pour de nombreuses raisons.
Il peut s'agir du déplacement de documents d'une
localisation vers une autre. Dans ce cas, le mieux est d'utiliser la
<a href="#redirect">redirection d'URL</a> pour informer les clients de la
nouvelle localisation de la ressource. De cette façon, vous êtes sur que
les anciens signets et liens continueront de fonctionner, même si la
ressource est déplacée.</p>
<p>Une autre cause fréquente d'erreurs "File Not Found" est l'erreur de
frappe accidentelle dans les URLs, soit directement dans le navigateur,
soit dans les liens HTML. httpd propose le module
<module>mod_speling</module> (sic) pour tenter de résoudre ce problème.
Lorsque ce module est activé, il intercepte les erreurs
"File Not Found" et recherche une ressource possédant un nom de fichier
similaire. Si un tel fichier est trouvé, mod_speling va envoyer une
redirection HTTP au client pour lui communiquer l'URL correcte.
Si plusieurs fichiers proches sont trouvés, une liste des alternatives
possibles sera présentée au client.</p>
<p>mod_speling possède une fonctionnalité particulièrement utile :
il compare les noms de fichiers sans tenir compte de la casse.
Ceci peut aider les systèmes où les utilisateurs ne connaissent pas la
sensibilité des URLs à la casse et bien sûr les systèmes de fichiers unix.
Mais l'utilisation de mod_speling pour toute autre chose que la correction
occasionnelle d'URLs peut augmenter la charge du serveur, car chaque
requête "incorrecte" entraîne une redirection d'URL et une nouvelle requête
de la part du client.</p>
<p>Si toutes les tentatives pour localiser le contenu
échouent, httpd
retourne une page d'erreur avec le code de statut HTTP 404
(file not found). L'apparence de cette page est contrôlée à l'aide de la
directive <directive module="core">ErrorDocument</directive>
et peut être personnalisée de manière très flexible comme discuté dans le
document
<a href="custom-error.html">Réponses personnalisées aux erreurs</a>.</p>
</section>
</manualpage>
|