(exclude_fnmatch): New function.
[gnulib.git] / lib / exclude.c
1 /* exclude.c -- exclude file names
2
3    Copyright (C) 1992, 1993, 1994, 1997, 1999, 2000, 2001, 2002, 2003,
4    2004, 2005, 2006 Free Software Foundation, Inc.
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 2, or (at your option)
9    any later version.
10
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15
16    You should have received a copy of the GNU General Public License
17    along with this program; see the file COPYING.
18    If not, write to the Free Software Foundation,
19    51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
20
21 /* Written by Paul Eggert <eggert@twinsun.com>  */
22
23 #ifdef HAVE_CONFIG_H
24 # include <config.h>
25 #endif
26
27 #include <stdbool.h>
28
29 #include <ctype.h>
30 #include <errno.h>
31 #include <stddef.h>
32 #include <stdio.h>
33 #include <stdlib.h>
34 #include <string.h>
35
36 #include "exclude.h"
37 #include "fnmatch.h"
38 #include "strcase.h"
39 #include "xalloc.h"
40 #include "verify.h"
41
42 #if USE_UNLOCKED_IO
43 # include "unlocked-io.h"
44 #endif
45
46 #if STDC_HEADERS || (! defined isascii && ! HAVE_ISASCII)
47 # define IN_CTYPE_DOMAIN(c) true
48 #else
49 # define IN_CTYPE_DOMAIN(c) isascii (c)
50 #endif
51
52 static inline bool
53 is_space (unsigned char c)
54 {
55   return IN_CTYPE_DOMAIN (c) && isspace (c);
56 }
57
58 /* Non-GNU systems lack these options, so we don't need to check them.  */
59 #ifndef FNM_CASEFOLD
60 # define FNM_CASEFOLD 0
61 #endif
62 #ifndef FNM_LEADING_DIR
63 # define FNM_LEADING_DIR 0
64 #endif
65
66 verify (((EXCLUDE_ANCHORED | EXCLUDE_INCLUDE | EXCLUDE_WILDCARDS)
67          & (FNM_PATHNAME | FNM_NOESCAPE | FNM_PERIOD | FNM_LEADING_DIR
68             | FNM_CASEFOLD))
69         == 0);
70
71 /* An exclude pattern-options pair.  The options are fnmatch options
72    ORed with EXCLUDE_* options.  */
73
74 struct patopts
75   {
76     char const *pattern;
77     int options;
78   };
79
80 /* An exclude list, of pattern-options pairs.  */
81
82 struct exclude
83   {
84     struct patopts *exclude;
85     size_t exclude_alloc;
86     size_t exclude_count;
87   };
88
89 /* Return a newly allocated and empty exclude list.  */
90
91 struct exclude *
92 new_exclude (void)
93 {
94   return xzalloc (sizeof *new_exclude ());
95 }
96
97 /* Free the storage associated with an exclude list.  */
98
99 void
100 free_exclude (struct exclude *ex)
101 {
102   free (ex->exclude);
103   free (ex);
104 }
105
106 /* Return zero if PATTERN matches F, obeying OPTIONS, except that
107    (unlike fnmatch) wildcards are disabled in PATTERN.  */
108
109 static int
110 fnmatch_no_wildcards (char const *pattern, char const *f, int options)
111 {
112   if (! (options & FNM_LEADING_DIR))
113     return ((options & FNM_CASEFOLD)
114             ? strcasecmp (pattern, f)
115             : strcmp (pattern, f));
116   else
117     {
118       size_t patlen = strlen (pattern);
119       int r = ((options & FNM_CASEFOLD)
120                 ? strncasecmp (pattern, f, patlen)
121                 : strncmp (pattern, f, patlen));
122       if (! r)
123         {
124           r = f[patlen];
125           if (r == '/')
126             r = 0;
127         }
128       return r;
129     }
130 }
131
132 bool
133 exclude_fnmatch (char const *pattern, char const *f, int options)
134 {
135   int (*matcher) (char const *, char const *, int) =
136     (options & EXCLUDE_WILDCARDS
137      ? fnmatch
138      : fnmatch_no_wildcards);
139   bool matched = ((*matcher) (pattern, f, options) == 0);
140   char const *p;
141
142   if (! (options & EXCLUDE_ANCHORED))
143     for (p = f; *p && ! matched; p++)
144       if (*p == '/' && p[1] != '/')
145         matched = ((*matcher) (pattern, p + 1, options) == 0);
146
147   return matched;
148 }
149
150 /* Return true if EX excludes F.  */
151
152 bool
153 excluded_file_name (struct exclude const *ex, char const *f)
154 {
155   size_t exclude_count = ex->exclude_count;
156
157   /* If no options are given, the default is to include.  */
158   if (exclude_count == 0)
159     return false;
160   else
161     {
162       struct patopts const *exclude = ex->exclude;
163       size_t i;
164
165       /* Otherwise, the default is the opposite of the first option.  */
166       bool excluded = !! (exclude[0].options & EXCLUDE_INCLUDE);
167
168       /* Scan through the options, seeing whether they change F from
169          excluded to included or vice versa.  */
170       for (i = 0;  i < exclude_count;  i++)
171         {
172           char const *pattern = exclude[i].pattern;
173           int options = exclude[i].options;
174           if (excluded == !! (options & EXCLUDE_INCLUDE))
175             excluded ^= exclude_fnmatch (pattern, f, options);
176         }
177
178       return excluded;
179     }
180 }
181
182 /* Append to EX the exclusion PATTERN with OPTIONS.  */
183
184 void
185 add_exclude (struct exclude *ex, char const *pattern, int options)
186 {
187   struct patopts *patopts;
188
189   if (ex->exclude_count == ex->exclude_alloc)
190     ex->exclude = x2nrealloc (ex->exclude, &ex->exclude_alloc,
191                               sizeof *ex->exclude);
192
193   patopts = &ex->exclude[ex->exclude_count++];
194   patopts->pattern = pattern;
195   patopts->options = options;
196 }
197
198 /* Use ADD_FUNC to append to EX the patterns in FILE_NAME, each with
199    OPTIONS.  LINE_END terminates each pattern in the file.  If
200    LINE_END is a space character, ignore trailing spaces and empty
201    lines in FILE.  Return -1 on failure, 0 on success.  */
202
203 int
204 add_exclude_file (void (*add_func) (struct exclude *, char const *, int),
205                   struct exclude *ex, char const *file_name, int options,
206                   char line_end)
207 {
208   bool use_stdin = file_name[0] == '-' && !file_name[1];
209   FILE *in;
210   char *buf = NULL;
211   char *p;
212   char const *pattern;
213   char const *lim;
214   size_t buf_alloc = 0;
215   size_t buf_count = 0;
216   int c;
217   int e = 0;
218
219   if (use_stdin)
220     in = stdin;
221   else if (! (in = fopen (file_name, "r")))
222     return -1;
223
224   while ((c = getc (in)) != EOF)
225     {
226       if (buf_count == buf_alloc)
227         buf = x2realloc (buf, &buf_alloc);
228       buf[buf_count++] = c;
229     }
230
231   if (ferror (in))
232     e = errno;
233
234   if (!use_stdin && fclose (in) != 0)
235     e = errno;
236
237   buf = xrealloc (buf, buf_count + 1);
238   buf[buf_count] = line_end;
239   lim = buf + buf_count + ! (buf_count == 0 || buf[buf_count - 1] == line_end);
240   pattern = buf;
241
242   for (p = buf; p < lim; p++)
243     if (*p == line_end)
244       {
245         char *pattern_end = p;
246
247         if (is_space (line_end))
248           {
249             for (; ; pattern_end--)
250               if (pattern_end == pattern)
251                 goto next_pattern;
252               else if (! is_space (pattern_end[-1]))
253                 break;
254           }
255
256         *pattern_end = '\0';
257         (*add_func) (ex, pattern, options);
258
259       next_pattern:
260         pattern = p + 1;
261       }
262
263   errno = e;
264   return e ? -1 : 0;
265 }