GNU shell utilities
[gnulib.git] / lib / getopt.c
1 /* Getopt for GNU.
2    NOTE: getopt is now part of the C library, so if you don't know what
3    "Keep this file name-space clean" means, talk to roland@gnu.ai.mit.edu
4    before changing it!
5
6    Copyright (C) 1987, 88, 89, 90, 91, 92, 93, 94
7         Free Software Foundation, Inc.
8
9    This program is free software; you can redistribute it and/or modify it
10    under the terms of the GNU General Public License as published by the
11    Free Software Foundation; either version 2, or (at your option) any
12    later version.
13
14    This program is distributed in the hope that it will be useful,
15    but WITHOUT ANY WARRANTY; without even the implied warranty of
16    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
17    GNU General Public License for more details.
18
19    You should have received a copy of the GNU General Public License
20    along with this program; if not, write to the Free Software
21    Foundation, 675 Mass Ave, Cambridge, MA 02139, USA.  */
22 \f
23 /* This tells Alpha OSF/1 not to define a getopt prototype in <stdio.h>.
24    Ditto for AIX 3.2 and <stdlib.h>.  */
25 #ifndef _NO_PROTO
26 #define _NO_PROTO
27 #endif
28
29 #ifdef HAVE_CONFIG_H
30 #if defined (emacs) || defined (CONFIG_BROKETS)
31 /* We use <config.h> instead of "config.h" so that a compilation
32    using -I. -I$srcdir will use ./config.h rather than $srcdir/config.h
33    (which it would do because it found this file in $srcdir).  */
34 #include <config.h>
35 #else
36 #include "config.h"
37 #endif
38 #endif
39
40 #ifndef __STDC__
41 /* This is a separate conditional since some stdc systems
42    reject `defined (const)'.  */
43 #ifndef const
44 #define const
45 #endif
46 #endif
47
48 #include <stdio.h>
49
50 /* Comment out all this code if we are using the GNU C Library, and are not
51    actually compiling the library itself.  This code is part of the GNU C
52    Library, but also included in many other GNU distributions.  Compiling
53    and linking in this code is a waste when using the GNU C library
54    (especially if it is a shared library).  Rather than having every GNU
55    program understand `configure --with-gnu-libc' and omit the object files,
56    it is simpler to just do this in the source for each such file.  */
57
58 #if defined (_LIBC) || !defined (__GNU_LIBRARY__)
59
60
61 /* This needs to come after some library #include
62    to get __GNU_LIBRARY__ defined.  */
63 #ifdef  __GNU_LIBRARY__
64 /* Don't include stdlib.h for non-GNU C libraries because some of them
65    contain conflicting prototypes for getopt.  */
66 #include <stdlib.h>
67 #endif  /* GNU C library.  */
68
69 /* This version of `getopt' appears to the caller like standard Unix `getopt'
70    but it behaves differently for the user, since it allows the user
71    to intersperse the options with the other arguments.
72
73    As `getopt' works, it permutes the elements of ARGV so that,
74    when it is done, all the options precede everything else.  Thus
75    all application programs are extended to handle flexible argument order.
76
77    Setting the environment variable POSIXLY_CORRECT disables permutation.
78    Then the behavior is completely standard.
79
80    GNU application programs can use a third alternative mode in which
81    they can distinguish the relative order of options and other arguments.  */
82
83 #include "getopt.h"
84
85 /* For communication from `getopt' to the caller.
86    When `getopt' finds an option that takes an argument,
87    the argument value is returned here.
88    Also, when `ordering' is RETURN_IN_ORDER,
89    each non-option ARGV-element is returned here.  */
90
91 char *optarg = NULL;
92
93 /* Index in ARGV of the next element to be scanned.
94    This is used for communication to and from the caller
95    and for communication between successive calls to `getopt'.
96
97    On entry to `getopt', zero means this is the first call; initialize.
98
99    When `getopt' returns EOF, this is the index of the first of the
100    non-option elements that the caller should itself scan.
101
102    Otherwise, `optind' communicates from one call to the next
103    how much of ARGV has been scanned so far.  */
104
105 /* XXX 1003.2 says this must be 1 before any call.  */
106 int optind = 0;
107
108 /* The next char to be scanned in the option-element
109    in which the last option character we returned was found.
110    This allows us to pick up the scan where we left off.
111
112    If this is zero, or a null string, it means resume the scan
113    by advancing to the next ARGV-element.  */
114
115 static char *nextchar;
116
117 /* Callers store zero here to inhibit the error message
118    for unrecognized options.  */
119
120 int opterr = 1;
121
122 /* Set to an option character which was unrecognized.
123    This must be initialized on some systems to avoid linking in the
124    system's own getopt implementation.  */
125
126 int optopt = '?';
127
128 /* Describe how to deal with options that follow non-option ARGV-elements.
129
130    If the caller did not specify anything,
131    the default is REQUIRE_ORDER if the environment variable
132    POSIXLY_CORRECT is defined, PERMUTE otherwise.
133
134    REQUIRE_ORDER means don't recognize them as options;
135    stop option processing when the first non-option is seen.
136    This is what Unix does.
137    This mode of operation is selected by either setting the environment
138    variable POSIXLY_CORRECT, or using `+' as the first character
139    of the list of option characters.
140
141    PERMUTE is the default.  We permute the contents of ARGV as we scan,
142    so that eventually all the non-options are at the end.  This allows options
143    to be given in any order, even with programs that were not written to
144    expect this.
145
146    RETURN_IN_ORDER is an option available to programs that were written
147    to expect options and other ARGV-elements in any order and that care about
148    the ordering of the two.  We describe each non-option ARGV-element
149    as if it were the argument of an option with character code 1.
150    Using `-' as the first character of the list of option characters
151    selects this mode of operation.
152
153    The special argument `--' forces an end of option-scanning regardless
154    of the value of `ordering'.  In the case of RETURN_IN_ORDER, only
155    `--' can cause `getopt' to return EOF with `optind' != ARGC.  */
156
157 static enum
158 {
159   REQUIRE_ORDER, PERMUTE, RETURN_IN_ORDER
160 } ordering;
161 \f
162 #ifdef  __GNU_LIBRARY__
163 /* We want to avoid inclusion of string.h with non-GNU libraries
164    because there are many ways it can cause trouble.
165    On some systems, it contains special magic macros that don't work
166    in GCC.  */
167 #include <string.h>
168 #define my_index        strchr
169 #else
170
171 /* Avoid depending on library functions or files
172    whose names are inconsistent.  */
173
174 char *getenv ();
175
176 static char *
177 my_index (str, chr)
178      const char *str;
179      int chr;
180 {
181   while (*str)
182     {
183       if (*str == chr)
184         return (char *) str;
185       str++;
186     }
187   return 0;
188 }
189
190 /* If using GCC, we can safely declare strlen this way.
191    If not using GCC, it is ok not to declare it.  */
192 #ifdef __GNUC__
193 #ifndef __STDC__
194 /* Motorola Delta 68k R3V7 comes with GCC but not stddef.h.
195    Enable Emacs to compile on it.  */
196 #include <stddef.h>
197 extern size_t strlen (const char *);
198 #endif /* not __STDC__ */
199 #endif /* __GNUC__ */
200
201 #endif /* not __GNU_LIBRARY__ */
202 \f
203 /* Handle permutation of arguments.  */
204
205 /* Describe the part of ARGV that contains non-options that have
206    been skipped.  `first_nonopt' is the index in ARGV of the first of them;
207    `last_nonopt' is the index after the last of them.  */
208
209 static int first_nonopt;
210 static int last_nonopt;
211
212 /* Exchange two adjacent subsequences of ARGV.
213    One subsequence is elements [first_nonopt,last_nonopt)
214    which contains all the non-options that have been skipped so far.
215    The other is elements [last_nonopt,optind), which contains all
216    the options processed since those non-options were skipped.
217
218    `first_nonopt' and `last_nonopt' are relocated so that they describe
219    the new indices of the non-options in ARGV after they are moved.  */
220
221 static void
222 exchange (argv)
223      char **argv;
224 {
225   int bottom = first_nonopt;
226   int middle = last_nonopt;
227   int top = optind;
228   char *tem;
229
230   /* Exchange the shorter segment with the far end of the longer segment.
231      That puts the shorter segment into the right place.
232      It leaves the longer segment in the right place overall,
233      but it consists of two parts that need to be swapped next.  */
234
235   while (top > middle && middle > bottom)
236     {
237       if (top - middle > middle - bottom)
238         {
239           /* Bottom segment is the short one.  */
240           int len = middle - bottom;
241           register int i;
242
243           /* Swap it with the top part of the top segment.  */
244           for (i = 0; i < len; i++)
245             {
246               tem = argv[bottom + i];
247               argv[bottom + i] = argv[top - (middle - bottom) + i];
248               argv[top - (middle - bottom) + i] = tem;
249             }
250           /* Exclude the moved bottom segment from further swapping.  */
251           top -= len;
252         }
253       else
254         {
255           /* Top segment is the short one.  */
256           int len = top - middle;
257           register int i;
258
259           /* Swap it with the bottom part of the bottom segment.  */
260           for (i = 0; i < len; i++)
261             {
262               tem = argv[bottom + i];
263               argv[bottom + i] = argv[middle + i];
264               argv[middle + i] = tem;
265             }
266           /* Exclude the moved top segment from further swapping.  */
267           bottom += len;
268         }
269     }
270
271   /* Update records for the slots the non-options now occupy.  */
272
273   first_nonopt += (optind - last_nonopt);
274   last_nonopt = optind;
275 }
276
277 /* Initialize the internal data when the first call is made.  */
278
279 static const char *
280 _getopt_initialize (optstring)
281      const char *optstring;
282 {
283   /* Start processing options with ARGV-element 1 (since ARGV-element 0
284      is the program name); the sequence of previously skipped
285      non-option ARGV-elements is empty.  */
286
287   first_nonopt = last_nonopt = optind = 1;
288
289   nextchar = NULL;
290
291   /* Determine how to handle the ordering of options and nonoptions.  */
292
293   if (optstring[0] == '-')
294     {
295       ordering = RETURN_IN_ORDER;
296       ++optstring;
297     }
298   else if (optstring[0] == '+')
299     {
300       ordering = REQUIRE_ORDER;
301       ++optstring;
302     }
303   else if (getenv ("POSIXLY_CORRECT") != NULL)
304     ordering = REQUIRE_ORDER;
305   else
306     ordering = PERMUTE;
307
308   return optstring;
309 }
310 \f
311 /* Scan elements of ARGV (whose length is ARGC) for option characters
312    given in OPTSTRING.
313
314    If an element of ARGV starts with '-', and is not exactly "-" or "--",
315    then it is an option element.  The characters of this element
316    (aside from the initial '-') are option characters.  If `getopt'
317    is called repeatedly, it returns successively each of the option characters
318    from each of the option elements.
319
320    If `getopt' finds another option character, it returns that character,
321    updating `optind' and `nextchar' so that the next call to `getopt' can
322    resume the scan with the following option character or ARGV-element.
323
324    If there are no more option characters, `getopt' returns `EOF'.
325    Then `optind' is the index in ARGV of the first ARGV-element
326    that is not an option.  (The ARGV-elements have been permuted
327    so that those that are not options now come last.)
328
329    OPTSTRING is a string containing the legitimate option characters.
330    If an option character is seen that is not listed in OPTSTRING,
331    return '?' after printing an error message.  If you set `opterr' to
332    zero, the error message is suppressed but we still return '?'.
333
334    If a char in OPTSTRING is followed by a colon, that means it wants an arg,
335    so the following text in the same ARGV-element, or the text of the following
336    ARGV-element, is returned in `optarg'.  Two colons mean an option that
337    wants an optional arg; if there is text in the current ARGV-element,
338    it is returned in `optarg', otherwise `optarg' is set to zero.
339
340    If OPTSTRING starts with `-' or `+', it requests different methods of
341    handling the non-option ARGV-elements.
342    See the comments about RETURN_IN_ORDER and REQUIRE_ORDER, above.
343
344    Long-named options begin with `--' instead of `-'.
345    Their names may be abbreviated as long as the abbreviation is unique
346    or is an exact match for some defined option.  If they have an
347    argument, it follows the option name in the same ARGV-element, separated
348    from the option name by a `=', or else the in next ARGV-element.
349    When `getopt' finds a long-named option, it returns 0 if that option's
350    `flag' field is nonzero, the value of the option's `val' field
351    if the `flag' field is zero.
352
353    The elements of ARGV aren't really const, because we permute them.
354    But we pretend they're const in the prototype to be compatible
355    with other systems.
356
357    LONGOPTS is a vector of `struct option' terminated by an
358    element containing a name which is zero.
359
360    LONGIND returns the index in LONGOPT of the long-named option found.
361    It is only valid when a long-named option has been found by the most
362    recent call.
363
364    If LONG_ONLY is nonzero, '-' as well as '--' can introduce
365    long-named options.  */
366
367 int
368 _getopt_internal (argc, argv, optstring, longopts, longind, long_only)
369      int argc;
370      char *const *argv;
371      const char *optstring;
372      const struct option *longopts;
373      int *longind;
374      int long_only;
375 {
376   optarg = NULL;
377
378   if (optind == 0)
379     optstring = _getopt_initialize (optstring);
380
381   if (nextchar == NULL || *nextchar == '\0')
382     {
383       /* Advance to the next ARGV-element.  */
384
385       if (ordering == PERMUTE)
386         {
387           /* If we have just processed some options following some non-options,
388              exchange them so that the options come first.  */
389
390           if (first_nonopt != last_nonopt && last_nonopt != optind)
391             exchange ((char **) argv);
392           else if (last_nonopt != optind)
393             first_nonopt = optind;
394
395           /* Skip any additional non-options
396              and extend the range of non-options previously skipped.  */
397
398           while (optind < argc
399                  && (argv[optind][0] != '-' || argv[optind][1] == '\0'))
400             optind++;
401           last_nonopt = optind;
402         }
403
404       /* The special ARGV-element `--' means premature end of options.
405          Skip it like a null option,
406          then exchange with previous non-options as if it were an option,
407          then skip everything else like a non-option.  */
408
409       if (optind != argc && !strcmp (argv[optind], "--"))
410         {
411           optind++;
412
413           if (first_nonopt != last_nonopt && last_nonopt != optind)
414             exchange ((char **) argv);
415           else if (first_nonopt == last_nonopt)
416             first_nonopt = optind;
417           last_nonopt = argc;
418
419           optind = argc;
420         }
421
422       /* If we have done all the ARGV-elements, stop the scan
423          and back over any non-options that we skipped and permuted.  */
424
425       if (optind == argc)
426         {
427           /* Set the next-arg-index to point at the non-options
428              that we previously skipped, so the caller will digest them.  */
429           if (first_nonopt != last_nonopt)
430             optind = first_nonopt;
431           return EOF;
432         }
433
434       /* If we have come to a non-option and did not permute it,
435          either stop the scan or describe it to the caller and pass it by.  */
436
437       if ((argv[optind][0] != '-' || argv[optind][1] == '\0'))
438         {
439           if (ordering == REQUIRE_ORDER)
440             return EOF;
441           optarg = argv[optind++];
442           return 1;
443         }
444
445       /* We have found another option-ARGV-element.
446          Skip the initial punctuation.  */
447
448       nextchar = (argv[optind] + 1
449                   + (longopts != NULL && argv[optind][1] == '-'));
450     }
451
452   /* Decode the current option-ARGV-element.  */
453
454   /* Check whether the ARGV-element is a long option.
455
456      If long_only and the ARGV-element has the form "-f", where f is
457      a valid short option, don't consider it an abbreviated form of
458      a long option that starts with f.  Otherwise there would be no
459      way to give the -f short option.
460
461      On the other hand, if there's a long option "fubar" and
462      the ARGV-element is "-fu", do consider that an abbreviation of
463      the long option, just like "--fu", and not "-f" with arg "u".
464
465      This distinction seems to be the most useful approach.  */
466
467   if (longopts != NULL
468       && (argv[optind][1] == '-'
469           || (long_only && (argv[optind][2] || !my_index (optstring, argv[optind][1])))))
470     {
471       char *nameend;
472       const struct option *p;
473       const struct option *pfound = NULL;
474       int exact = 0;
475       int ambig = 0;
476       int indfound;
477       int option_index;
478
479       for (nameend = nextchar; *nameend && *nameend != '='; nameend++)
480         /* Do nothing.  */ ;
481
482       /* Test all long options for either exact match
483          or abbreviated matches.  */
484       for (p = longopts, option_index = 0; p->name; p++, option_index++)
485         if (!strncmp (p->name, nextchar, nameend - nextchar))
486           {
487             if (nameend - nextchar == strlen (p->name))
488               {
489                 /* Exact match found.  */
490                 pfound = p;
491                 indfound = option_index;
492                 exact = 1;
493                 break;
494               }
495             else if (pfound == NULL)
496               {
497                 /* First nonexact match found.  */
498                 pfound = p;
499                 indfound = option_index;
500               }
501             else
502               /* Second or later nonexact match found.  */
503               ambig = 1;
504           }
505
506       if (ambig && !exact)
507         {
508           if (opterr)
509             fprintf (stderr, "%s: option `%s' is ambiguous\n",
510                      argv[0], argv[optind]);
511           nextchar += strlen (nextchar);
512           optind++;
513           return '?';
514         }
515
516       if (pfound != NULL)
517         {
518           option_index = indfound;
519           optind++;
520           if (*nameend)
521             {
522               /* Don't test has_arg with >, because some C compilers don't
523                  allow it to be used on enums.  */
524               if (pfound->has_arg)
525                 optarg = nameend + 1;
526               else
527                 {
528                   if (opterr)
529                     {
530                       if (argv[optind - 1][1] == '-')
531                         /* --option */
532                         fprintf (stderr,
533                                  "%s: option `--%s' doesn't allow an argument\n",
534                                  argv[0], pfound->name);
535                       else
536                         /* +option or -option */
537                         fprintf (stderr,
538                              "%s: option `%c%s' doesn't allow an argument\n",
539                              argv[0], argv[optind - 1][0], pfound->name);
540                     }
541                   nextchar += strlen (nextchar);
542                   return '?';
543                 }
544             }
545           else if (pfound->has_arg == 1)
546             {
547               if (optind < argc)
548                 optarg = argv[optind++];
549               else
550                 {
551                   if (opterr)
552                     fprintf (stderr, "%s: option `%s' requires an argument\n",
553                              argv[0], argv[optind - 1]);
554                   nextchar += strlen (nextchar);
555                   return optstring[0] == ':' ? ':' : '?';
556                 }
557             }
558           nextchar += strlen (nextchar);
559           if (longind != NULL)
560             *longind = option_index;
561           if (pfound->flag)
562             {
563               *(pfound->flag) = pfound->val;
564               return 0;
565             }
566           return pfound->val;
567         }
568
569       /* Can't find it as a long option.  If this is not getopt_long_only,
570          or the option starts with '--' or is not a valid short
571          option, then it's an error.
572          Otherwise interpret it as a short option.  */
573       if (!long_only || argv[optind][1] == '-'
574           || my_index (optstring, *nextchar) == NULL)
575         {
576           if (opterr)
577             {
578               if (argv[optind][1] == '-')
579                 /* --option */
580                 fprintf (stderr, "%s: unrecognized option `--%s'\n",
581                          argv[0], nextchar);
582               else
583                 /* +option or -option */
584                 fprintf (stderr, "%s: unrecognized option `%c%s'\n",
585                          argv[0], argv[optind][0], nextchar);
586             }
587           nextchar = (char *) "";
588           optind++;
589           return '?';
590         }
591     }
592
593   /* Look at and handle the next short option-character.  */
594
595   {
596     char c = *nextchar++;
597     char *temp = my_index (optstring, c);
598
599     /* Increment `optind' when we start to process its last character.  */
600     if (*nextchar == '\0')
601       ++optind;
602
603     if (temp == NULL || c == ':')
604       {
605         if (opterr)
606           {
607             /* 1003.2 specifies the format of this message.  */
608             fprintf (stderr, "%s: illegal option -- %c\n", argv[0], c);
609           }
610         optopt = c;
611         return '?';
612       }
613     if (temp[1] == ':')
614       {
615         if (temp[2] == ':')
616           {
617             /* This is an option that accepts an argument optionally.  */
618             if (*nextchar != '\0')
619               {
620                 optarg = nextchar;
621                 optind++;
622               }
623             else
624               optarg = NULL;
625             nextchar = NULL;
626           }
627         else
628           {
629             /* This is an option that requires an argument.  */
630             if (*nextchar != '\0')
631               {
632                 optarg = nextchar;
633                 /* If we end this ARGV-element by taking the rest as an arg,
634                    we must advance to the next element now.  */
635                 optind++;
636               }
637             else if (optind == argc)
638               {
639                 if (opterr)
640                   {
641                     /* 1003.2 specifies the format of this message.  */
642                     fprintf (stderr, "%s: option requires an argument -- %c\n",
643                              argv[0], c);
644                   }
645                 optopt = c;
646                 if (optstring[0] == ':')
647                   c = ':';
648                 else
649                   c = '?';
650               }
651             else
652               /* We already incremented `optind' once;
653                  increment it again when taking next ARGV-elt as argument.  */
654               optarg = argv[optind++];
655             nextchar = NULL;
656           }
657       }
658     return c;
659   }
660 }
661
662 int
663 getopt (argc, argv, optstring)
664      int argc;
665      char *const *argv;
666      const char *optstring;
667 {
668   return _getopt_internal (argc, argv, optstring,
669                            (const struct option *) 0,
670                            (int *) 0,
671                            0);
672 }
673
674 #endif  /* _LIBC or not __GNU_LIBRARY__.  */
675 \f
676 #ifdef TEST
677
678 /* Compile with -DTEST to make an executable for use in testing
679    the above definition of `getopt'.  */
680
681 int
682 main (argc, argv)
683      int argc;
684      char **argv;
685 {
686   int c;
687   int digit_optind = 0;
688
689   while (1)
690     {
691       int this_option_optind = optind ? optind : 1;
692
693       c = getopt (argc, argv, "abc:d:0123456789");
694       if (c == EOF)
695         break;
696
697       switch (c)
698         {
699         case '0':
700         case '1':
701         case '2':
702         case '3':
703         case '4':
704         case '5':
705         case '6':
706         case '7':
707         case '8':
708         case '9':
709           if (digit_optind != 0 && digit_optind != this_option_optind)
710             printf ("digits occur in two different argv-elements.\n");
711           digit_optind = this_option_optind;
712           printf ("option %c\n", c);
713           break;
714
715         case 'a':
716           printf ("option a\n");
717           break;
718
719         case 'b':
720           printf ("option b\n");
721           break;
722
723         case 'c':
724           printf ("option c with value `%s'\n", optarg);
725           break;
726
727         case '?':
728           break;
729
730         default:
731           printf ("?? getopt returned character code 0%o ??\n", c);
732         }
733     }
734
735   if (optind < argc)
736     {
737       printf ("non-option ARGV-elements: ");
738       while (optind < argc)
739         printf ("%s ", argv[optind++]);
740       printf ("\n");
741     }
742
743   exit (0);
744 }
745
746 #endif /* TEST */