New module 'mbsncasecmp'.
[gnulib.git] / lib / mbsncasecmp.c
1 /* Case-insensitive string comparison function.
2    Copyright (C) 1998-1999, 2005-2007 Free Software Foundation, Inc.
3    Written by Bruno Haible <bruno@clisp.org>, 2005,
4    based on earlier glibc code.
5
6    This program is free software; you can redistribute it and/or modify
7    it under the terms of the GNU General Public License as published by
8    the Free Software Foundation; either version 2, or (at your option)
9    any later version.
10
11    This program is distributed in the hope that it will be useful,
12    but WITHOUT ANY WARRANTY; without even the implied warranty of
13    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
14    GNU General Public License for more details.
15
16    You should have received a copy of the GNU General Public License
17    along with this program; if not, write to the Free Software Foundation,
18    Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301, USA.  */
19
20 #include <config.h>
21
22 /* Specification.  */
23 #include <string.h>
24
25 #include <ctype.h>
26 #include <limits.h>
27
28 #if HAVE_MBRTOWC
29 # include "mbuiter.h"
30 #endif
31
32 #define TOLOWER(Ch) (isupper (Ch) ? tolower (Ch) : (Ch))
33
34 /* Compare the initial segment of the character string S1 consisting of at most
35    N characters with the initial segment of the character string S2 consisting
36    of at most N characters, ignoring case, returning less than, equal to or
37    greater than zero if the initial segment of S1 is lexicographically less
38    than, equal to or greater than the initial segment of S2.
39    Note: This function may, in multibyte locales, return 0 for initial segments
40    of different lengths!  */
41 int
42 mbsncasecmp (const char *s1, const char *s2, size_t n)
43 {
44   if (s1 == s2 || n == 0)
45     return 0;
46
47   /* Be careful not to look at the entire extent of s1 or s2 until needed.
48      This is useful because when two strings differ, the difference is
49      most often already in the very few first characters.  */
50 #if HAVE_MBRTOWC
51   if (MB_CUR_MAX > 1)
52     {
53       mbui_iterator_t iter1;
54       mbui_iterator_t iter2;
55
56       mbui_init (iter1, s1);
57       mbui_init (iter2, s2);
58
59       while (mbui_avail (iter1) && mbui_avail (iter2))
60         {
61           int cmp = mb_casecmp (mbui_cur (iter1), mbui_cur (iter2));
62
63           if (cmp != 0)
64             return cmp;
65
66           if (--n == 0)
67             return 0;
68
69           mbui_advance (iter1);
70           mbui_advance (iter2);
71         }
72       if (mbui_avail (iter1))
73         /* s2 terminated before s1 and n.  */
74         return 1;
75       if (mbui_avail (iter2))
76         /* s1 terminated before s2 and n.  */
77         return -1;
78       return 0;
79     }
80   else
81 #endif
82     {
83       const unsigned char *p1 = (const unsigned char *) s1;
84       const unsigned char *p2 = (const unsigned char *) s2;
85       unsigned char c1, c2;
86
87       for (; ; p1++, p2++)
88         {
89           c1 = TOLOWER (*p1);
90           c2 = TOLOWER (*p2);
91
92           if (--n == 0 || c1 == '\0' || c1 != c2)
93             break;
94         }
95
96       if (UCHAR_MAX <= INT_MAX)
97         return c1 - c2;
98       else
99         /* On machines where 'char' and 'int' are types of the same size, the
100            difference of two 'unsigned char' values - including the sign bit -
101            doesn't fit in an 'int'.  */
102         return (c1 > c2 ? 1 : c1 < c2 ? -1 : 0);
103     }
104 }