Avoid compiler warnings on Cygwin.
[gnulib.git] / tests / test-mbrtowc.c
1 /* Test of conversion of multibyte character to wide character.
2    Copyright (C) 2008 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation; either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>.  */
16
17 /* Written by Bruno Haible <bruno@clisp.org>, 2008.  */
18
19 #include <config.h>
20
21 #include <wchar.h>
22
23 #include <locale.h>
24 #include <stdio.h>
25 #include <stdlib.h>
26 #include <string.h>
27
28 #define ASSERT(expr) \
29   do                                                                         \
30     {                                                                        \
31       if (!(expr))                                                           \
32         {                                                                    \
33           fprintf (stderr, "%s:%d: assertion failed\n", __FILE__, __LINE__); \
34           fflush (stderr);                                                   \
35           abort ();                                                          \
36         }                                                                    \
37     }                                                                        \
38   while (0)
39
40 int
41 main (int argc, char *argv[])
42 {
43   mbstate_t state;
44   wchar_t wc;
45   size_t ret;
46
47   /* configure should already have checked that the locale is supported.  */
48   if (setlocale (LC_ALL, "") == NULL)
49     return 1;
50
51   /* Test zero-length input.  */
52   {
53     memset (&state, '\0', sizeof (mbstate_t));
54     wc = (wchar_t) 0xBADFACE;
55     ret = mbrtowc (&wc, "x", 0, &state);
56     /* gnulib's implementation returns (size_t)(-2).
57        The AIX 5.1 implementation returns (size_t)(-1).
58        glibc's implementation returns 0.  */
59     ASSERT (ret == (size_t)(-2) || ret == (size_t)(-1) || ret == 0);
60     ASSERT (mbsinit (&state));
61   }
62
63   /* Test NUL byte input.  */
64   {
65     memset (&state, '\0', sizeof (mbstate_t));
66     wc = (wchar_t) 0xBADFACE;
67     ret = mbrtowc (&wc, "", 1, &state);
68     ASSERT (ret == 0);
69     ASSERT (wc == 0);
70     ASSERT (mbsinit (&state));
71     ret = mbrtowc (NULL, "", 1, &state);
72     ASSERT (ret == 0);
73     ASSERT (mbsinit (&state));
74   }
75
76   /* Test single-byte input.  */
77   {
78     int c;
79     char buf[1];
80
81     memset (&state, '\0', sizeof (mbstate_t));
82     for (c = 0; c < 0x100; c++)
83       switch (c)
84         {
85         case '\t': case '\v': case '\f':
86         case ' ': case '!': case '"': case '#': case '%':
87         case '&': case '\'': case '(': case ')': case '*':
88         case '+': case ',': case '-': case '.': case '/':
89         case '0': case '1': case '2': case '3': case '4':
90         case '5': case '6': case '7': case '8': case '9':
91         case ':': case ';': case '<': case '=': case '>':
92         case '?':
93         case 'A': case 'B': case 'C': case 'D': case 'E':
94         case 'F': case 'G': case 'H': case 'I': case 'J':
95         case 'K': case 'L': case 'M': case 'N': case 'O':
96         case 'P': case 'Q': case 'R': case 'S': case 'T':
97         case 'U': case 'V': case 'W': case 'X': case 'Y':
98         case 'Z':
99         case '[': case '\\': case ']': case '^': case '_':
100         case 'a': case 'b': case 'c': case 'd': case 'e':
101         case 'f': case 'g': case 'h': case 'i': case 'j':
102         case 'k': case 'l': case 'm': case 'n': case 'o':
103         case 'p': case 'q': case 'r': case 's': case 't':
104         case 'u': case 'v': case 'w': case 'x': case 'y':
105         case 'z': case '{': case '|': case '}': case '~':
106           /* c is in the ISO C "basic character set".  */
107           buf[0] = c;
108           wc = (wchar_t) 0xBADFACE;
109           ret = mbrtowc (&wc, buf, 1, &state);
110           ASSERT (ret == 1);
111           ASSERT (wc == c);
112           ASSERT (mbsinit (&state));
113           ret = mbrtowc (NULL, buf, 1, &state);
114           ASSERT (ret == 1);
115           ASSERT (mbsinit (&state));
116           break;
117         }
118   }
119
120   /* Test special calling convention, passing a NULL pointer.  */
121   {
122     memset (&state, '\0', sizeof (mbstate_t));
123     wc = (wchar_t) 0xBADFACE;
124     ret = mbrtowc (&wc, NULL, 5, &state);
125     ASSERT (ret == 0);
126     ASSERT (wc == (wchar_t) 0xBADFACE);
127     ASSERT (mbsinit (&state));
128   }
129
130   if (argc > 1)
131     switch (argv[1][0])
132       {
133       case '1':
134         /* Locale encoding is ISO-8859-1 or ISO-8859-15.  */
135         {
136           char input[] = "B\374\337er"; /* "Büßer" */
137           memset (&state, '\0', sizeof (mbstate_t));
138
139           wc = (wchar_t) 0xBADFACE;
140           ret = mbrtowc (&wc, input, 1, &state);
141           ASSERT (ret == 1);
142           ASSERT (wc == 'B');
143           ASSERT (mbsinit (&state));
144           input[0] = '\0';
145
146           wc = (wchar_t) 0xBADFACE;
147           ret = mbrtowc (&wc, input + 1, 1, &state);
148           ASSERT (ret == 1);
149           ASSERT (wctob (wc) == (unsigned char) '\374');
150           ASSERT (mbsinit (&state));
151           input[1] = '\0';
152
153           wc = (wchar_t) 0xBADFACE;
154           ret = mbrtowc (&wc, input + 2, 3, &state);
155           ASSERT (ret == 1);
156           ASSERT (wctob (wc) == (unsigned char) '\337');
157           ASSERT (mbsinit (&state));
158           input[2] = '\0';
159
160           wc = (wchar_t) 0xBADFACE;
161           ret = mbrtowc (&wc, input + 3, 2, &state);
162           ASSERT (ret == 1);
163           ASSERT (wc == 'e');
164           ASSERT (mbsinit (&state));
165           input[3] = '\0';
166
167           wc = (wchar_t) 0xBADFACE;
168           ret = mbrtowc (&wc, input + 4, 1, &state);
169           ASSERT (ret == 1);
170           ASSERT (wc == 'r');
171           ASSERT (mbsinit (&state));
172         }
173         return 0;
174
175       case '2':
176         /* Locale encoding is UTF-8.  */
177         {
178           char input[] = "B\303\274\303\237er"; /* "Büßer" */
179           memset (&state, '\0', sizeof (mbstate_t));
180
181           wc = (wchar_t) 0xBADFACE;
182           ret = mbrtowc (&wc, input, 1, &state);
183           ASSERT (ret == 1);
184           ASSERT (wc == 'B');
185           ASSERT (mbsinit (&state));
186           input[0] = '\0';
187
188           wc = (wchar_t) 0xBADFACE;
189           ret = mbrtowc (&wc, input + 1, 1, &state);
190           ASSERT (ret == (size_t)(-2));
191           ASSERT (wc == (wchar_t) 0xBADFACE);
192           ASSERT (!mbsinit (&state));
193           input[1] = '\0';
194
195           wc = (wchar_t) 0xBADFACE;
196           ret = mbrtowc (&wc, input + 2, 5, &state);
197           ASSERT (ret == 1);
198           ASSERT (wctob (wc) == EOF);
199           ASSERT (mbsinit (&state));
200           input[2] = '\0';
201
202           wc = (wchar_t) 0xBADFACE;
203           ret = mbrtowc (&wc, input + 3, 4, &state);
204           ASSERT (ret == 2);
205           ASSERT (wctob (wc) == EOF);
206           ASSERT (mbsinit (&state));
207           input[3] = '\0';
208           input[4] = '\0';
209
210           wc = (wchar_t) 0xBADFACE;
211           ret = mbrtowc (&wc, input + 5, 2, &state);
212           ASSERT (ret == 1);
213           ASSERT (wc == 'e');
214           ASSERT (mbsinit (&state));
215           input[5] = '\0';
216
217           wc = (wchar_t) 0xBADFACE;
218           ret = mbrtowc (&wc, input + 6, 1, &state);
219           ASSERT (ret == 1);
220           ASSERT (wc == 'r');
221           ASSERT (mbsinit (&state));
222         }
223         return 0;
224
225       case '3':
226         /* Locale encoding is EUC-JP.  */
227         {
228           char input[] = "B\217\253\344\217\251\316er"; /* "Büßer" */
229           memset (&state, '\0', sizeof (mbstate_t));
230
231           wc = (wchar_t) 0xBADFACE;
232           ret = mbrtowc (&wc, input, 1, &state);
233           ASSERT (ret == 1);
234           ASSERT (wc == 'B');
235           ASSERT (mbsinit (&state));
236           input[0] = '\0';
237
238           wc = (wchar_t) 0xBADFACE;
239           ret = mbrtowc (&wc, input + 1, 1, &state);
240           ASSERT (ret == (size_t)(-2));
241           ASSERT (wc == (wchar_t) 0xBADFACE);
242           ASSERT (!mbsinit (&state));
243           input[1] = '\0';
244
245           wc = (wchar_t) 0xBADFACE;
246           ret = mbrtowc (&wc, input + 2, 7, &state);
247           ASSERT (ret == 2);
248           ASSERT (wctob (wc) == EOF);
249           ASSERT (mbsinit (&state));
250           input[2] = '\0';
251           input[3] = '\0';
252
253           wc = (wchar_t) 0xBADFACE;
254           ret = mbrtowc (&wc, input + 4, 5, &state);
255           ASSERT (ret == 3);
256           ASSERT (wctob (wc) == EOF);
257           ASSERT (mbsinit (&state));
258           input[4] = '\0';
259           input[5] = '\0';
260           input[6] = '\0';
261
262           wc = (wchar_t) 0xBADFACE;
263           ret = mbrtowc (&wc, input + 7, 2, &state);
264           ASSERT (ret == 1);
265           ASSERT (wc == 'e');
266           ASSERT (mbsinit (&state));
267           input[5] = '\0';
268
269           wc = (wchar_t) 0xBADFACE;
270           ret = mbrtowc (&wc, input + 8, 1, &state);
271           ASSERT (ret == 1);
272           ASSERT (wc == 'r');
273           ASSERT (mbsinit (&state));
274         }
275         return 0;
276
277       case '4':
278         /* Locale encoding is GB18030.  */
279         {
280           char input[] = "B\250\271\201\060\211\070er"; /* "Büßer" */
281           memset (&state, '\0', sizeof (mbstate_t));
282
283           wc = (wchar_t) 0xBADFACE;
284           ret = mbrtowc (&wc, input, 1, &state);
285           ASSERT (ret == 1);
286           ASSERT (wc == 'B');
287           ASSERT (mbsinit (&state));
288           input[0] = '\0';
289
290           wc = (wchar_t) 0xBADFACE;
291           ret = mbrtowc (&wc, input + 1, 1, &state);
292           ASSERT (ret == (size_t)(-2));
293           ASSERT (wc == (wchar_t) 0xBADFACE);
294           ASSERT (!mbsinit (&state));
295           input[1] = '\0';
296
297           wc = (wchar_t) 0xBADFACE;
298           ret = mbrtowc (&wc, input + 2, 7, &state);
299           ASSERT (ret == 1);
300           ASSERT (wctob (wc) == EOF);
301           ASSERT (mbsinit (&state));
302           input[2] = '\0';
303
304           wc = (wchar_t) 0xBADFACE;
305           ret = mbrtowc (&wc, input + 3, 6, &state);
306           ASSERT (ret == 4);
307           ASSERT (wctob (wc) == EOF);
308           ASSERT (mbsinit (&state));
309           input[3] = '\0';
310           input[4] = '\0';
311           input[5] = '\0';
312           input[6] = '\0';
313
314           wc = (wchar_t) 0xBADFACE;
315           ret = mbrtowc (&wc, input + 7, 2, &state);
316           ASSERT (ret == 1);
317           ASSERT (wc == 'e');
318           ASSERT (mbsinit (&state));
319           input[5] = '\0';
320
321           wc = (wchar_t) 0xBADFACE;
322           ret = mbrtowc (&wc, input + 8, 1, &state);
323           ASSERT (ret == 1);
324           ASSERT (wc == 'r');
325           ASSERT (mbsinit (&state));
326         }
327         return 0;
328       }
329
330   return 1;
331 }