1dd040301c496ff7b7b908925cc97a362ce974ec
[gnulib.git] / tests / uninorm / test-uninorm-filter-nfc.c
1 /* Test of canonical normalization of streams.
2    Copyright (C) 2009 Free Software Foundation, Inc.
3
4    This program is free software: you can redistribute it and/or modify
5    it under the terms of the GNU General Public License as published by
6    the Free Software Foundation; either version 3 of the License, or
7    (at your option) any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
12    GNU General Public License for more details.
13
14    You should have received a copy of the GNU General Public License
15    along with this program.  If not, see <http://www.gnu.org/licenses/>.  */
16
17 /* Written by Bruno Haible <bruno@clisp.org>, 2009.  */
18
19 #include <config.h>
20
21 #include "uninorm.h"
22
23 #include <stdio.h>
24 #include <stdlib.h>
25
26 #include "unistr.h"
27
28 #define SIZEOF(array) (sizeof (array) / sizeof (array[0]))
29 #define ASSERT(expr) \
30   do                                                                         \
31     {                                                                        \
32       if (!(expr))                                                           \
33         {                                                                    \
34           fprintf (stderr, "%s:%d: assertion failed\n", __FILE__, __LINE__); \
35           fflush (stderr);                                                   \
36           abort ();                                                          \
37         }                                                                    \
38     }                                                                        \
39   while (0)
40
41 /* A stream of Unicode characters that simply accumulates the contents.  */
42
43 struct accumulator
44 {
45   uint32_t *result;
46   size_t length;
47   size_t allocated;
48 };
49
50 static int
51 write_to_accumulator (void *stream_data, ucs4_t uc)
52 {
53   struct accumulator *accu = (struct accumulator *) stream_data;
54
55   if (accu->length == accu->allocated)
56     {
57       accu->allocated = 2 * accu->allocated + 1;
58       accu->result = (uint32_t *) realloc (accu->result, accu->allocated * sizeof (uint32_t));
59     }
60   accu->result[accu->length] = uc;
61   accu->length++;
62   return 0;
63 }
64
65 static int
66 check (const uint32_t *input, size_t input_length,
67        const uint32_t *expected, size_t expected_length)
68 {
69   struct accumulator accu;
70   struct uninorm_filter *filter;
71   size_t i;
72
73   accu.result = NULL;
74   accu.length = 0;
75   accu.allocated = 0;
76
77   filter = uninorm_filter_create (UNINORM_NFC, write_to_accumulator, &accu);
78   ASSERT (filter != NULL);
79
80   for (i = 0; i < input_length; i++)
81     ASSERT (uninorm_filter_write (filter, input[i]) == 0);
82
83   ASSERT (uninorm_filter_free (filter) == 0);
84
85   if (!(accu.result != NULL))
86     return 1;
87   if (!(accu.length == expected_length))
88     return 2;
89   if (!(u32_cmp (accu.result, expected, expected_length) == 0))
90     return 3;
91   free (accu.result);
92
93   return 0;
94 }
95
96 int
97 main ()
98 {
99   { /* "Grüß Gott. Здравствуйте! x=(-b±sqrt(b²-4ac))/(2a)  日本語,中文,한글" */
100     static const uint32_t input[] =
101       { 'G', 'r', 0x00FC, 0x00DF, ' ', 'G', 'o', 't', 't', '.', ' ',
102         0x0417, 0x0434, 0x0440, 0x0430, 0x0432, 0x0441, 0x0442, 0x0432, 0x0443,
103         0x0439, 0x0442, 0x0435, '!', ' ',
104         'x', '=', '(', '-', 'b', 0x00B1, 's', 'q', 'r', 't', '(', 'b', 0x00B2,
105         '-', '4', 'a', 'c', ')', ')', '/', '(', '2', 'a', ')', ' ', ' ',
106         0x65E5, 0x672C, 0x8A9E, ',', 0x4E2D, 0x6587, ',', 0xD55C, 0xAE00, '\n'
107       };
108     static const uint32_t decomposed[] =
109       { 'G', 'r', 0x0075, 0x0308, 0x00DF, ' ', 'G', 'o', 't', 't', '.', ' ',
110         0x0417, 0x0434, 0x0440, 0x0430, 0x0432, 0x0441, 0x0442, 0x0432, 0x0443,
111         0x0438, 0x0306, 0x0442, 0x0435, '!', ' ',
112         'x', '=', '(', '-', 'b', 0x00B1, 's', 'q', 'r', 't', '(', 'b', 0x00B2,
113         '-', '4', 'a', 'c', ')', ')', '/', '(', '2', 'a', ')', ' ', ' ',
114         0x65E5, 0x672C, 0x8A9E, ',', 0x4E2D, 0x6587, ',',
115         0x1112, 0x1161, 0x11AB, 0x1100, 0x1173, 0x11AF, '\n'
116       };
117     ASSERT (check (input, SIZEOF (input),           input, SIZEOF (input)) == 0);
118     ASSERT (check (decomposed, SIZEOF (decomposed), input, SIZEOF (input)) == 0);
119   }
120
121   return 0;
122 }