New module 'unistr/u16-mbtoucr'.
[gnulib.git] / lib / unistr / u8-uctomb.c
1 /* Store a character in UTF-8 string.
2    Copyright (C) 2002, 2005-2006 Free Software Foundation, Inc.
3    Written by Bruno Haible <bruno@clisp.org>, 2002.
4
5    This program is free software; you can redistribute it and/or modify it
6    under the terms of the GNU Library General Public License as published
7    by the Free Software Foundation; either version 2, or (at your option)
8    any later version.
9
10    This program is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with this program; if not, write to the Free Software
17    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301,
18    USA.  */
19
20 #include <config.h>
21
22 /* Specification.  */
23 #include "unistr.h"
24
25 #if !HAVE_INLINE
26
27 int
28 u8_uctomb (uint8_t *s, ucs4_t uc, int n)
29 {
30   if (uc < 0x80)
31     {
32       if (n > 0)
33         {
34           s[0] = uc;
35           return 1;
36         }
37       /* else return -2, below.  */
38     }
39   else
40     {
41       int count;
42
43       if (uc < 0x800)
44         count = 2;
45       else if (uc < 0x10000)
46         {
47           if (uc < 0xd800 || uc >= 0xe000)
48             count = 3;
49           else
50             return -1;
51         }
52 #if 0
53       else if (uc < 0x200000)
54         count = 4;
55       else if (uc < 0x4000000)
56         count = 5;
57       else if (uc <= 0x7fffffff)
58         count = 6;
59 #else
60       else if (uc < 0x110000)
61         count = 4;
62 #endif
63       else
64         return -1;
65
66       if (n >= count)
67         {
68           switch (count) /* note: code falls through cases! */
69             {
70 #if 0
71             case 6: s[5] = 0x80 | (uc & 0x3f); uc = uc >> 6; uc |= 0x4000000;
72             case 5: s[4] = 0x80 | (uc & 0x3f); uc = uc >> 6; uc |= 0x200000;
73 #endif
74             case 4: s[3] = 0x80 | (uc & 0x3f); uc = uc >> 6; uc |= 0x10000;
75             case 3: s[2] = 0x80 | (uc & 0x3f); uc = uc >> 6; uc |= 0x800;
76             case 2: s[1] = 0x80 | (uc & 0x3f); uc = uc >> 6; uc |= 0xc0;
77           /*case 1:*/ s[0] = uc;
78             }
79           return count;
80         }
81     }
82   return -2;
83 }
84
85 #endif