New modules 'unistr/u8-mbtouc', 'unistr/u16-mbtouc', 'unistr/u32-mbtouc'.
[gnulib.git] / lib / unistr / u16-mbtouc.c
1 /* Look at first character in UTF-16 string.
2    Copyright (C) 1999-2002, 2006-2007 Free Software Foundation, Inc.
3    Written by Bruno Haible <bruno@clisp.org>, 2001.
4
5    This program is free software; you can redistribute it and/or modify it
6    under the terms of the GNU Library General Public License as published
7    by the Free Software Foundation; either version 2, or (at your option)
8    any later version.
9
10    This program is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with this program; if not, write to the Free Software
17    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301,
18    USA.  */
19
20 #include <config.h>
21
22 /* Specification.  */
23 #include "unistr.h"
24
25 #if !HAVE_INLINE
26
27 int
28 u16_mbtouc (ucs4_t *puc, const uint16_t *s, size_t n)
29 {
30   uint16_t c = *s;
31
32   if (c < 0xd800 || c >= 0xe000)
33     {
34       *puc = c;
35       return 1;
36     }
37 #if CONFIG_UNICODE_SAFETY
38   if (c < 0xdc00)
39 #endif
40     {
41       if (n >= 2)
42         {
43 #if CONFIG_UNICODE_SAFETY
44           if (s[1] >= 0xdc00 && s[1] < 0xe000)
45 #endif
46             {
47               *puc = 0x10000 + ((c - 0xd800) << 10) + (s[1] - 0xdc00);
48               return 2;
49             }
50           /* invalid multibyte character */
51         }
52       else
53         {
54           /* incomplete multibyte character */
55         }
56     }
57   /* invalid multibyte character */
58   *puc = 0xfffd;
59   return 1;
60 }
61
62 #endif