New module 'unistr/u16-mbtoucr'.
[gnulib.git] / lib / unistr / u16-mbtoucr.c
1 /* Look at first character in UTF-16 string, returning an error code.
2    Copyright (C) 1999-2002, 2006-2007 Free Software Foundation, Inc.
3    Written by Bruno Haible <bruno@clisp.org>, 2001.
4
5    This program is free software; you can redistribute it and/or modify it
6    under the terms of the GNU Library General Public License as published
7    by the Free Software Foundation; either version 2, or (at your option)
8    any later version.
9
10    This program is distributed in the hope that it will be useful,
11    but WITHOUT ANY WARRANTY; without even the implied warranty of
12    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
13    Library General Public License for more details.
14
15    You should have received a copy of the GNU Library General Public
16    License along with this program; if not, write to the Free Software
17    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301,
18    USA.  */
19
20 #include <config.h>
21
22 /* Specification.  */
23 #include "unistr.h"
24
25 int
26 u16_mbtoucr (ucs4_t *puc, const uint16_t *s, size_t n)
27 {
28   uint16_t c = *s;
29
30   if (c < 0xd800 || c >= 0xe000)
31     {
32       *puc = c;
33       return 1;
34     }
35   if (c < 0xdc00)
36     {
37       if (n >= 2)
38         {
39           if (s[1] >= 0xdc00 && s[1] < 0xe000)
40             {
41               *puc = 0x10000 + ((c - 0xd800) << 10) + (s[1] - 0xdc00);
42               return 2;
43             }
44           /* invalid multibyte character */
45         }
46       else
47         {
48           /* incomplete multibyte character */
49           *puc = 0xfffd;
50           return -2;
51         }
52     }
53   /* invalid multibyte character */
54   *puc = 0xfffd;
55   return -1;
56 }