78910de21fe049acc0def03e3e054a06b77423ce
[gnulib.git] / lib / localename.c
1 /* Determine name of the currently selected locale.
2    Copyright (C) 1995-1999, 2000-2008 Free Software Foundation, Inc.
3
4    This program is free software; you can redistribute it and/or modify it
5    under the terms of the GNU Library General Public License as published
6    by the Free Software Foundation; either version 2, or (at your option)
7    any later version.
8
9    This program is distributed in the hope that it will be useful,
10    but WITHOUT ANY WARRANTY; without even the implied warranty of
11    MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the GNU
12    Library General Public License for more details.
13
14    You should have received a copy of the GNU Library General Public
15    License along with this program; if not, write to the Free Software
16    Foundation, Inc., 51 Franklin Street, Fifth Floor, Boston, MA 02110-1301,
17    USA.  */
18
19 /* Written by Ulrich Drepper <drepper@gnu.org>, 1995.  */
20 /* Win32 code written by Tor Lillqvist <tml@iki.fi>.  */
21 /* MacOS X code written by Bruno Haible <bruno@clisp.org>.  */
22
23 #include <config.h>
24
25 /* Specification.  */
26 #ifdef IN_LIBINTL
27 # include "gettextP.h"
28 #else
29 # include "localename.h"
30 #endif
31
32 #include <stdlib.h>
33 #include <locale.h>
34
35 #if HAVE_CFLOCALECOPYCURRENT || HAVE_CFPREFERENCESCOPYAPPVALUE
36 # include <string.h>
37 # include <CoreFoundation/CFString.h>
38 # if HAVE_CFLOCALECOPYCURRENT
39 #  include <CoreFoundation/CFLocale.h>
40 # elif HAVE_CFPREFERENCESCOPYAPPVALUE
41 #  include <CoreFoundation/CFPreferences.h>
42 # endif
43 #endif
44
45 #if defined _WIN32 || defined __WIN32__
46 # define WIN32_NATIVE
47 #endif
48
49 #ifdef WIN32_NATIVE
50 # define WIN32_LEAN_AND_MEAN
51 # include <windows.h>
52 /* List of language codes, sorted by value:
53    0x01 LANG_ARABIC
54    0x02 LANG_BULGARIAN
55    0x03 LANG_CATALAN
56    0x04 LANG_CHINESE
57    0x05 LANG_CZECH
58    0x06 LANG_DANISH
59    0x07 LANG_GERMAN
60    0x08 LANG_GREEK
61    0x09 LANG_ENGLISH
62    0x0a LANG_SPANISH
63    0x0b LANG_FINNISH
64    0x0c LANG_FRENCH
65    0x0d LANG_HEBREW
66    0x0e LANG_HUNGARIAN
67    0x0f LANG_ICELANDIC
68    0x10 LANG_ITALIAN
69    0x11 LANG_JAPANESE
70    0x12 LANG_KOREAN
71    0x13 LANG_DUTCH
72    0x14 LANG_NORWEGIAN
73    0x15 LANG_POLISH
74    0x16 LANG_PORTUGUESE
75    0x17 LANG_RHAETO_ROMANCE
76    0x18 LANG_ROMANIAN
77    0x19 LANG_RUSSIAN
78    0x1a LANG_CROATIAN == LANG_SERBIAN
79    0x1b LANG_SLOVAK
80    0x1c LANG_ALBANIAN
81    0x1d LANG_SWEDISH
82    0x1e LANG_THAI
83    0x1f LANG_TURKISH
84    0x20 LANG_URDU
85    0x21 LANG_INDONESIAN
86    0x22 LANG_UKRAINIAN
87    0x23 LANG_BELARUSIAN
88    0x24 LANG_SLOVENIAN
89    0x25 LANG_ESTONIAN
90    0x26 LANG_LATVIAN
91    0x27 LANG_LITHUANIAN
92    0x28 LANG_TAJIK
93    0x29 LANG_FARSI
94    0x2a LANG_VIETNAMESE
95    0x2b LANG_ARMENIAN
96    0x2c LANG_AZERI
97    0x2d LANG_BASQUE
98    0x2e LANG_SORBIAN
99    0x2f LANG_MACEDONIAN
100    0x30 LANG_SUTU
101    0x31 LANG_TSONGA
102    0x32 LANG_TSWANA
103    0x33 LANG_VENDA
104    0x34 LANG_XHOSA
105    0x35 LANG_ZULU
106    0x36 LANG_AFRIKAANS
107    0x37 LANG_GEORGIAN
108    0x38 LANG_FAEROESE
109    0x39 LANG_HINDI
110    0x3a LANG_MALTESE
111    0x3b LANG_SAAMI
112    0x3c LANG_GAELIC
113    0x3d LANG_YIDDISH
114    0x3e LANG_MALAY
115    0x3f LANG_KAZAK
116    0x40 LANG_KYRGYZ
117    0x41 LANG_SWAHILI
118    0x42 LANG_TURKMEN
119    0x43 LANG_UZBEK
120    0x44 LANG_TATAR
121    0x45 LANG_BENGALI
122    0x46 LANG_PUNJABI
123    0x47 LANG_GUJARATI
124    0x48 LANG_ORIYA
125    0x49 LANG_TAMIL
126    0x4a LANG_TELUGU
127    0x4b LANG_KANNADA
128    0x4c LANG_MALAYALAM
129    0x4d LANG_ASSAMESE
130    0x4e LANG_MARATHI
131    0x4f LANG_SANSKRIT
132    0x50 LANG_MONGOLIAN
133    0x51 LANG_TIBETAN
134    0x52 LANG_WELSH
135    0x53 LANG_CAMBODIAN
136    0x54 LANG_LAO
137    0x55 LANG_BURMESE
138    0x56 LANG_GALICIAN
139    0x57 LANG_KONKANI
140    0x58 LANG_MANIPURI
141    0x59 LANG_SINDHI
142    0x5a LANG_SYRIAC
143    0x5b LANG_SINHALESE
144    0x5c LANG_CHEROKEE
145    0x5d LANG_INUKTITUT
146    0x5e LANG_AMHARIC
147    0x5f LANG_TAMAZIGHT
148    0x60 LANG_KASHMIRI
149    0x61 LANG_NEPALI
150    0x62 LANG_FRISIAN
151    0x63 LANG_PASHTO
152    0x64 LANG_TAGALOG
153    0x65 LANG_DIVEHI
154    0x66 LANG_EDO
155    0x67 LANG_FULFULDE
156    0x68 LANG_HAUSA
157    0x69 LANG_IBIBIO
158    0x6a LANG_YORUBA
159    0x70 LANG_IGBO
160    0x71 LANG_KANURI
161    0x72 LANG_OROMO
162    0x73 LANG_TIGRINYA
163    0x74 LANG_GUARANI
164    0x75 LANG_HAWAIIAN
165    0x76 LANG_LATIN
166    0x77 LANG_SOMALI
167    0x78 LANG_YI
168    0x79 LANG_PAPIAMENTU
169 */
170 /* Mingw headers don't have latest language and sublanguage codes.  */
171 # ifndef LANG_AFRIKAANS
172 # define LANG_AFRIKAANS 0x36
173 # endif
174 # ifndef LANG_ALBANIAN
175 # define LANG_ALBANIAN 0x1c
176 # endif
177 # ifndef LANG_AMHARIC
178 # define LANG_AMHARIC 0x5e
179 # endif
180 # ifndef LANG_ARABIC
181 # define LANG_ARABIC 0x01
182 # endif
183 # ifndef LANG_ARMENIAN
184 # define LANG_ARMENIAN 0x2b
185 # endif
186 # ifndef LANG_ASSAMESE
187 # define LANG_ASSAMESE 0x4d
188 # endif
189 # ifndef LANG_AZERI
190 # define LANG_AZERI 0x2c
191 # endif
192 # ifndef LANG_BASQUE
193 # define LANG_BASQUE 0x2d
194 # endif
195 # ifndef LANG_BELARUSIAN
196 # define LANG_BELARUSIAN 0x23
197 # endif
198 # ifndef LANG_BENGALI
199 # define LANG_BENGALI 0x45
200 # endif
201 # ifndef LANG_BURMESE
202 # define LANG_BURMESE 0x55
203 # endif
204 # ifndef LANG_CAMBODIAN
205 # define LANG_CAMBODIAN 0x53
206 # endif
207 # ifndef LANG_CATALAN
208 # define LANG_CATALAN 0x03
209 # endif
210 # ifndef LANG_CHEROKEE
211 # define LANG_CHEROKEE 0x5c
212 # endif
213 # ifndef LANG_DIVEHI
214 # define LANG_DIVEHI 0x65
215 # endif
216 # ifndef LANG_EDO
217 # define LANG_EDO 0x66
218 # endif
219 # ifndef LANG_ESTONIAN
220 # define LANG_ESTONIAN 0x25
221 # endif
222 # ifndef LANG_FAEROESE
223 # define LANG_FAEROESE 0x38
224 # endif
225 # ifndef LANG_FARSI
226 # define LANG_FARSI 0x29
227 # endif
228 # ifndef LANG_FRISIAN
229 # define LANG_FRISIAN 0x62
230 # endif
231 # ifndef LANG_FULFULDE
232 # define LANG_FULFULDE 0x67
233 # endif
234 # ifndef LANG_GAELIC
235 # define LANG_GAELIC 0x3c
236 # endif
237 # ifndef LANG_GALICIAN
238 # define LANG_GALICIAN 0x56
239 # endif
240 # ifndef LANG_GEORGIAN
241 # define LANG_GEORGIAN 0x37
242 # endif
243 # ifndef LANG_GUARANI
244 # define LANG_GUARANI 0x74
245 # endif
246 # ifndef LANG_GUJARATI
247 # define LANG_GUJARATI 0x47
248 # endif
249 # ifndef LANG_HAUSA
250 # define LANG_HAUSA 0x68
251 # endif
252 # ifndef LANG_HAWAIIAN
253 # define LANG_HAWAIIAN 0x75
254 # endif
255 # ifndef LANG_HEBREW
256 # define LANG_HEBREW 0x0d
257 # endif
258 # ifndef LANG_HINDI
259 # define LANG_HINDI 0x39
260 # endif
261 # ifndef LANG_IBIBIO
262 # define LANG_IBIBIO 0x69
263 # endif
264 # ifndef LANG_IGBO
265 # define LANG_IGBO 0x70
266 # endif
267 # ifndef LANG_INDONESIAN
268 # define LANG_INDONESIAN 0x21
269 # endif
270 # ifndef LANG_INUKTITUT
271 # define LANG_INUKTITUT 0x5d
272 # endif
273 # ifndef LANG_KANNADA
274 # define LANG_KANNADA 0x4b
275 # endif
276 # ifndef LANG_KANURI
277 # define LANG_KANURI 0x71
278 # endif
279 # ifndef LANG_KASHMIRI
280 # define LANG_KASHMIRI 0x60
281 # endif
282 # ifndef LANG_KAZAK
283 # define LANG_KAZAK 0x3f
284 # endif
285 # ifndef LANG_KONKANI
286 # define LANG_KONKANI 0x57
287 # endif
288 # ifndef LANG_KYRGYZ
289 # define LANG_KYRGYZ 0x40
290 # endif
291 # ifndef LANG_LAO
292 # define LANG_LAO 0x54
293 # endif
294 # ifndef LANG_LATIN
295 # define LANG_LATIN 0x76
296 # endif
297 # ifndef LANG_LATVIAN
298 # define LANG_LATVIAN 0x26
299 # endif
300 # ifndef LANG_LITHUANIAN
301 # define LANG_LITHUANIAN 0x27
302 # endif
303 # ifndef LANG_MACEDONIAN
304 # define LANG_MACEDONIAN 0x2f
305 # endif
306 # ifndef LANG_MALAY
307 # define LANG_MALAY 0x3e
308 # endif
309 # ifndef LANG_MALAYALAM
310 # define LANG_MALAYALAM 0x4c
311 # endif
312 # ifndef LANG_MALTESE
313 # define LANG_MALTESE 0x3a
314 # endif
315 # ifndef LANG_MANIPURI
316 # define LANG_MANIPURI 0x58
317 # endif
318 # ifndef LANG_MARATHI
319 # define LANG_MARATHI 0x4e
320 # endif
321 # ifndef LANG_MONGOLIAN
322 # define LANG_MONGOLIAN 0x50
323 # endif
324 # ifndef LANG_NEPALI
325 # define LANG_NEPALI 0x61
326 # endif
327 # ifndef LANG_ORIYA
328 # define LANG_ORIYA 0x48
329 # endif
330 # ifndef LANG_OROMO
331 # define LANG_OROMO 0x72
332 # endif
333 # ifndef LANG_PAPIAMENTU
334 # define LANG_PAPIAMENTU 0x79
335 # endif
336 # ifndef LANG_PASHTO
337 # define LANG_PASHTO 0x63
338 # endif
339 # ifndef LANG_PUNJABI
340 # define LANG_PUNJABI 0x46
341 # endif
342 # ifndef LANG_RHAETO_ROMANCE
343 # define LANG_RHAETO_ROMANCE 0x17
344 # endif
345 # ifndef LANG_SAAMI
346 # define LANG_SAAMI 0x3b
347 # endif
348 # ifndef LANG_SANSKRIT
349 # define LANG_SANSKRIT 0x4f
350 # endif
351 # ifndef LANG_SERBIAN
352 # define LANG_SERBIAN 0x1a
353 # endif
354 # ifndef LANG_SINDHI
355 # define LANG_SINDHI 0x59
356 # endif
357 # ifndef LANG_SINHALESE
358 # define LANG_SINHALESE 0x5b
359 # endif
360 # ifndef LANG_SLOVAK
361 # define LANG_SLOVAK 0x1b
362 # endif
363 # ifndef LANG_SOMALI
364 # define LANG_SOMALI 0x77
365 # endif
366 # ifndef LANG_SORBIAN
367 # define LANG_SORBIAN 0x2e
368 # endif
369 # ifndef LANG_SUTU
370 # define LANG_SUTU 0x30
371 # endif
372 # ifndef LANG_SWAHILI
373 # define LANG_SWAHILI 0x41
374 # endif
375 # ifndef LANG_SYRIAC
376 # define LANG_SYRIAC 0x5a
377 # endif
378 # ifndef LANG_TAGALOG
379 # define LANG_TAGALOG 0x64
380 # endif
381 # ifndef LANG_TAJIK
382 # define LANG_TAJIK 0x28
383 # endif
384 # ifndef LANG_TAMAZIGHT
385 # define LANG_TAMAZIGHT 0x5f
386 # endif
387 # ifndef LANG_TAMIL
388 # define LANG_TAMIL 0x49
389 # endif
390 # ifndef LANG_TATAR
391 # define LANG_TATAR 0x44
392 # endif
393 # ifndef LANG_TELUGU
394 # define LANG_TELUGU 0x4a
395 # endif
396 # ifndef LANG_THAI
397 # define LANG_THAI 0x1e
398 # endif
399 # ifndef LANG_TIBETAN
400 # define LANG_TIBETAN 0x51
401 # endif
402 # ifndef LANG_TIGRINYA
403 # define LANG_TIGRINYA 0x73
404 # endif
405 # ifndef LANG_TSONGA
406 # define LANG_TSONGA 0x31
407 # endif
408 # ifndef LANG_TSWANA
409 # define LANG_TSWANA 0x32
410 # endif
411 # ifndef LANG_TURKMEN
412 # define LANG_TURKMEN 0x42
413 # endif
414 # ifndef LANG_UKRAINIAN
415 # define LANG_UKRAINIAN 0x22
416 # endif
417 # ifndef LANG_URDU
418 # define LANG_URDU 0x20
419 # endif
420 # ifndef LANG_UZBEK
421 # define LANG_UZBEK 0x43
422 # endif
423 # ifndef LANG_VENDA
424 # define LANG_VENDA 0x33
425 # endif
426 # ifndef LANG_VIETNAMESE
427 # define LANG_VIETNAMESE 0x2a
428 # endif
429 # ifndef LANG_WELSH
430 # define LANG_WELSH 0x52
431 # endif
432 # ifndef LANG_XHOSA
433 # define LANG_XHOSA 0x34
434 # endif
435 # ifndef LANG_YI
436 # define LANG_YI 0x78
437 # endif
438 # ifndef LANG_YIDDISH
439 # define LANG_YIDDISH 0x3d
440 # endif
441 # ifndef LANG_YORUBA
442 # define LANG_YORUBA 0x6a
443 # endif
444 # ifndef LANG_ZULU
445 # define LANG_ZULU 0x35
446 # endif
447 # ifndef SUBLANG_ARABIC_SAUDI_ARABIA
448 # define SUBLANG_ARABIC_SAUDI_ARABIA 0x01
449 # endif
450 # ifndef SUBLANG_ARABIC_IRAQ
451 # define SUBLANG_ARABIC_IRAQ 0x02
452 # endif
453 # ifndef SUBLANG_ARABIC_EGYPT
454 # define SUBLANG_ARABIC_EGYPT 0x03
455 # endif
456 # ifndef SUBLANG_ARABIC_LIBYA
457 # define SUBLANG_ARABIC_LIBYA 0x04
458 # endif
459 # ifndef SUBLANG_ARABIC_ALGERIA
460 # define SUBLANG_ARABIC_ALGERIA 0x05
461 # endif
462 # ifndef SUBLANG_ARABIC_MOROCCO
463 # define SUBLANG_ARABIC_MOROCCO 0x06
464 # endif
465 # ifndef SUBLANG_ARABIC_TUNISIA
466 # define SUBLANG_ARABIC_TUNISIA 0x07
467 # endif
468 # ifndef SUBLANG_ARABIC_OMAN
469 # define SUBLANG_ARABIC_OMAN 0x08
470 # endif
471 # ifndef SUBLANG_ARABIC_YEMEN
472 # define SUBLANG_ARABIC_YEMEN 0x09
473 # endif
474 # ifndef SUBLANG_ARABIC_SYRIA
475 # define SUBLANG_ARABIC_SYRIA 0x0a
476 # endif
477 # ifndef SUBLANG_ARABIC_JORDAN
478 # define SUBLANG_ARABIC_JORDAN 0x0b
479 # endif
480 # ifndef SUBLANG_ARABIC_LEBANON
481 # define SUBLANG_ARABIC_LEBANON 0x0c
482 # endif
483 # ifndef SUBLANG_ARABIC_KUWAIT
484 # define SUBLANG_ARABIC_KUWAIT 0x0d
485 # endif
486 # ifndef SUBLANG_ARABIC_UAE
487 # define SUBLANG_ARABIC_UAE 0x0e
488 # endif
489 # ifndef SUBLANG_ARABIC_BAHRAIN
490 # define SUBLANG_ARABIC_BAHRAIN 0x0f
491 # endif
492 # ifndef SUBLANG_ARABIC_QATAR
493 # define SUBLANG_ARABIC_QATAR 0x10
494 # endif
495 # ifndef SUBLANG_AZERI_LATIN
496 # define SUBLANG_AZERI_LATIN 0x01
497 # endif
498 # ifndef SUBLANG_AZERI_CYRILLIC
499 # define SUBLANG_AZERI_CYRILLIC 0x02
500 # endif
501 # ifndef SUBLANG_BENGALI_INDIA
502 # define SUBLANG_BENGALI_INDIA 0x01
503 # endif
504 # ifndef SUBLANG_BENGALI_BANGLADESH
505 # define SUBLANG_BENGALI_BANGLADESH 0x02
506 # endif
507 # ifndef SUBLANG_CHINESE_MACAU
508 # define SUBLANG_CHINESE_MACAU 0x05
509 # endif
510 # ifndef SUBLANG_ENGLISH_SOUTH_AFRICA
511 # define SUBLANG_ENGLISH_SOUTH_AFRICA 0x07
512 # endif
513 # ifndef SUBLANG_ENGLISH_JAMAICA
514 # define SUBLANG_ENGLISH_JAMAICA 0x08
515 # endif
516 # ifndef SUBLANG_ENGLISH_CARIBBEAN
517 # define SUBLANG_ENGLISH_CARIBBEAN 0x09
518 # endif
519 # ifndef SUBLANG_ENGLISH_BELIZE
520 # define SUBLANG_ENGLISH_BELIZE 0x0a
521 # endif
522 # ifndef SUBLANG_ENGLISH_TRINIDAD
523 # define SUBLANG_ENGLISH_TRINIDAD 0x0b
524 # endif
525 # ifndef SUBLANG_ENGLISH_ZIMBABWE
526 # define SUBLANG_ENGLISH_ZIMBABWE 0x0c
527 # endif
528 # ifndef SUBLANG_ENGLISH_PHILIPPINES
529 # define SUBLANG_ENGLISH_PHILIPPINES 0x0d
530 # endif
531 # ifndef SUBLANG_ENGLISH_INDONESIA
532 # define SUBLANG_ENGLISH_INDONESIA 0x0e
533 # endif
534 # ifndef SUBLANG_ENGLISH_HONGKONG
535 # define SUBLANG_ENGLISH_HONGKONG 0x0f
536 # endif
537 # ifndef SUBLANG_ENGLISH_INDIA
538 # define SUBLANG_ENGLISH_INDIA 0x10
539 # endif
540 # ifndef SUBLANG_ENGLISH_MALAYSIA
541 # define SUBLANG_ENGLISH_MALAYSIA 0x11
542 # endif
543 # ifndef SUBLANG_ENGLISH_SINGAPORE
544 # define SUBLANG_ENGLISH_SINGAPORE 0x12
545 # endif
546 # ifndef SUBLANG_FRENCH_LUXEMBOURG
547 # define SUBLANG_FRENCH_LUXEMBOURG 0x05
548 # endif
549 # ifndef SUBLANG_FRENCH_MONACO
550 # define SUBLANG_FRENCH_MONACO 0x06
551 # endif
552 # ifndef SUBLANG_FRENCH_WESTINDIES
553 # define SUBLANG_FRENCH_WESTINDIES 0x07
554 # endif
555 # ifndef SUBLANG_FRENCH_REUNION
556 # define SUBLANG_FRENCH_REUNION 0x08
557 # endif
558 # ifndef SUBLANG_FRENCH_CONGO
559 # define SUBLANG_FRENCH_CONGO 0x09
560 # endif
561 # ifndef SUBLANG_FRENCH_SENEGAL
562 # define SUBLANG_FRENCH_SENEGAL 0x0a
563 # endif
564 # ifndef SUBLANG_FRENCH_CAMEROON
565 # define SUBLANG_FRENCH_CAMEROON 0x0b
566 # endif
567 # ifndef SUBLANG_FRENCH_COTEDIVOIRE
568 # define SUBLANG_FRENCH_COTEDIVOIRE 0x0c
569 # endif
570 # ifndef SUBLANG_FRENCH_MALI
571 # define SUBLANG_FRENCH_MALI 0x0d
572 # endif
573 # ifndef SUBLANG_FRENCH_MOROCCO
574 # define SUBLANG_FRENCH_MOROCCO 0x0e
575 # endif
576 # ifndef SUBLANG_FRENCH_HAITI
577 # define SUBLANG_FRENCH_HAITI 0x0f
578 # endif
579 # ifndef SUBLANG_GERMAN_LUXEMBOURG
580 # define SUBLANG_GERMAN_LUXEMBOURG 0x04
581 # endif
582 # ifndef SUBLANG_GERMAN_LIECHTENSTEIN
583 # define SUBLANG_GERMAN_LIECHTENSTEIN 0x05
584 # endif
585 # ifndef SUBLANG_KASHMIRI_INDIA
586 # define SUBLANG_KASHMIRI_INDIA 0x02
587 # endif
588 # ifndef SUBLANG_MALAY_MALAYSIA
589 # define SUBLANG_MALAY_MALAYSIA 0x01
590 # endif
591 # ifndef SUBLANG_MALAY_BRUNEI_DARUSSALAM
592 # define SUBLANG_MALAY_BRUNEI_DARUSSALAM 0x02
593 # endif
594 # ifndef SUBLANG_NEPALI_INDIA
595 # define SUBLANG_NEPALI_INDIA 0x02
596 # endif
597 # ifndef SUBLANG_PUNJABI_INDIA
598 # define SUBLANG_PUNJABI_INDIA 0x01
599 # endif
600 # ifndef SUBLANG_PUNJABI_PAKISTAN
601 # define SUBLANG_PUNJABI_PAKISTAN 0x02
602 # endif
603 # ifndef SUBLANG_ROMANIAN_ROMANIA
604 # define SUBLANG_ROMANIAN_ROMANIA 0x01
605 # endif
606 # ifndef SUBLANG_ROMANIAN_MOLDOVA
607 # define SUBLANG_ROMANIAN_MOLDOVA 0x02
608 # endif
609 # ifndef SUBLANG_SERBIAN_LATIN
610 # define SUBLANG_SERBIAN_LATIN 0x02
611 # endif
612 # ifndef SUBLANG_SERBIAN_CYRILLIC
613 # define SUBLANG_SERBIAN_CYRILLIC 0x03
614 # endif
615 # ifndef SUBLANG_SINDHI_INDIA
616 # define SUBLANG_SINDHI_INDIA 0x01
617 # endif
618 # undef SUBLANG_SINDHI_PAKISTAN
619 # define SUBLANG_SINDHI_PAKISTAN 0x02
620 # ifndef SUBLANG_SINDHI_AFGHANISTAN
621 # define SUBLANG_SINDHI_AFGHANISTAN 0x02
622 # endif
623 # ifndef SUBLANG_SPANISH_GUATEMALA
624 # define SUBLANG_SPANISH_GUATEMALA 0x04
625 # endif
626 # ifndef SUBLANG_SPANISH_COSTA_RICA
627 # define SUBLANG_SPANISH_COSTA_RICA 0x05
628 # endif
629 # ifndef SUBLANG_SPANISH_PANAMA
630 # define SUBLANG_SPANISH_PANAMA 0x06
631 # endif
632 # ifndef SUBLANG_SPANISH_DOMINICAN_REPUBLIC
633 # define SUBLANG_SPANISH_DOMINICAN_REPUBLIC 0x07
634 # endif
635 # ifndef SUBLANG_SPANISH_VENEZUELA
636 # define SUBLANG_SPANISH_VENEZUELA 0x08
637 # endif
638 # ifndef SUBLANG_SPANISH_COLOMBIA
639 # define SUBLANG_SPANISH_COLOMBIA 0x09
640 # endif
641 # ifndef SUBLANG_SPANISH_PERU
642 # define SUBLANG_SPANISH_PERU 0x0a
643 # endif
644 # ifndef SUBLANG_SPANISH_ARGENTINA
645 # define SUBLANG_SPANISH_ARGENTINA 0x0b
646 # endif
647 # ifndef SUBLANG_SPANISH_ECUADOR
648 # define SUBLANG_SPANISH_ECUADOR 0x0c
649 # endif
650 # ifndef SUBLANG_SPANISH_CHILE
651 # define SUBLANG_SPANISH_CHILE 0x0d
652 # endif
653 # ifndef SUBLANG_SPANISH_URUGUAY
654 # define SUBLANG_SPANISH_URUGUAY 0x0e
655 # endif
656 # ifndef SUBLANG_SPANISH_PARAGUAY
657 # define SUBLANG_SPANISH_PARAGUAY 0x0f
658 # endif
659 # ifndef SUBLANG_SPANISH_BOLIVIA
660 # define SUBLANG_SPANISH_BOLIVIA 0x10
661 # endif
662 # ifndef SUBLANG_SPANISH_EL_SALVADOR
663 # define SUBLANG_SPANISH_EL_SALVADOR 0x11
664 # endif
665 # ifndef SUBLANG_SPANISH_HONDURAS
666 # define SUBLANG_SPANISH_HONDURAS 0x12
667 # endif
668 # ifndef SUBLANG_SPANISH_NICARAGUA
669 # define SUBLANG_SPANISH_NICARAGUA 0x13
670 # endif
671 # ifndef SUBLANG_SPANISH_PUERTO_RICO
672 # define SUBLANG_SPANISH_PUERTO_RICO 0x14
673 # endif
674 # ifndef SUBLANG_SWEDISH_FINLAND
675 # define SUBLANG_SWEDISH_FINLAND 0x02
676 # endif
677 # ifndef SUBLANG_TAMAZIGHT_ARABIC
678 # define SUBLANG_TAMAZIGHT_ARABIC 0x01
679 # endif
680 # ifndef SUBLANG_TAMAZIGHT_ALGERIA_LATIN
681 # define SUBLANG_TAMAZIGHT_ALGERIA_LATIN 0x02
682 # endif
683 # ifndef SUBLANG_TIGRINYA_ETHIOPIA
684 # define SUBLANG_TIGRINYA_ETHIOPIA 0x01
685 # endif
686 # ifndef SUBLANG_TIGRINYA_ERITREA
687 # define SUBLANG_TIGRINYA_ERITREA 0x02
688 # endif
689 # ifndef SUBLANG_URDU_PAKISTAN
690 # define SUBLANG_URDU_PAKISTAN 0x01
691 # endif
692 # ifndef SUBLANG_URDU_INDIA
693 # define SUBLANG_URDU_INDIA 0x02
694 # endif
695 # ifndef SUBLANG_UZBEK_LATIN
696 # define SUBLANG_UZBEK_LATIN 0x01
697 # endif
698 # ifndef SUBLANG_UZBEK_CYRILLIC
699 # define SUBLANG_UZBEK_CYRILLIC 0x02
700 # endif
701 /* GetLocaleInfoA operations.  */
702 # ifndef LOCALE_SNAME
703 # define LOCALE_SNAME 0x5c
704 # endif
705 #endif
706
707
708 #if HAVE_CFLOCALECOPYCURRENT || HAVE_CFPREFERENCESCOPYAPPVALUE
709 /* MacOS X 10.2 or newer */
710
711 /* Canonicalize a MacOS X locale name to a Unix locale name.
712    NAME is a sufficiently large buffer.
713    On input, it contains the MacOS X locale name.
714    On output, it contains the Unix locale name.  */
715 # if !defined IN_LIBINTL
716 static
717 # endif
718 void
719 gl_locale_name_canonicalize (char *name)
720 {
721   /* This conversion is based on a posting by
722      Deborah GoldSmith <goldsmit@apple.com> on 2005-03-08,
723      http://lists.apple.com/archives/carbon-dev/2005/Mar/msg00293.html */
724
725   /* Convert legacy (NeXTstep inherited) English names to Unix (ISO 639 and
726      ISO 3166) names.  Prior to MacOS X 10.3, there is no API for doing this.
727      Therefore we do it ourselves, using a table based on the results of the
728      MacOS X 10.3.8 function
729      CFLocaleCreateCanonicalLocaleIdentifierFromString().  */
730   typedef struct { const char legacy[21+1]; const char unixy[5+1]; }
731           legacy_entry;
732   static const legacy_entry legacy_table[] = {
733     { "Afrikaans",             "af" },
734     { "Albanian",              "sq" },
735     { "Amharic",               "am" },
736     { "Arabic",                "ar" },
737     { "Armenian",              "hy" },
738     { "Assamese",              "as" },
739     { "Aymara",                "ay" },
740     { "Azerbaijani",           "az" },
741     { "Basque",                "eu" },
742     { "Belarusian",            "be" },
743     { "Belorussian",           "be" },
744     { "Bengali",               "bn" },
745     { "Brazilian Portugese",   "pt_BR" },
746     { "Brazilian Portuguese",  "pt_BR" },
747     { "Breton",                "br" },
748     { "Bulgarian",             "bg" },
749     { "Burmese",               "my" },
750     { "Byelorussian",          "be" },
751     { "Catalan",               "ca" },
752     { "Chewa",                 "ny" },
753     { "Chichewa",              "ny" },
754     { "Chinese",               "zh" },
755     { "Chinese, Simplified",   "zh_CN" },
756     { "Chinese, Traditional",  "zh_TW" },
757     { "Chinese, Tradtional",   "zh_TW" },
758     { "Croatian",              "hr" },
759     { "Czech",                 "cs" },
760     { "Danish",                "da" },
761     { "Dutch",                 "nl" },
762     { "Dzongkha",              "dz" },
763     { "English",               "en" },
764     { "Esperanto",             "eo" },
765     { "Estonian",              "et" },
766     { "Faroese",               "fo" },
767     { "Farsi",                 "fa" },
768     { "Finnish",               "fi" },
769     { "Flemish",               "nl_BE" },
770     { "French",                "fr" },
771     { "Galician",              "gl" },
772     { "Gallegan",              "gl" },
773     { "Georgian",              "ka" },
774     { "German",                "de" },
775     { "Greek",                 "el" },
776     { "Greenlandic",           "kl" },
777     { "Guarani",               "gn" },
778     { "Gujarati",              "gu" },
779     { "Hawaiian",              "haw" }, /* Yes, "haw", not "cpe".  */
780     { "Hebrew",                "he" },
781     { "Hindi",                 "hi" },
782     { "Hungarian",             "hu" },
783     { "Icelandic",             "is" },
784     { "Indonesian",            "id" },
785     { "Inuktitut",             "iu" },
786     { "Irish",                 "ga" },
787     { "Italian",               "it" },
788     { "Japanese",              "ja" },
789     { "Javanese",              "jv" },
790     { "Kalaallisut",           "kl" },
791     { "Kannada",               "kn" },
792     { "Kashmiri",              "ks" },
793     { "Kazakh",                "kk" },
794     { "Khmer",                 "km" },
795     { "Kinyarwanda",           "rw" },
796     { "Kirghiz",               "ky" },
797     { "Korean",                "ko" },
798     { "Kurdish",               "ku" },
799     { "Latin",                 "la" },
800     { "Latvian",               "lv" },
801     { "Lithuanian",            "lt" },
802     { "Macedonian",            "mk" },
803     { "Malagasy",              "mg" },
804     { "Malay",                 "ms" },
805     { "Malayalam",             "ml" },
806     { "Maltese",               "mt" },
807     { "Manx",                  "gv" },
808     { "Marathi",               "mr" },
809     { "Moldavian",             "mo" },
810     { "Mongolian",             "mn" },
811     { "Nepali",                "ne" },
812     { "Norwegian",             "nb" }, /* Yes, "nb", not the obsolete "no".  */
813     { "Nyanja",                "ny" },
814     { "Nynorsk",               "nn" },
815     { "Oriya",                 "or" },
816     { "Oromo",                 "om" },
817     { "Panjabi",               "pa" },
818     { "Pashto",                "ps" },
819     { "Persian",               "fa" },
820     { "Polish",                "pl" },
821     { "Portuguese",            "pt" },
822     { "Portuguese, Brazilian", "pt_BR" },
823     { "Punjabi",               "pa" },
824     { "Pushto",                "ps" },
825     { "Quechua",               "qu" },
826     { "Romanian",              "ro" },
827     { "Ruanda",                "rw" },
828     { "Rundi",                 "rn" },
829     { "Russian",               "ru" },
830     { "Sami",                  "se_NO" }, /* Not just "se".  */
831     { "Sanskrit",              "sa" },
832     { "Scottish",              "gd" },
833     { "Serbian",               "sr" },
834     { "Simplified Chinese",    "zh_CN" },
835     { "Sindhi",                "sd" },
836     { "Sinhalese",             "si" },
837     { "Slovak",                "sk" },
838     { "Slovenian",             "sl" },
839     { "Somali",                "so" },
840     { "Spanish",               "es" },
841     { "Sundanese",             "su" },
842     { "Swahili",               "sw" },
843     { "Swedish",               "sv" },
844     { "Tagalog",               "tl" },
845     { "Tajik",                 "tg" },
846     { "Tajiki",                "tg" },
847     { "Tamil",                 "ta" },
848     { "Tatar",                 "tt" },
849     { "Telugu",                "te" },
850     { "Thai",                  "th" },
851     { "Tibetan",               "bo" },
852     { "Tigrinya",              "ti" },
853     { "Tongan",                "to" },
854     { "Traditional Chinese",   "zh_TW" },
855     { "Turkish",               "tr" },
856     { "Turkmen",               "tk" },
857     { "Uighur",                "ug" },
858     { "Ukrainian",             "uk" },
859     { "Urdu",                  "ur" },
860     { "Uzbek",                 "uz" },
861     { "Vietnamese",            "vi" },
862     { "Welsh",                 "cy" },
863     { "Yiddish",               "yi" }
864   };
865
866   /* Convert new-style locale names with language tags (ISO 639 and ISO 15924)
867      to Unix (ISO 639 and ISO 3166) names.  */
868   typedef struct { const char langtag[7+1]; const char unixy[12+1]; }
869           langtag_entry;
870   static const langtag_entry langtag_table[] = {
871     /* MacOS X has "az-Arab", "az-Cyrl", "az-Latn".
872        The default script for az on Unix is Latin.  */
873     { "az-Latn", "az" },
874     /* MacOS X has "ga-dots".  Does not yet exist on Unix.  */
875     { "ga-dots", "ga" },
876     /* MacOS X has "kk-Cyrl".  Does not yet exist on Unix.  */
877     /* MacOS X has "mn-Cyrl", "mn-Mong".
878        The default script for mn on Unix is Cyrillic.  */
879     { "mn-Cyrl", "mn" },
880     /* MacOS X has "ms-Arab", "ms-Latn".
881        The default script for ms on Unix is Latin.  */
882     { "ms-Latn", "ms" },
883     /* MacOS X has "tg-Cyrl".
884        The default script for tg on Unix is Cyrillic.  */
885     { "tg-Cyrl", "tg" },
886     /* MacOS X has "tk-Cyrl".  Does not yet exist on Unix.  */
887     /* MacOS X has "tt-Cyrl".
888        The default script for tt on Unix is Cyrillic.  */
889     { "tt-Cyrl", "tt" },
890     /* MacOS X has "zh-Hans", "zh-Hant".
891        Country codes are used to distinguish these on Unix.  */
892     { "zh-Hans", "zh_CN" },
893     { "zh-Hant", "zh_TW" }
894   };
895
896   /* Convert script names (ISO 15924) to Unix conventions.
897      See http://www.unicode.org/iso15924/iso15924-codes.html  */
898   typedef struct { const char script[4+1]; const char unixy[9+1]; }
899           script_entry;
900   static const script_entry script_table[] = {
901     { "Arab", "arabic" },
902     { "Cyrl", "cyrillic" },
903     { "Mong", "mongolian" }
904   };
905
906   /* Step 1: Convert using legacy_table.  */
907   if (name[0] >= 'A' && name[0] <= 'Z')
908     {
909       unsigned int i1, i2;
910       i1 = 0;
911       i2 = sizeof (legacy_table) / sizeof (legacy_entry);
912       while (i2 - i1 > 1)
913         {
914           /* At this point we know that if name occurs in legacy_table,
915              its index must be >= i1 and < i2.  */
916           unsigned int i = (i1 + i2) >> 1;
917           const legacy_entry *p = &legacy_table[i];
918           if (strcmp (name, p->legacy) < 0)
919             i2 = i;
920           else
921             i1 = i;
922         }
923       if (strcmp (name, legacy_table[i1].legacy) == 0)
924         {
925           strcpy (name, legacy_table[i1].unixy);
926           return;
927         }
928     }
929
930   /* Step 2: Convert using langtag_table and script_table.  */
931   if (strlen (name) == 7 && name[2] == '-')
932     {
933       unsigned int i1, i2;
934       i1 = 0;
935       i2 = sizeof (langtag_table) / sizeof (langtag_entry);
936       while (i2 - i1 > 1)
937         {
938           /* At this point we know that if name occurs in langtag_table,
939              its index must be >= i1 and < i2.  */
940           unsigned int i = (i1 + i2) >> 1;
941           const langtag_entry *p = &langtag_table[i];
942           if (strcmp (name, p->langtag) < 0)
943             i2 = i;
944           else
945             i1 = i;
946         }
947       if (strcmp (name, langtag_table[i1].langtag) == 0)
948         {
949           strcpy (name, langtag_table[i1].unixy);
950           return;
951         }
952
953       i1 = 0;
954       i2 = sizeof (script_table) / sizeof (script_entry);
955       while (i2 - i1 > 1)
956         {
957           /* At this point we know that if (name + 3) occurs in script_table,
958              its index must be >= i1 and < i2.  */
959           unsigned int i = (i1 + i2) >> 1;
960           const script_entry *p = &script_table[i];
961           if (strcmp (name + 3, p->script) < 0)
962             i2 = i;
963           else
964             i1 = i;
965         }
966       if (strcmp (name + 3, script_table[i1].script) == 0)
967         {
968           name[2] = '@';
969           strcpy (name + 3, script_table[i1].unixy);
970           return;
971         }
972     }
973
974   /* Step 3: Convert new-style dash to Unix underscore. */
975   {
976     char *p;
977     for (p = name; *p != '\0'; p++)
978       if (*p == '-')
979         *p = '_';
980   }
981 }
982
983 #endif
984
985
986 #ifdef WIN32_NATIVE
987
988 /* Canonicalize a Win32 native locale name to a Unix locale name.
989    NAME is a sufficiently large buffer.
990    On input, it contains the Win32 locale name.
991    On output, it contains the Unix locale name.  */
992 # if !defined IN_LIBINTL
993 static
994 # endif
995 void
996 gl_locale_name_canonicalize (char *name)
997 {
998   /* FIXME: This is probably incomplete: it does not handle "zh-Hans" and
999      "zh-Hant".  */
1000   char *p;
1001
1002   for (p = name; *p != '\0'; p++)
1003     if (*p == '-')
1004       {
1005         *p = '_';
1006         p++;
1007         for (; *p != '\0'; p++)
1008           {
1009             if (*p >= 'a' && *p <= 'z')
1010               *p += 'A' - 'a';
1011             if (*p == '-')
1012               {
1013                 *p = '\0';
1014                 return;
1015               }
1016           }
1017         return;
1018       }
1019 }
1020
1021 # if !defined IN_LIBINTL
1022 static
1023 # endif
1024 const char *
1025 gl_locale_name_from_win32_LANGID (LANGID langid)
1026 {
1027   /* Activate the new code only when the GETTEXT_MUI environment variable is
1028      set, for the time being, since the new code is not well tested.  */
1029   if (getenv ("GETTEXT_MUI") != NULL)
1030     {
1031       static char namebuf[256];
1032
1033       /* Query the system's notion of locale name.
1034          On Windows95/98/ME, GetLocaleInfoA returns some incorrect results.
1035          But we don't need to support systems that are so old.  */
1036       if (GetLocaleInfoA (MAKELCID (langid, SORT_DEFAULT), LOCALE_SNAME,
1037                           namebuf, sizeof (namebuf) - 1))
1038         {
1039           /* Convert it to a Unix locale name.  */
1040           gl_locale_name_canonicalize (namebuf);
1041           return namebuf;
1042         }
1043     }
1044   /* Internet Explorer has an LCID to RFC3066 name mapping stored in
1045      HKEY_CLASSES_ROOT\Mime\Database\Rfc1766.  But we better don't use that
1046      since IE's i18n subsystem is known to be inconsistent with the Win32 base
1047      (e.g. they have different character conversion facilities that produce
1048      different results).  */
1049   /* Use our own table.  */
1050   {
1051     int primary, sub;
1052
1053     /* Split into language and territory part.  */
1054     primary = PRIMARYLANGID (langid);
1055     sub = SUBLANGID (langid);
1056
1057     /* Dispatch on language.
1058        See also http://www.unicode.org/unicode/onlinedat/languages.html .
1059        For details about languages, see http://www.ethnologue.com/ .  */
1060     switch (primary)
1061       {
1062       case LANG_AFRIKAANS: return "af_ZA";
1063       case LANG_ALBANIAN: return "sq_AL";
1064       case LANG_AMHARIC: return "am_ET";
1065       case LANG_ARABIC:
1066         switch (sub)
1067           {
1068           case SUBLANG_ARABIC_SAUDI_ARABIA: return "ar_SA";
1069           case SUBLANG_ARABIC_IRAQ: return "ar_IQ";
1070           case SUBLANG_ARABIC_EGYPT: return "ar_EG";
1071           case SUBLANG_ARABIC_LIBYA: return "ar_LY";
1072           case SUBLANG_ARABIC_ALGERIA: return "ar_DZ";
1073           case SUBLANG_ARABIC_MOROCCO: return "ar_MA";
1074           case SUBLANG_ARABIC_TUNISIA: return "ar_TN";
1075           case SUBLANG_ARABIC_OMAN: return "ar_OM";
1076           case SUBLANG_ARABIC_YEMEN: return "ar_YE";
1077           case SUBLANG_ARABIC_SYRIA: return "ar_SY";
1078           case SUBLANG_ARABIC_JORDAN: return "ar_JO";
1079           case SUBLANG_ARABIC_LEBANON: return "ar_LB";
1080           case SUBLANG_ARABIC_KUWAIT: return "ar_KW";
1081           case SUBLANG_ARABIC_UAE: return "ar_AE";
1082           case SUBLANG_ARABIC_BAHRAIN: return "ar_BH";
1083           case SUBLANG_ARABIC_QATAR: return "ar_QA";
1084           }
1085         return "ar";
1086       case LANG_ARMENIAN: return "hy_AM";
1087       case LANG_ASSAMESE: return "as_IN";
1088       case LANG_AZERI:
1089         switch (sub)
1090           {
1091           /* FIXME: Adjust this when Azerbaijani locales appear on Unix.  */
1092           case SUBLANG_AZERI_LATIN: return "az_AZ@latin";
1093           case SUBLANG_AZERI_CYRILLIC: return "az_AZ@cyrillic";
1094           }
1095         return "az";
1096       case LANG_BASQUE:
1097         switch (sub)
1098           {
1099           case SUBLANG_DEFAULT: return "eu_ES";
1100           }
1101         return "eu"; /* Ambiguous: could be "eu_ES" or "eu_FR".  */
1102       case LANG_BELARUSIAN: return "be_BY";
1103       case LANG_BENGALI:
1104         switch (sub)
1105           {
1106           case SUBLANG_BENGALI_INDIA: return "bn_IN";
1107           case SUBLANG_BENGALI_BANGLADESH: return "bn_BD";
1108           }
1109         return "bn";
1110       case LANG_BULGARIAN: return "bg_BG";
1111       case LANG_BURMESE: return "my_MM";
1112       case LANG_CAMBODIAN: return "km_KH";
1113       case LANG_CATALAN: return "ca_ES";
1114       case LANG_CHEROKEE: return "chr_US";
1115       case LANG_CHINESE:
1116         switch (sub)
1117           {
1118           case SUBLANG_CHINESE_TRADITIONAL: return "zh_TW";
1119           case SUBLANG_CHINESE_SIMPLIFIED: return "zh_CN";
1120           case SUBLANG_CHINESE_HONGKONG: return "zh_HK";
1121           case SUBLANG_CHINESE_SINGAPORE: return "zh_SG";
1122           case SUBLANG_CHINESE_MACAU: return "zh_MO";
1123           }
1124         return "zh";
1125       case LANG_CROATIAN:       /* LANG_CROATIAN == LANG_SERBIAN
1126                                  * What used to be called Serbo-Croatian
1127                                  * should really now be two separate
1128                                  * languages because of political reasons.
1129                                  * (Says tml, who knows nothing about Serbian
1130                                  * or Croatian.)
1131                                  * (I can feel those flames coming already.)
1132                                  */
1133         switch (sub)
1134           {
1135           case SUBLANG_DEFAULT: return "hr_HR";
1136           case SUBLANG_SERBIAN_LATIN: return "sr_CS";
1137           case SUBLANG_SERBIAN_CYRILLIC: return "sr_CS@cyrillic";
1138           }
1139         return "hr";
1140       case LANG_CZECH: return "cs_CZ";
1141       case LANG_DANISH: return "da_DK";
1142       case LANG_DIVEHI: return "dv_MV";
1143       case LANG_DUTCH:
1144         switch (sub)
1145           {
1146           case SUBLANG_DUTCH: return "nl_NL";
1147           case SUBLANG_DUTCH_BELGIAN: /* FLEMISH, VLAAMS */ return "nl_BE";
1148           }
1149         return "nl";
1150       case LANG_EDO: return "bin_NG";
1151       case LANG_ENGLISH:
1152         switch (sub)
1153           {
1154           /* SUBLANG_ENGLISH_US == SUBLANG_DEFAULT. Heh. I thought
1155            * English was the language spoken in England.
1156            * Oh well.
1157            */
1158           case SUBLANG_ENGLISH_US: return "en_US";
1159           case SUBLANG_ENGLISH_UK: return "en_GB";
1160           case SUBLANG_ENGLISH_AUS: return "en_AU";
1161           case SUBLANG_ENGLISH_CAN: return "en_CA";
1162           case SUBLANG_ENGLISH_NZ: return "en_NZ";
1163           case SUBLANG_ENGLISH_EIRE: return "en_IE";
1164           case SUBLANG_ENGLISH_SOUTH_AFRICA: return "en_ZA";
1165           case SUBLANG_ENGLISH_JAMAICA: return "en_JM";
1166           case SUBLANG_ENGLISH_CARIBBEAN: return "en_GD"; /* Grenada? */
1167           case SUBLANG_ENGLISH_BELIZE: return "en_BZ";
1168           case SUBLANG_ENGLISH_TRINIDAD: return "en_TT";
1169           case SUBLANG_ENGLISH_ZIMBABWE: return "en_ZW";
1170           case SUBLANG_ENGLISH_PHILIPPINES: return "en_PH";
1171           case SUBLANG_ENGLISH_INDONESIA: return "en_ID";
1172           case SUBLANG_ENGLISH_HONGKONG: return "en_HK";
1173           case SUBLANG_ENGLISH_INDIA: return "en_IN";
1174           case SUBLANG_ENGLISH_MALAYSIA: return "en_MY";
1175           case SUBLANG_ENGLISH_SINGAPORE: return "en_SG";
1176           }
1177         return "en";
1178       case LANG_ESTONIAN: return "et_EE";
1179       case LANG_FAEROESE: return "fo_FO";
1180       case LANG_FARSI: return "fa_IR";
1181       case LANG_FINNISH: return "fi_FI";
1182       case LANG_FRENCH:
1183         switch (sub)
1184           {
1185           case SUBLANG_FRENCH: return "fr_FR";
1186           case SUBLANG_FRENCH_BELGIAN: /* WALLOON */ return "fr_BE";
1187           case SUBLANG_FRENCH_CANADIAN: return "fr_CA";
1188           case SUBLANG_FRENCH_SWISS: return "fr_CH";
1189           case SUBLANG_FRENCH_LUXEMBOURG: return "fr_LU";
1190           case SUBLANG_FRENCH_MONACO: return "fr_MC";
1191           case SUBLANG_FRENCH_WESTINDIES: return "fr"; /* Caribbean? */
1192           case SUBLANG_FRENCH_REUNION: return "fr_RE";
1193           case SUBLANG_FRENCH_CONGO: return "fr_CG";
1194           case SUBLANG_FRENCH_SENEGAL: return "fr_SN";
1195           case SUBLANG_FRENCH_CAMEROON: return "fr_CM";
1196           case SUBLANG_FRENCH_COTEDIVOIRE: return "fr_CI";
1197           case SUBLANG_FRENCH_MALI: return "fr_ML";
1198           case SUBLANG_FRENCH_MOROCCO: return "fr_MA";
1199           case SUBLANG_FRENCH_HAITI: return "fr_HT";
1200           }
1201         return "fr";
1202       case LANG_FRISIAN: return "fy_NL";
1203       case LANG_FULFULDE:
1204         /* Spoken in Nigeria, Guinea, Senegal, Mali, Niger, Cameroon, Benin.  */
1205         return "ff_NG";
1206       case LANG_GAELIC:
1207         switch (sub)
1208           {
1209           case 0x01: /* SCOTTISH */ return "gd_GB";
1210           case 0x02: /* IRISH */ return "ga_IE";
1211           }
1212         return "C";
1213       case LANG_GALICIAN: return "gl_ES";
1214       case LANG_GEORGIAN: return "ka_GE";
1215       case LANG_GERMAN:
1216         switch (sub)
1217           {
1218           case SUBLANG_GERMAN: return "de_DE";
1219           case SUBLANG_GERMAN_SWISS: return "de_CH";
1220           case SUBLANG_GERMAN_AUSTRIAN: return "de_AT";
1221           case SUBLANG_GERMAN_LUXEMBOURG: return "de_LU";
1222           case SUBLANG_GERMAN_LIECHTENSTEIN: return "de_LI";
1223           }
1224         return "de";
1225       case LANG_GREEK: return "el_GR";
1226       case LANG_GUARANI: return "gn_PY";
1227       case LANG_GUJARATI: return "gu_IN";
1228       case LANG_HAUSA: return "ha_NG";
1229       case LANG_HAWAIIAN:
1230         /* FIXME: Do they mean Hawaiian ("haw_US", 1000 speakers)
1231            or Hawaii Creole English ("cpe_US", 600000 speakers)?  */
1232         return "cpe_US";
1233       case LANG_HEBREW: return "he_IL";
1234       case LANG_HINDI: return "hi_IN";
1235       case LANG_HUNGARIAN: return "hu_HU";
1236       case LANG_IBIBIO: return "nic_NG";
1237       case LANG_ICELANDIC: return "is_IS";
1238       case LANG_IGBO: return "ig_NG";
1239       case LANG_INDONESIAN: return "id_ID";
1240       case LANG_INUKTITUT: return "iu_CA";
1241       case LANG_ITALIAN:
1242         switch (sub)
1243           {
1244           case SUBLANG_ITALIAN: return "it_IT";
1245           case SUBLANG_ITALIAN_SWISS: return "it_CH";
1246           }
1247         return "it";
1248       case LANG_JAPANESE: return "ja_JP";
1249       case LANG_KANNADA: return "kn_IN";
1250       case LANG_KANURI: return "kr_NG";
1251       case LANG_KASHMIRI:
1252         switch (sub)
1253           {
1254           case SUBLANG_DEFAULT: return "ks_PK";
1255           case SUBLANG_KASHMIRI_INDIA: return "ks_IN";
1256           }
1257         return "ks";
1258       case LANG_KAZAK: return "kk_KZ";
1259       case LANG_KONKANI:
1260         /* FIXME: Adjust this when such locales appear on Unix.  */
1261         return "kok_IN";
1262       case LANG_KOREAN: return "ko_KR";
1263       case LANG_KYRGYZ: return "ky_KG";
1264       case LANG_LAO: return "lo_LA";
1265       case LANG_LATIN: return "la_VA";
1266       case LANG_LATVIAN: return "lv_LV";
1267       case LANG_LITHUANIAN: return "lt_LT";
1268       case LANG_MACEDONIAN: return "mk_MK";
1269       case LANG_MALAY:
1270         switch (sub)
1271           {
1272           case SUBLANG_MALAY_MALAYSIA: return "ms_MY";
1273           case SUBLANG_MALAY_BRUNEI_DARUSSALAM: return "ms_BN";
1274           }
1275         return "ms";
1276       case LANG_MALAYALAM: return "ml_IN";
1277       case LANG_MALTESE: return "mt_MT";
1278       case LANG_MANIPURI:
1279         /* FIXME: Adjust this when such locales appear on Unix.  */
1280         return "mni_IN";
1281       case LANG_MARATHI: return "mr_IN";
1282       case LANG_MONGOLIAN:
1283         switch (sub)
1284           {
1285           case SUBLANG_DEFAULT: return "mn_MN";
1286           }
1287         return "mn"; /* Ambiguous: could be "mn_CN" or "mn_MN".  */
1288       case LANG_NEPALI:
1289         switch (sub)
1290           {
1291           case SUBLANG_DEFAULT: return "ne_NP";
1292           case SUBLANG_NEPALI_INDIA: return "ne_IN";
1293           }
1294         return "ne";
1295       case LANG_NORWEGIAN:
1296         switch (sub)
1297           {
1298           case SUBLANG_NORWEGIAN_BOKMAL: return "nb_NO";
1299           case SUBLANG_NORWEGIAN_NYNORSK: return "nn_NO";
1300           }
1301         return "no";
1302       case LANG_ORIYA: return "or_IN";
1303       case LANG_OROMO: return "om_ET";
1304       case LANG_PAPIAMENTU: return "pap_AN";
1305       case LANG_PASHTO:
1306         return "ps"; /* Ambiguous: could be "ps_PK" or "ps_AF".  */
1307       case LANG_POLISH: return "pl_PL";
1308       case LANG_PORTUGUESE:
1309         switch (sub)
1310           {
1311           case SUBLANG_PORTUGUESE: return "pt_PT";
1312           /* Hmm. SUBLANG_PORTUGUESE_BRAZILIAN == SUBLANG_DEFAULT.
1313              Same phenomenon as SUBLANG_ENGLISH_US == SUBLANG_DEFAULT. */
1314           case SUBLANG_PORTUGUESE_BRAZILIAN: return "pt_BR";
1315           }
1316         return "pt";
1317       case LANG_PUNJABI:
1318         switch (sub)
1319           {
1320           case SUBLANG_PUNJABI_INDIA: return "pa_IN"; /* Gurmukhi script */
1321           case SUBLANG_PUNJABI_PAKISTAN: return "pa_PK"; /* Arabic script */
1322           }
1323         return "pa";
1324       case LANG_RHAETO_ROMANCE: return "rm_CH";
1325       case LANG_ROMANIAN:
1326         switch (sub)
1327           {
1328           case SUBLANG_ROMANIAN_ROMANIA: return "ro_RO";
1329           case SUBLANG_ROMANIAN_MOLDOVA: return "ro_MD";
1330           }
1331         return "ro";
1332       case LANG_RUSSIAN:
1333         switch (sub)
1334           {
1335           case SUBLANG_DEFAULT: return "ru_RU";
1336           }
1337         return "ru"; /* Ambiguous: could be "ru_RU" or "ru_UA" or "ru_MD".  */
1338       case LANG_SAAMI: /* actually Northern Sami */ return "se_NO";
1339       case LANG_SANSKRIT: return "sa_IN";
1340       case LANG_SINDHI:
1341         switch (sub)
1342           {
1343           case SUBLANG_SINDHI_INDIA: return "sd_IN";
1344           case SUBLANG_SINDHI_PAKISTAN: return "sd_PK";
1345           /*case SUBLANG_SINDHI_AFGHANISTAN: return "sd_AF";*/
1346           }
1347         return "sd";
1348       case LANG_SINHALESE: return "si_LK";
1349       case LANG_SLOVAK: return "sk_SK";
1350       case LANG_SLOVENIAN: return "sl_SI";
1351       case LANG_SOMALI: return "so_SO";
1352       case LANG_SORBIAN:
1353         /* FIXME: Adjust this when such locales appear on Unix.  */
1354         return "wen_DE";
1355       case LANG_SPANISH:
1356         switch (sub)
1357           {
1358           case SUBLANG_SPANISH: return "es_ES";
1359           case SUBLANG_SPANISH_MEXICAN: return "es_MX";
1360           case SUBLANG_SPANISH_MODERN:
1361             return "es_ES@modern";      /* not seen on Unix */
1362           case SUBLANG_SPANISH_GUATEMALA: return "es_GT";
1363           case SUBLANG_SPANISH_COSTA_RICA: return "es_CR";
1364           case SUBLANG_SPANISH_PANAMA: return "es_PA";
1365           case SUBLANG_SPANISH_DOMINICAN_REPUBLIC: return "es_DO";
1366           case SUBLANG_SPANISH_VENEZUELA: return "es_VE";
1367           case SUBLANG_SPANISH_COLOMBIA: return "es_CO";
1368           case SUBLANG_SPANISH_PERU: return "es_PE";
1369           case SUBLANG_SPANISH_ARGENTINA: return "es_AR";
1370           case SUBLANG_SPANISH_ECUADOR: return "es_EC";
1371           case SUBLANG_SPANISH_CHILE: return "es_CL";
1372           case SUBLANG_SPANISH_URUGUAY: return "es_UY";
1373           case SUBLANG_SPANISH_PARAGUAY: return "es_PY";
1374           case SUBLANG_SPANISH_BOLIVIA: return "es_BO";
1375           case SUBLANG_SPANISH_EL_SALVADOR: return "es_SV";
1376           case SUBLANG_SPANISH_HONDURAS: return "es_HN";
1377           case SUBLANG_SPANISH_NICARAGUA: return "es_NI";
1378           case SUBLANG_SPANISH_PUERTO_RICO: return "es_PR";
1379           }
1380         return "es";
1381       case LANG_SUTU: return "bnt_TZ"; /* or "st_LS" or "nso_ZA"? */
1382       case LANG_SWAHILI: return "sw_KE";
1383       case LANG_SWEDISH:
1384         switch (sub)
1385           {
1386           case SUBLANG_DEFAULT: return "sv_SE";
1387           case SUBLANG_SWEDISH_FINLAND: return "sv_FI";
1388           }
1389         return "sv";
1390       case LANG_SYRIAC: return "syr_TR"; /* An extinct language.  */
1391       case LANG_TAGALOG: return "tl_PH";
1392       case LANG_TAJIK: return "tg_TJ";
1393       case LANG_TAMAZIGHT:
1394         switch (sub)
1395           {
1396           /* FIXME: Adjust this when Tamazight locales appear on Unix.  */
1397           case SUBLANG_TAMAZIGHT_ARABIC: return "ber_MA@arabic";
1398           case SUBLANG_TAMAZIGHT_ALGERIA_LATIN: return "ber_DZ@latin";
1399           }
1400         return "ber_MA";
1401       case LANG_TAMIL:
1402         switch (sub)
1403           {
1404           case SUBLANG_DEFAULT: return "ta_IN";
1405           }
1406         return "ta"; /* Ambiguous: could be "ta_IN" or "ta_LK" or "ta_SG".  */
1407       case LANG_TATAR: return "tt_RU";
1408       case LANG_TELUGU: return "te_IN";
1409       case LANG_THAI: return "th_TH";
1410       case LANG_TIBETAN: return "bo_CN";
1411       case LANG_TIGRINYA:
1412         switch (sub)
1413           {
1414           case SUBLANG_TIGRINYA_ETHIOPIA: return "ti_ET";
1415           case SUBLANG_TIGRINYA_ERITREA: return "ti_ER";
1416           }
1417         return "ti";
1418       case LANG_TSONGA: return "ts_ZA";
1419       case LANG_TSWANA: return "tn_BW";
1420       case LANG_TURKISH: return "tr_TR";
1421       case LANG_TURKMEN: return "tk_TM";
1422       case LANG_UKRAINIAN: return "uk_UA";
1423       case LANG_URDU:
1424         switch (sub)
1425           {
1426           case SUBLANG_URDU_PAKISTAN: return "ur_PK";
1427           case SUBLANG_URDU_INDIA: return "ur_IN";
1428           }
1429         return "ur";
1430       case LANG_UZBEK:
1431         switch (sub)
1432           {
1433           case SUBLANG_UZBEK_LATIN: return "uz_UZ";
1434           case SUBLANG_UZBEK_CYRILLIC: return "uz_UZ@cyrillic";
1435           }
1436         return "uz";
1437       case LANG_VENDA: return "ve_ZA";
1438       case LANG_VIETNAMESE: return "vi_VN";
1439       case LANG_WELSH: return "cy_GB";
1440       case LANG_XHOSA: return "xh_ZA";
1441       case LANG_YI: return "sit_CN";
1442       case LANG_YIDDISH: return "yi_IL";
1443       case LANG_YORUBA: return "yo_NG";
1444       case LANG_ZULU: return "zu_ZA";
1445       default: return "C";
1446       }
1447   }
1448 }
1449
1450 # if !defined IN_LIBINTL
1451 static
1452 # endif
1453 const char *
1454 gl_locale_name_from_win32_LCID (LCID lcid)
1455 {
1456   LANGID langid;
1457
1458   /* Strip off the sorting rules, keep only the language part.  */
1459   langid = LANGIDFROMLCID (lcid);
1460
1461   return gl_locale_name_from_win32_LANGID (langid);
1462 }
1463
1464 #endif
1465
1466
1467 /* XPG3 defines the result of 'setlocale (category, NULL)' as:
1468    "Directs 'setlocale()' to query 'category' and return the current
1469     setting of 'local'."
1470    However it does not specify the exact format.  Neither do SUSV2 and
1471    ISO C 99.  So we can use this feature only on selected systems (e.g.
1472    those using GNU C Library).  */
1473 #if defined _LIBC || (defined __GLIBC__ && __GLIBC__ >= 2)
1474 # define HAVE_LOCALE_NULL
1475 #endif
1476
1477 /* Determine the current locale's name, and canonicalize it into XPG syntax
1478      language[_territory][.codeset][@modifier]
1479    The codeset part in the result is not reliable; the locale_charset()
1480    should be used for codeset information instead.
1481    The result must not be freed; it is statically allocated.  */
1482
1483 const char *
1484 gl_locale_name_posix (int category, const char *categoryname)
1485 {
1486   /* Use the POSIX methods of looking to 'LC_ALL', 'LC_xxx', and 'LANG'.
1487      On some systems this can be done by the 'setlocale' function itself.  */
1488 #if defined HAVE_SETLOCALE && defined HAVE_LC_MESSAGES && defined HAVE_LOCALE_NULL
1489   return setlocale (category, NULL);
1490 #else
1491   const char *retval;
1492
1493   /* Setting of LC_ALL overrides all other.  */
1494   retval = getenv ("LC_ALL");
1495   if (retval != NULL && retval[0] != '\0')
1496     return retval;
1497   /* Next comes the name of the desired category.  */
1498   retval = getenv (categoryname);
1499   if (retval != NULL && retval[0] != '\0')
1500     return retval;
1501   /* Last possibility is the LANG environment variable.  */
1502   retval = getenv ("LANG");
1503   if (retval != NULL && retval[0] != '\0')
1504     return retval;
1505
1506   return NULL;
1507 #endif
1508 }
1509
1510 const char *
1511 gl_locale_name_default (void)
1512 {
1513   /* POSIX:2001 says:
1514      "All implementations shall define a locale as the default locale, to be
1515       invoked when no environment variables are set, or set to the empty
1516       string.  This default locale can be the POSIX locale or any other
1517       implementation-defined locale.  Some implementations may provide
1518       facilities for local installation administrators to set the default
1519       locale, customizing it for each location.  POSIX:2001 does not require
1520       such a facility.  */
1521
1522 #if !(HAVE_CFLOCALECOPYCURRENT || HAVE_CFPREFERENCESCOPYAPPVALUE || defined(WIN32_NATIVE))
1523
1524   /* The system does not have a way of setting the locale, other than the
1525      POSIX specified environment variables.  We use C as default locale.  */
1526   return "C";
1527
1528 #else
1529
1530   /* Return an XPG style locale name language[_territory][@modifier].
1531      Don't even bother determining the codeset; it's not useful in this
1532      context, because message catalogs are not specific to a single
1533      codeset.  */
1534
1535 # if HAVE_CFLOCALECOPYCURRENT || HAVE_CFPREFERENCESCOPYAPPVALUE
1536   /* MacOS X 10.2 or newer */
1537   {
1538     /* Cache the locale name, since CoreFoundation calls are expensive.  */
1539     static const char *cached_localename;
1540
1541     if (cached_localename == NULL)
1542       {
1543         char namebuf[256];
1544 #  if HAVE_CFLOCALECOPYCURRENT /* MacOS X 10.3 or newer */
1545         CFLocaleRef locale = CFLocaleCopyCurrent ();
1546         CFStringRef name = CFLocaleGetIdentifier (locale);
1547
1548         if (CFStringGetCString (name, namebuf, sizeof(namebuf),
1549                                 kCFStringEncodingASCII))
1550           {
1551             gl_locale_name_canonicalize (namebuf);
1552             cached_localename = strdup (namebuf);
1553           }
1554         CFRelease (locale);
1555 #  elif HAVE_CFPREFERENCESCOPYAPPVALUE /* MacOS X 10.2 or newer */
1556         CFTypeRef value =
1557           CFPreferencesCopyAppValue (CFSTR ("AppleLocale"),
1558                                      kCFPreferencesCurrentApplication);
1559         if (value != NULL
1560             && CFGetTypeID (value) == CFStringGetTypeID ()
1561             && CFStringGetCString ((CFStringRef)value, namebuf, sizeof(namebuf),
1562                                    kCFStringEncodingASCII))
1563           {
1564             gl_locale_name_canonicalize (namebuf);
1565             cached_localename = strdup (namebuf);
1566           }
1567 #  endif
1568         if (cached_localename == NULL)
1569           cached_localename = "C";
1570       }
1571     return cached_localename;
1572   }
1573
1574 # endif
1575
1576 # if defined(WIN32_NATIVE) /* WIN32, not Cygwin */
1577   {
1578     LCID lcid;
1579
1580     /* Use native Win32 API locale ID.  */
1581     lcid = GetThreadLocale ();
1582
1583     return gl_locale_name_from_win32_LCID (lcid);
1584   }
1585 # endif
1586 #endif
1587 }
1588
1589 const char *
1590 gl_locale_name (int category, const char *categoryname)
1591 {
1592   const char *retval;
1593
1594   retval = gl_locale_name_posix (category, categoryname);
1595   if (retval != NULL)
1596     return retval;
1597
1598   return gl_locale_name_default ();
1599 }