non-gnu standards
[gnulib.git] / doc / standards.texi
1 \input texinfo @c -*-texinfo-*-
2 @c %**start of header
3 @setfilename standards.info
4 @settitle GNU Coding Standards
5 @c This date is automagically updated when you save this file:
6 @set lastupdate February 8, 2006
7 @c %**end of header
8
9 @dircategory GNU organization
10 @direntry
11 * Standards: (standards).        GNU coding standards.
12 @end direntry
13
14 @c @setchapternewpage odd
15 @setchapternewpage off
16
17 @c Put everything in one index (arbitrarily chosen to be the concept index).
18 @syncodeindex fn cp
19 @syncodeindex ky cp
20 @syncodeindex pg cp
21 @syncodeindex vr cp
22
23 @c This is used by a cross ref in make-stds.texi
24 @set CODESTD  1
25 @iftex
26 @set CHAPTER chapter
27 @end iftex
28 @ifinfo
29 @set CHAPTER node
30 @end ifinfo
31
32 @copying
33 The GNU coding standards, last updated @value{lastupdate}.
34
35 Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
36 2001, 2002, 2003, 2004, 2005, 2006 Free Software Foundation, Inc.
37
38 Permission is granted to copy, distribute and/or modify this document
39 under the terms of the GNU Free Documentation License, Version 1.1
40 or any later version published by the Free Software Foundation;
41 with no Invariant Sections, with no
42 Front-Cover Texts, and with no Back-Cover Texts.
43 A copy of the license is included in the section entitled ``GNU
44 Free Documentation License''.
45 @end copying
46
47 @titlepage
48 @title GNU Coding Standards
49 @author Richard Stallman, et al.
50 @author last updated @value{lastupdate}
51 @page
52 @vskip 0pt plus 1filll
53 @insertcopying
54 @end titlepage
55
56 @contents
57
58 @ifnottex
59 @node Top, Preface, (dir), (dir)
60 @top Version
61
62 @insertcopying
63 @end ifnottex
64
65 @menu
66 * Preface::                     About the GNU Coding Standards
67 * Legal Issues::                Keeping Free Software Free
68 * Design Advice::               General Program Design
69 * Program Behavior::            Program Behavior for All Programs
70 * Writing C::                   Making The Best Use of C
71 * Documentation::               Documenting Programs
72 * Managing Releases::           The Release Process
73 * References::                  References to Non-Free Software or Documentation
74 * Copying This Manual::         How to Make Copies of This Manual
75 * Index::                       
76
77 @end menu
78
79 @node Preface
80 @chapter About the GNU Coding Standards
81
82 The GNU Coding Standards were written by Richard Stallman and other GNU
83 Project volunteers.  Their purpose is to make the GNU system clean,
84 consistent, and easy to install.  This document can also be read as a
85 guide to writing portable, robust and reliable programs.  It focuses on
86 programs written in C, but many of the rules and principles are useful
87 even if you write in another programming language.  The rules often
88 state reasons for writing in a certain way.
89
90 This release of the GNU Coding Standards was last updated
91 @value{lastupdate}.
92
93 @cindex where to obtain @code{standards.texi}
94 @cindex downloading this manual
95 If you did not obtain this file directly from the GNU project and
96 recently, please check for a newer version.  You can get the GNU
97 Coding Standards from the GNU web server in many
98 different formats, including the Texinfo source, PDF, HTML, DVI, plain
99 text, and more, at: @uref{http://www.gnu.org/prep/standards/}.
100
101 Corrections or suggestions for this document should be sent to
102 @email{bug-standards@@gnu.org}.  If you make a suggestion, please include a
103 suggested new wording for it; our time is limited.  We prefer a context
104 diff to the @file{standards.texi} or @file{make-stds.texi} files, but if
105 you don't have those files, please mail your suggestion anyway.
106
107 These standards cover the minimum of what is important when writing a
108 GNU package.  Likely, the needs for additional standards will come up.
109 Sometimes, you might suggest that such standards be added to this
110 document.  If you think your standards would be generally useful, please
111 do suggest them.
112
113 You should also set standards for your package on many questions not
114 addressed or not firmly specified here.  The most important point is to
115 be self-consistent---try to stick to the conventions you pick, and try
116 to document them as much as possible.  That way, your program will be
117 more maintainable by others.
118
119 The GNU Hello program serves as an example of how to follow the GNU
120 coding standards for a trivial program which prints @samp{Hello,
121 world!}.  @uref{http://www.gnu.org/software/hello/hello.html}.
122
123 @node Legal Issues
124 @chapter Keeping Free Software Free
125 @cindex legal aspects
126
127 This chapter discusses how you can make sure that GNU software
128 avoids legal difficulties, and other related issues.
129
130 @menu
131 * Reading Non-Free Code::       Referring to Proprietary Programs
132 * Contributions::               Accepting Contributions
133 * Trademarks::                  How We Deal with Trademark Issues
134 @end menu
135
136 @node Reading Non-Free Code
137 @section Referring to Proprietary Programs
138 @cindex proprietary programs
139 @cindex avoiding proprietary code
140
141 Don't in any circumstances refer to Unix source code for or during
142 your work on GNU!  (Or to any other proprietary programs.)
143
144 If you have a vague recollection of the internals of a Unix program,
145 this does not absolutely mean you can't write an imitation of it, but
146 do try to organize the imitation internally along different lines,
147 because this is likely to make the details of the Unix version
148 irrelevant and dissimilar to your results.
149
150 For example, Unix utilities were generally optimized to minimize
151 memory use; if you go for speed instead, your program will be very
152 different.  You could keep the entire input file in core and scan it
153 there instead of using stdio.  Use a smarter algorithm discovered more
154 recently than the Unix program.  Eliminate use of temporary files.  Do
155 it in one pass instead of two (we did this in the assembler).
156
157 Or, on the contrary, emphasize simplicity instead of speed.  For some
158 applications, the speed of today's computers makes simpler algorithms
159 adequate.
160
161 Or go for generality.  For example, Unix programs often have static
162 tables or fixed-size strings, which make for arbitrary limits; use
163 dynamic allocation instead.  Make sure your program handles NULs and
164 other funny characters in the input files.  Add a programming language
165 for extensibility and write part of the program in that language.
166
167 Or turn some parts of the program into independently usable libraries.
168 Or use a simple garbage collector instead of tracking precisely when
169 to free memory, or use a new GNU facility such as obstacks.
170
171 @node Contributions
172 @section Accepting Contributions
173 @cindex legal papers
174 @cindex accepting contributions
175
176 If the program you are working on is copyrighted by the Free Software
177 Foundation, then when someone else sends you a piece of code to add to
178 the program, we need legal papers to use it---just as we asked you to
179 sign papers initially.  @emph{Each} person who makes a nontrivial
180 contribution to a program must sign some sort of legal papers in order
181 for us to have clear title to the program; the main author alone is not
182 enough.
183
184 So, before adding in any contributions from other people, please tell
185 us, so we can arrange to get the papers.  Then wait until we tell you
186 that we have received the signed papers, before you actually use the
187 contribution.
188
189 This applies both before you release the program and afterward.  If
190 you receive diffs to fix a bug, and they make significant changes, we
191 need legal papers for that change.
192
193 This also applies to comments and documentation files.  For copyright
194 law, comments and code are just text.  Copyright applies to all kinds of
195 text, so we need legal papers for all kinds.
196
197 We know it is frustrating to ask for legal papers; it's frustrating for
198 us as well.  But if you don't wait, you are going out on a limb---for
199 example, what if the contributor's employer won't sign a disclaimer?
200 You might have to take that code out again!
201
202 You don't need papers for changes of a few lines here or there, since
203 they are not significant for copyright purposes.  Also, you don't need
204 papers if all you get from the suggestion is some ideas, not actual code
205 which you use.  For example, if someone sent you one implementation, but
206 you write a different implementation of the same idea, you don't need to
207 get papers.
208
209 The very worst thing is if you forget to tell us about the other
210 contributor.  We could be very embarrassed in court some day as a
211 result.
212
213 We have more detailed advice for maintainers of programs; if you have
214 reached the stage of actually maintaining a program for GNU (whether
215 released or not), please ask us for a copy.  It is also available
216 online for your perusal: @uref{http://www.gnu.org/prep/maintain/}.
217
218 @node Trademarks
219 @section Trademarks
220 @cindex trademarks
221
222 Please do not include any trademark acknowledgements in GNU software
223 packages or documentation.
224
225 Trademark acknowledgements are the statements that such-and-such is a
226 trademark of so-and-so.  The GNU Project has no objection to the basic
227 idea of trademarks, but these acknowledgements feel like kowtowing, 
228 and there is no legal requirement for them, so we don't use them.
229
230 What is legally required, as regards other people's trademarks, is to
231 avoid using them in ways which a reader might reasonably understand as
232 naming or labeling our own programs or activities.  For example, since
233 ``Objective C'' is (or at least was) a trademark, we made sure to say
234 that we provide a ``compiler for the Objective C language'' rather
235 than an ``Objective C compiler''.  The latter would have been meant as
236 a shorter way of saying the former, but it does not explicitly state
237 the relationship, so it could be misinterpreted as using ``Objective
238 C'' as a label for the compiler rather than for the language.
239
240 Please don't use ``win'' as an abbreviation for Microsoft Windows in
241 GNU software or documentation.  In hacker terminology, calling
242 something a ``win'' is a form of praise.  If you wish to praise
243 Microsoft Windows when speaking on your own, by all means do so, but
244 not in GNU software.  Usually we write the name ``Windows'' in full,
245 but when brevity is very important (as in file names and sometimes
246 symbol names), we abbreviate it to ``w''.  For instance, the files and
247 functions in Emacs that deal with Windows start with @samp{w32}.
248
249 @node Design Advice
250 @chapter General Program Design
251 @cindex program design
252
253 This chapter discusses some of the issues you should take into
254 account when designing your program.
255
256 @c                         Standard or ANSI C
257 @c
258 @c In 1989 the American National Standards Institute (ANSI) standardized
259 @c C   as  standard  X3.159-1989.    In  December   of  that   year  the
260 @c International Standards Organization ISO  adopted the ANSI C standard
261 @c making  minor changes.   In 1990  ANSI then  re-adopted  ISO standard
262 @c C. This version of C is known as either ANSI C or Standard C.
263
264 @c A major revision of the C Standard appeared in 1999.
265
266 @menu
267 * Source Language::             Which languages to use.
268 * Compatibility::               Compatibility with other implementations
269 * Using Extensions::            Using non-standard features
270 * Standard C::                  Using Standard C features
271 * Conditional Compilation::     Compiling Code Only If A Conditional is True
272 @end menu
273
274 @node Source Language
275 @section Which Languages to Use
276 @cindex programming languages
277
278 When you want to use a language that gets compiled and runs at high
279 speed, the best language to use is C.  Using another language is like
280 using a non-standard feature: it will cause trouble for users.  Even if
281 GCC supports the other language, users may find it inconvenient to have
282 to install the compiler for that other language in order to build your
283 program.  For example, if you write your program in C++, people will
284 have to install the GNU C++ compiler in order to compile your program.
285
286 C has one other advantage over C++ and other compiled languages: more
287 people know C, so more people will find it easy to read and modify the
288 program if it is written in C.
289
290 So in general it is much better to use C, rather than the
291 comparable alternatives.
292
293 But there are two exceptions to that conclusion:
294
295 @itemize @bullet
296 @item
297 It is no problem to use another language to write a tool specifically
298 intended for use with that language.  That is because the only people
299 who want to build the tool will be those who have installed the other
300 language anyway.
301
302 @item
303 If an application is of interest only to a narrow part of the community,
304 then the question of which language it is written in has less effect on
305 other people, so you may as well please yourself.
306 @end itemize
307
308 Many programs are designed to be extensible: they include an interpreter
309 for a language that is higher level than C.  Often much of the program
310 is written in that language, too.  The Emacs editor pioneered this
311 technique.
312
313 @cindex GUILE
314 The standard extensibility interpreter for GNU software is GUILE, which
315 implements the language Scheme (an especially clean and simple dialect
316 of Lisp).  @uref{http://www.gnu.org/software/guile/}.  We don't reject
317 programs written in other ``scripting languages'' such as Perl and
318 Python, but using GUILE is very important for the overall consistency of
319 the GNU system.
320
321 @node Compatibility
322 @section Compatibility with Other Implementations
323 @cindex compatibility with C and @sc{posix} standards
324 @cindex @sc{posix} compatibility
325
326 With occasional exceptions, utility programs and libraries for GNU
327 should be upward compatible with those in Berkeley Unix, and upward
328 compatible with Standard C if Standard C specifies their
329 behavior, and upward compatible with @sc{posix} if @sc{posix} specifies
330 their behavior.
331
332 When these standards conflict, it is useful to offer compatibility
333 modes for each of them.
334
335 @cindex options for compatibility
336 Standard C and @sc{posix} prohibit many kinds of extensions.  Feel
337 free to make the extensions anyway, and include a @samp{--ansi},
338 @samp{--posix}, or @samp{--compatible} option to turn them off.
339 However, if the extension has a significant chance of breaking any real
340 programs or scripts, then it is not really upward compatible.  So you
341 should try to redesign its interface to make it upward compatible.
342
343 @cindex @code{POSIXLY_CORRECT}, environment variable
344 Many GNU programs suppress extensions that conflict with @sc{posix} if the
345 environment variable @code{POSIXLY_CORRECT} is defined (even if it is
346 defined with a null value).  Please make your program recognize this
347 variable if appropriate.
348
349 When a feature is used only by users (not by programs or command
350 files), and it is done poorly in Unix, feel free to replace it
351 completely with something totally different and better.  (For example,
352 @code{vi} is replaced with Emacs.)  But it is nice to offer a compatible
353 feature as well.  (There is a free @code{vi} clone, so we offer it.)
354
355 Additional useful features are welcome regardless of whether
356 there is any precedent for them.
357
358 @node Using Extensions
359 @section Using Non-standard Features
360 @cindex non-standard extensions
361
362 Many GNU facilities that already exist support a number of convenient
363 extensions over the comparable Unix facilities.  Whether to use these
364 extensions in implementing your program is a difficult question.
365
366 On the one hand, using the extensions can make a cleaner program.
367 On the other hand, people will not be able to build the program
368 unless the other GNU tools are available.  This might cause the
369 program to work on fewer kinds of machines.
370
371 With some extensions, it might be easy to provide both alternatives.
372 For example, you can define functions with a ``keyword'' @code{INLINE}
373 and define that as a macro to expand into either @code{inline} or
374 nothing, depending on the compiler.
375
376 In general, perhaps it is best not to use the extensions if you can
377 straightforwardly do without them, but to use the extensions if they
378 are a big improvement.
379
380 An exception to this rule are the large, established programs (such as
381 Emacs) which run on a great variety of systems.  Using GNU extensions in
382 such programs would make many users unhappy, so we don't do that.
383
384 Another exception is for programs that are used as part of compilation:
385 anything that must be compiled with other compilers in order to
386 bootstrap the GNU compilation facilities.  If these require the GNU
387 compiler, then no one can compile them without having them installed
388 already.  That would be extremely troublesome in certain cases.
389
390 @node Standard C
391 @section Standard C and Pre-Standard C
392 @cindex @sc{ansi} C standard
393
394 1989 Standard C is widespread enough now that it is ok to use its
395 features in new programs.  There is one exception: do not ever use the
396 ``trigraph'' feature of Standard C.
397
398 1999 Standard C is not widespread yet, so please do not require its
399 features in programs.  It is ok to use its features if they are present.
400
401 However, it is easy to support pre-standard compilers in most programs,
402 so if you know how to do that, feel free.  If a program you are
403 maintaining has such support, you should try to keep it working.
404
405 @cindex function prototypes
406 To support pre-standard C, instead of writing function definitions in
407 standard prototype form,
408
409 @example
410 int
411 foo (int x, int y)
412 @dots{}
413 @end example
414
415 @noindent
416 write the definition in pre-standard style like this,
417
418 @example
419 int
420 foo (x, y)
421      int x, y;
422 @dots{}
423 @end example
424
425 @noindent
426 and use a separate declaration to specify the argument prototype:
427
428 @example
429 int foo (int, int);
430 @end example
431
432 You need such a declaration anyway, in a header file, to get the benefit
433 of prototypes in all the files where the function is called.  And once
434 you have the declaration, you normally lose nothing by writing the
435 function definition in the pre-standard style.
436
437 This technique does not work for integer types narrower than @code{int}.
438 If you think of an argument as being of a type narrower than @code{int},
439 declare it as @code{int} instead.
440
441 There are a few special cases where this technique is hard to use.  For
442 example, if a function argument needs to hold the system type
443 @code{dev_t}, you run into trouble, because @code{dev_t} is shorter than
444 @code{int} on some machines; but you cannot use @code{int} instead,
445 because @code{dev_t} is wider than @code{int} on some machines.  There
446 is no type you can safely use on all machines in a non-standard
447 definition.  The only way to support non-standard C and pass such an
448 argument is to check the width of @code{dev_t} using Autoconf and choose
449 the argument type accordingly.  This may not be worth the trouble.
450
451 In order to support pre-standard compilers that do not recognize
452 prototypes, you may want to use a preprocessor macro like this:
453
454 @example
455 /* Declare the prototype for a general external function.  */
456 #if defined (__STDC__) || defined (WINDOWSNT)
457 #define P_(proto) proto
458 #else
459 #define P_(proto) ()
460 #endif
461 @end example
462
463 @node Conditional Compilation
464 @section Conditional Compilation
465
466 When supporting configuration options already known when building your
467 program we prefer using @code{if (... )} over conditional compilation,
468 as in the former case the compiler is able to perform more extensive
469 checking of all possible code paths.
470
471 For example, please write
472
473 @smallexample
474   if (HAS_FOO)
475     ...
476   else
477     ...
478 @end smallexample
479
480 @noindent
481 instead of:
482
483 @smallexample
484   #ifdef HAS_FOO
485     ...
486   #else
487     ...
488   #endif
489 @end smallexample
490
491 A modern compiler such as GCC will generate exactly the same code in
492 both cases, and we have been using similar techniques with good success
493 in several projects.  Of course, the former method assumes that
494 @code{HAS_FOO} is defined as either 0 or 1.
495
496 While this is not a silver bullet solving all portability problems,
497 and is not always appropriate, following this policy would have saved
498 GCC developers many hours, or even days, per year.
499
500 In the case of function-like macros like @code{REVERSIBLE_CC_MODE} in
501 GCC which cannot be simply used in @code{if( ...)} statements, there is
502 an easy workaround.  Simply introduce another macro
503 @code{HAS_REVERSIBLE_CC_MODE} as in the following example:
504
505 @smallexample
506   #ifdef REVERSIBLE_CC_MODE
507   #define HAS_REVERSIBLE_CC_MODE 1
508   #else
509   #define HAS_REVERSIBLE_CC_MODE 0
510   #endif
511 @end smallexample
512
513 @node Program Behavior
514 @chapter Program Behavior for All Programs
515
516 This chapter describes conventions for writing robust
517 software.  It also describes general standards for error messages, the
518 command line interface, and how libraries should behave.
519
520 @menu
521 * Non-GNU Standards::           We consider standards such as POSIX;
522                                   we don't "obey" them.
523 * Semantics::                   Writing robust programs
524 * Libraries::                   Library behavior
525 * Errors::                      Formatting error messages
526 * User Interfaces::             Standards about interfaces generally
527 * Graphical Interfaces::        Standards for graphical interfaces
528 * Command-Line Interfaces::     Standards for command line interfaces
529 * Option Table::                Table of long options
530 * Memory Usage::                When and how to care about memory needs
531 * File Usage::                  Which files to use, and where
532 @end menu
533
534 @node Non-GNU Standards
535 @section Non-GNU Standards
536
537 The GNU Project regards standards published by other organizations as
538 suggestions, not orders.  We consider those standards, but we do not
539 ``obey'' them.  In developing a GNU program, you should implement
540 an outside standard's specifications when that makes the GNU system
541 better overall in an objective sense.  When it doesn't, you shouldn't.
542
543 In most cases, following published standards is convenient for
544 users---it means that their programs or scripts will work more
545 portably.  For instance, GCC implements nearly all the features of
546 Standard C as specified by that standard.  C program developers would
547 be unhappy if it did not.  And GNU utilities mostly follow
548 specifications of POSIX.2; shell script writers and users would be
549 unhappy if our programs were incompatible.
550
551 But we do not follow either of these specifications rigidly, and there
552 are specific points on which we decided not to follow them, so as to
553 make the GNU system better for users.
554
555 For instance, Standard C says that nearly all extensions to C are
556 prohibited.  How silly!  GCC implements many extensions, some of which
557 were later adopted as part of the standard.  If you want these
558 constructs to give an error message as ``required'' by the standard,
559 you must specify @samp{--pedantic}, which was implemented only so that
560 we can say ``GCC is a 100% implementation of the standard,'' not
561 because there is any reason to actually use it.
562
563 POSIX.2 specifies that @samp{df} and @samp{du} must output sizes by
564 default in units of 512 bytes.  What users want is units of 1k, so
565 that is what we do by default.  If you want the ridiculous behavior
566 ``required'' by POSIX, you must set the environment variable
567 @samp{POSIXLY_CORRECT} (which was originally going to be named
568 @samp{POSIX_ME_HARDER}).
569
570 GNU utilities also depart from the letter of the POSIX.2 specification
571 when they support long-named command-line options, and intermixing
572 options with ordinary arguments.  This minor incompatibility with
573 POSIX is never a problem in practice, and it is very useful.
574
575 In particular, don't reject a new feature, or remove an old one,
576 merely because a standard says it is ``forbidden'' or ``deprecated.''
577
578 @node Semantics
579 @section Writing Robust Programs
580
581 @cindex arbitrary limits on data
582 Avoid arbitrary limits on the length or number of @emph{any} data
583 structure, including file names, lines, files, and symbols, by allocating
584 all data structures dynamically.  In most Unix utilities, ``long lines
585 are silently truncated''.  This is not acceptable in a GNU utility.
586
587 @cindex @code{NUL} characters
588 Utilities reading files should not drop NUL characters, or any other
589 nonprinting characters @emph{including those with codes above 0177}.
590 The only sensible exceptions would be utilities specifically intended
591 for interface to certain types of terminals or printers
592 that can't handle those characters.
593 Whenever possible, try to make programs work properly with
594 sequences of bytes that represent multibyte characters, using encodings
595 such as UTF-8 and others.
596
597 @cindex error messages
598 Check every system call for an error return, unless you know you wish to
599 ignore errors.  Include the system error text (from @code{perror} or
600 equivalent) in @emph{every} error message resulting from a failing
601 system call, as well as the name of the file if any and the name of the
602 utility.  Just ``cannot open foo.c'' or ``stat failed'' is not
603 sufficient.
604
605 @cindex @code{malloc} return value
606 @cindex memory allocation failure
607 Check every call to @code{malloc} or @code{realloc} to see if it
608 returned zero.  Check @code{realloc} even if you are making the block
609 smaller; in a system that rounds block sizes to a power of 2,
610 @code{realloc} may get a different block if you ask for less space.
611
612 In Unix, @code{realloc} can destroy the storage block if it returns
613 zero.  GNU @code{realloc} does not have this bug: if it fails, the
614 original block is unchanged.  Feel free to assume the bug is fixed.  If
615 you wish to run your program on Unix, and wish to avoid lossage in this
616 case, you can use the GNU @code{malloc}.
617
618 You must expect @code{free} to alter the contents of the block that was
619 freed.  Anything you want to fetch from the block, you must fetch before
620 calling @code{free}.
621
622 If @code{malloc} fails in a noninteractive program, make that a fatal
623 error.  In an interactive program (one that reads commands from the
624 user), it is better to abort the command and return to the command
625 reader loop.  This allows the user to kill other processes to free up
626 virtual memory, and then try the command again.
627
628 @cindex command-line arguments, decoding
629 Use @code{getopt_long} to decode arguments, unless the argument syntax
630 makes this unreasonable.
631
632 When static storage is to be written in during program execution, use
633 explicit C code to initialize it.  Reserve C initialized declarations
634 for data that will not be changed.
635 @c ADR: why?
636
637 Try to avoid low-level interfaces to obscure Unix data structures (such
638 as file directories, utmp, or the layout of kernel memory), since these
639 are less likely to work compatibly.  If you need to find all the files
640 in a directory, use @code{readdir} or some other high-level interface.
641 These are supported compatibly by GNU.
642
643 @cindex signal handling
644 The preferred signal handling facilities are the BSD variant of
645 @code{signal}, and the @sc{posix} @code{sigaction} function; the
646 alternative USG @code{signal} interface is an inferior design.
647
648 Nowadays, using the @sc{posix} signal functions may be the easiest way
649 to make a program portable.  If you use @code{signal}, then on GNU/Linux
650 systems running GNU libc version 1, you should include
651 @file{bsd/signal.h} instead of @file{signal.h}, so as to get BSD
652 behavior.  It is up to you whether to support systems where
653 @code{signal} has only the USG behavior, or give up on them.
654
655 @cindex impossible conditions
656 In error checks that detect ``impossible'' conditions, just abort.
657 There is usually no point in printing any message.  These checks
658 indicate the existence of bugs.  Whoever wants to fix the bugs will have
659 to read the source code and run a debugger.  So explain the problem with
660 comments in the source.  The relevant data will be in variables, which
661 are easy to examine with the debugger, so there is no point moving them
662 elsewhere.
663
664 Do not use a count of errors as the exit status for a program.
665 @emph{That does not work}, because exit status values are limited to 8
666 bits (0 through 255).  A single run of the program might have 256
667 errors; if you try to return 256 as the exit status, the parent process
668 will see 0 as the status, and it will appear that the program succeeded.
669
670 @cindex temporary files
671 @cindex @code{TMPDIR} environment variable
672 If you make temporary files, check the @code{TMPDIR} environment
673 variable; if that variable is defined, use the specified directory
674 instead of @file{/tmp}.
675
676 In addition, be aware that there is a possible security problem when
677 creating temporary files in world-writable directories.  In C, you can
678 avoid this problem by creating temporary files in this manner:
679
680 @example
681 fd = open(filename, O_WRONLY | O_CREAT | O_EXCL, 0600);
682 @end example
683
684 @noindent
685 or by using the @code{mkstemps} function from libiberty.
686
687 In bash, use @code{set -C} to avoid this problem.
688
689 @node Libraries
690 @section Library Behavior
691 @cindex libraries
692
693 Try to make library functions reentrant.  If they need to do dynamic
694 storage allocation, at least try to avoid any nonreentrancy aside from
695 that of @code{malloc} itself.
696
697 Here are certain name conventions for libraries, to avoid name
698 conflicts.
699
700 Choose a name prefix for the library, more than two characters long.
701 All external function and variable names should start with this
702 prefix.  In addition, there should only be one of these in any given
703 library member.  This usually means putting each one in a separate
704 source file.
705
706 An exception can be made when two external symbols are always used
707 together, so that no reasonable program could use one without the
708 other; then they can both go in the same file.
709
710 External symbols that are not documented entry points for the user
711 should have names beginning with @samp{_}.  The @samp{_} should be
712 followed by the chosen name prefix for the library, to prevent
713 collisions with other libraries.  These can go in the same files with
714 user entry points if you like.
715
716 Static functions and variables can be used as you like and need not
717 fit any naming convention.
718
719 @node Errors
720 @section Formatting Error Messages
721 @cindex formatting error messages
722 @cindex error messages, formatting
723
724 Error messages from compilers should look like this:
725
726 @example
727 @var{source-file-name}:@var{lineno}: @var{message}
728 @end example
729
730 @noindent
731 If you want to mention the column number, use one of these formats:
732
733 @example
734 @var{source-file-name}:@var{lineno}:@var{column}: @var{message}
735 @var{source-file-name}:@var{lineno}.@var{column}: @var{message}   
736
737 @end example
738
739 @noindent
740 Line numbers should start from 1 at the beginning of the file, and
741 column numbers should start from 1 at the beginning of the line.  (Both
742 of these conventions are chosen for compatibility.)  Calculate column
743 numbers assuming that space and all ASCII printing characters have
744 equal width, and assuming tab stops every 8 columns.
745
746 The error message can also give both the starting and ending positions
747 of the erroneous text.  There are several formats so that you can
748 avoid redundant information such as a duplicate line number.
749 Here are the possible formats:
750
751 @example
752 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{lineno-2}.@var{column-2}: @var{message}
753 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{column-2}: @var{message}
754 @var{source-file-name}:@var{lineno-1}-@var{lineno-2}: @var{message}
755 @end example
756
757 @noindent
758 When an error is spread over several files, you can use this format:
759
760 @example
761 @var{file-1}:@var{lineno-1}.@var{column-1}-@var{file-2}:@var{lineno-2}.@var{column-2}: @var{message}
762 @end example
763
764 Error messages from other noninteractive programs should look like this:
765
766 @example
767 @var{program}:@var{source-file-name}:@var{lineno}: @var{message}
768 @end example
769
770 @noindent
771 when there is an appropriate source file, or like this:
772
773 @example
774 @var{program}: @var{message}
775 @end example
776
777 @noindent
778 when there is no relevant source file.
779
780 If you want to mention the column number, use this format:
781
782 @example
783 @var{program}:@var{source-file-name}:@var{lineno}:@var{column}: @var{message}
784 @end example
785
786 In an interactive program (one that is reading commands from a
787 terminal), it is better not to include the program name in an error
788 message.  The place to indicate which program is running is in the
789 prompt or with the screen layout.  (When the same program runs with
790 input from a source other than a terminal, it is not interactive and
791 would do best to print error messages using the noninteractive style.)
792
793 The string @var{message} should not begin with a capital letter when
794 it follows a program name and/or file name, because that isn't the
795 beginning of a sentence.  (The sentence conceptually starts at the
796 beginning of the line.)  Also, it should not end with a period.
797
798 Error messages from interactive programs, and other messages such as
799 usage messages, should start with a capital letter.  But they should not
800 end with a period.
801
802 @node User Interfaces
803 @section Standards for Interfaces Generally
804
805 @cindex program name and its behavior
806 @cindex behavior, dependent on program's name
807 Please don't make the behavior of a utility depend on the name used
808 to invoke it.  It is useful sometimes to make a link to a utility
809 with a different name, and that should not change what it does.
810
811 Instead, use a run time option or a compilation switch or both
812 to select among the alternate behaviors.
813
814 @cindex output device and program's behavior
815 Likewise, please don't make the behavior of the program depend on the
816 type of output device it is used with.  Device independence is an
817 important principle of the system's design; do not compromise it merely
818 to save someone from typing an option now and then.  (Variation in error
819 message syntax when using a terminal is ok, because that is a side issue
820 that people do not depend on.)
821
822 If you think one behavior is most useful when the output is to a
823 terminal, and another is most useful when the output is a file or a
824 pipe, then it is usually best to make the default behavior the one that
825 is useful with output to a terminal, and have an option for the other
826 behavior.
827
828 Compatibility requires certain programs to depend on the type of output
829 device.  It would be disastrous if @code{ls} or @code{sh} did not do so
830 in the way all users expect.  In some of these cases, we supplement the
831 program with a preferred alternate version that does not depend on the
832 output device type.  For example, we provide a @code{dir} program much
833 like @code{ls} except that its default output format is always
834 multi-column format.
835
836 @node Graphical Interfaces
837 @section Standards for Graphical Interfaces
838 @cindex graphical user interface
839
840 @cindex gtk+
841 When you write a program that provides a graphical user interface,
842 please make it work with X Windows and the GTK+ toolkit unless the
843 functionality specifically requires some alternative (for example,
844 ``displaying jpeg images while in console mode'').
845
846 In addition, please provide a command-line interface to control the
847 functionality.  (In many cases, the graphical user interface can be a
848 separate program which invokes the command-line program.)  This is
849 so that the same jobs can be done from scripts.
850
851 @cindex corba
852 @cindex gnome
853 Please also consider providing a CORBA interface (for use from GNOME), a
854 library interface (for use from C), and perhaps a keyboard-driven
855 console interface (for use by users from console mode).  Once you are
856 doing the work to provide the functionality and the graphical interface,
857 these won't be much extra work.
858
859 @node Command-Line Interfaces
860 @section Standards for Command Line Interfaces
861 @cindex command-line interface
862
863 @findex getopt
864 It is a good idea to follow the @sc{posix} guidelines for the
865 command-line options of a program.  The easiest way to do this is to use
866 @code{getopt} to parse them.  Note that the GNU version of @code{getopt}
867 will normally permit options anywhere among the arguments unless the
868 special argument @samp{--} is used.  This is not what @sc{posix}
869 specifies; it is a GNU extension.
870
871 @cindex long-named options
872 Please define long-named options that are equivalent to the
873 single-letter Unix-style options.  We hope to make GNU more user
874 friendly this way.  This is easy to do with the GNU function
875 @code{getopt_long}.
876
877 One of the advantages of long-named options is that they can be
878 consistent from program to program.  For example, users should be able
879 to expect the ``verbose'' option of any GNU program which has one, to be
880 spelled precisely @samp{--verbose}.  To achieve this uniformity, look at
881 the table of common long-option names when you choose the option names
882 for your program (@pxref{Option Table}).
883
884 It is usually a good idea for file names given as ordinary arguments to
885 be input files only; any output files would be specified using options
886 (preferably @samp{-o} or @samp{--output}).  Even if you allow an output
887 file name as an ordinary argument for compatibility, try to provide an
888 option as another way to specify it.  This will lead to more consistency
889 among GNU utilities, and fewer idiosyncracies for users to remember.
890
891 @cindex standard command-line options
892 @cindex options, standard command-line
893 @cindex CGI programs, standard options for
894 @cindex PATH_INFO, specifying standard options as
895 All programs should support two standard options: @samp{--version}
896 and @samp{--help}.  CGI programs should accept these as command-line
897 options, and also if given as the @env{PATH_INFO}; for instance,
898 visiting @url{http://example.org/p.cgi/--help} in a browser should
899 output the same information as invoking @samp{p.cgi --help} from the
900 command line.
901
902 @table @code
903 @cindex @samp{--version} option
904 @item --version
905 This option should direct the program to print information about its name,
906 version, origin and legal status, all on standard output, and then exit
907 successfully.  Other options and arguments should be ignored once this
908 is seen, and the program should not perform its normal function.
909
910 @cindex canonical name of a program
911 @cindex program's canonical name
912 The first line is meant to be easy for a program to parse; the version
913 number proper starts after the last space.  In addition, it contains
914 the canonical name for this program, in this format:
915
916 @example
917 GNU Emacs 19.30
918 @end example
919
920 @noindent
921 The program's name should be a constant string; @emph{don't} compute it
922 from @code{argv[0]}.  The idea is to state the standard or canonical
923 name for the program, not its file name.  There are other ways to find
924 out the precise file name where a command is found in @code{PATH}.
925
926 If the program is a subsidiary part of a larger package, mention the
927 package name in parentheses, like this:
928
929 @example
930 emacsserver (GNU Emacs) 19.30
931 @end example
932
933 @noindent
934 If the package has a version number which is different from this
935 program's version number, you can mention the package version number
936 just before the close-parenthesis.
937
938 If you @strong{need} to mention the version numbers of libraries which
939 are distributed separately from the package which contains this program,
940 you can do so by printing an additional line of version info for each
941 library you want to mention.  Use the same format for these lines as for
942 the first line.
943
944 Please do not mention all of the libraries that the program uses ``just
945 for completeness''---that would produce a lot of unhelpful clutter.
946 Please mention library version numbers only if you find in practice that
947 they are very important to you in debugging.
948
949 The following line, after the version number line or lines, should be a
950 copyright notice.  If more than one copyright notice is called for, put
951 each on a separate line.
952
953 Next should follow a brief statement that the program is free software,
954 and that users are free to copy and change it on certain conditions.  If
955 the program is covered by the GNU GPL, say so here.  Also mention that
956 there is no warranty, to the extent permitted by law.
957
958 It is ok to finish the output with a list of the major authors of the
959 program, as a way of giving credit.
960
961 Here's an example of output that follows these rules:
962
963 @smallexample
964 GNU Emacs 19.34.5
965 Copyright (C) 1996 Free Software Foundation, Inc.
966 GNU Emacs comes with NO WARRANTY,
967 to the extent permitted by law.
968 You may redistribute copies of GNU Emacs
969 under the terms of the GNU General Public License.
970 For more information about these matters,
971 see the files named COPYING.
972 @end smallexample
973
974 You should adapt this to your program, of course, filling in the proper
975 year, copyright holder, name of program, and the references to
976 distribution terms, and changing the rest of the wording as necessary.
977
978 This copyright notice only needs to mention the most recent year in
979 which changes were made---there's no need to list the years for previous
980 versions' changes.  You don't have to mention the name of the program in
981 these notices, if that is inconvenient, since it appeared in the first
982 line.
983
984 Translations of the above lines must preserve the validity of the
985 copyright notices (@pxref{Internationalization}).  If the translation's
986 character set supports it, the @samp{(C)} should be replaced with the
987 copyright symbol, as follows:
988
989 @ifinfo 
990 (the official copyright symbol, which is the letter C in a circle); 
991 @end ifinfo 
992 @ifnotinfo 
993 @copyright{}
994 @end ifnotinfo 
995
996 Write the word ``Copyright'' exactly like that, in English.  Do not
997 translate it into another language.  International treaties recognize
998 the English word ``Copyright''; translations into other languages do not
999 have legal significance.
1000
1001
1002 @cindex @samp{--help} option
1003 @item --help
1004 This option should output brief documentation for how to invoke the
1005 program, on standard output, then exit successfully.  Other options and
1006 arguments should be ignored once this is seen, and the program should
1007 not perform its normal function.
1008
1009 @cindex address for bug reports
1010 @cindex bug reports
1011 Near the end of the @samp{--help} option's output there should be a line
1012 that says where to mail bug reports.  It should have this format:
1013
1014 @example
1015 Report bugs to @var{mailing-address}.
1016 @end example
1017 @end table
1018
1019 @node Option Table
1020 @section Table of Long Options
1021 @cindex long option names
1022 @cindex table of long options
1023
1024 Here is a table of long options used by GNU programs.  It is surely
1025 incomplete, but we aim to list all the options that a new program might
1026 want to be compatible with.  If you use names not already in the table,
1027 please send @email{bug-standards@@gnu.org} a list of them, with their
1028 meanings, so we can update the table.
1029
1030 @c Please leave newlines between items in this table; it's much easier
1031 @c to update when it isn't completely squashed together and unreadable.
1032 @c When there is more than one short option for a long option name, put
1033 @c a semicolon between the lists of the programs that use them, not a
1034 @c period.   --friedman
1035
1036 @table @samp
1037 @item after-date
1038 @samp{-N} in @code{tar}.
1039
1040 @item all
1041 @samp{-a} in @code{du}, @code{ls}, @code{nm}, @code{stty}, @code{uname},
1042 and @code{unexpand}.
1043
1044 @item all-text
1045 @samp{-a} in @code{diff}.
1046
1047 @item almost-all
1048 @samp{-A} in @code{ls}.
1049
1050 @item append
1051 @samp{-a} in @code{etags}, @code{tee}, @code{time};
1052 @samp{-r} in @code{tar}.
1053
1054 @item archive
1055 @samp{-a} in @code{cp}.
1056
1057 @item archive-name
1058 @samp{-n} in @code{shar}.
1059
1060 @item arglength
1061 @samp{-l} in @code{m4}.
1062
1063 @item ascii
1064 @samp{-a} in @code{diff}.
1065
1066 @item assign
1067 @samp{-v} in @code{gawk}.
1068
1069 @item assume-new
1070 @samp{-W} in Make.
1071
1072 @item assume-old
1073 @samp{-o} in Make.
1074
1075 @item auto-check
1076 @samp{-a} in @code{recode}.
1077
1078 @item auto-pager
1079 @samp{-a} in @code{wdiff}.
1080
1081 @item auto-reference
1082 @samp{-A} in @code{ptx}.
1083
1084 @item avoid-wraps
1085 @samp{-n} in @code{wdiff}.
1086
1087 @item background
1088 For server programs, run in the background.
1089
1090 @item backward-search
1091 @samp{-B} in @code{ctags}.
1092
1093 @item basename
1094 @samp{-f} in @code{shar}.
1095
1096 @item batch
1097 Used in GDB.
1098
1099 @item baud
1100 Used in GDB.
1101
1102 @item before
1103 @samp{-b} in @code{tac}.
1104
1105 @item binary
1106 @samp{-b} in @code{cpio} and @code{diff}.
1107
1108 @item bits-per-code
1109 @samp{-b} in @code{shar}.
1110
1111 @item block-size
1112 Used in @code{cpio} and @code{tar}.
1113
1114 @item blocks
1115 @samp{-b} in @code{head} and @code{tail}.
1116
1117 @item break-file
1118 @samp{-b} in @code{ptx}.
1119
1120 @item brief
1121 Used in various programs to make output shorter.
1122
1123 @item bytes
1124 @samp{-c} in @code{head}, @code{split}, and @code{tail}.
1125
1126 @item c@t{++}
1127 @samp{-C} in @code{etags}.
1128
1129 @item catenate
1130 @samp{-A} in @code{tar}.
1131
1132 @item cd
1133 Used in various programs to specify the directory to use.
1134
1135 @item changes
1136 @samp{-c} in @code{chgrp} and @code{chown}.
1137
1138 @item classify
1139 @samp{-F} in @code{ls}.
1140
1141 @item colons
1142 @samp{-c} in @code{recode}.
1143
1144 @item command
1145 @samp{-c} in @code{su};
1146 @samp{-x} in GDB.
1147
1148 @item compare
1149 @samp{-d} in @code{tar}.
1150
1151 @item compat
1152 Used in @code{gawk}.
1153
1154 @item compress
1155 @samp{-Z} in @code{tar} and @code{shar}.
1156
1157 @item concatenate
1158 @samp{-A} in @code{tar}.
1159
1160 @item confirmation
1161 @samp{-w} in @code{tar}.
1162
1163 @item context
1164 Used in @code{diff}.
1165
1166 @item copyleft
1167 @samp{-W copyleft} in @code{gawk}.
1168
1169 @item copyright
1170 @samp{-C} in @code{ptx}, @code{recode}, and @code{wdiff};
1171 @samp{-W copyright} in @code{gawk}.
1172
1173 @item core
1174 Used in GDB.
1175
1176 @item count
1177 @samp{-q} in @code{who}.
1178
1179 @item count-links
1180 @samp{-l} in @code{du}.
1181
1182 @item create
1183 Used in @code{tar} and @code{cpio}.
1184
1185 @item cut-mark
1186 @samp{-c} in @code{shar}.
1187
1188 @item cxref
1189 @samp{-x} in @code{ctags}.
1190
1191 @item date
1192 @samp{-d} in @code{touch}.
1193
1194 @item debug
1195 @samp{-d} in Make and @code{m4};
1196 @samp{-t} in Bison.
1197
1198 @item define
1199 @samp{-D} in @code{m4}.
1200
1201 @item defines
1202 @samp{-d} in Bison and @code{ctags}.
1203
1204 @item delete
1205 @samp{-D} in @code{tar}.
1206
1207 @item dereference
1208 @samp{-L} in @code{chgrp}, @code{chown}, @code{cpio}, @code{du},
1209 @code{ls}, and @code{tar}.
1210
1211 @item dereference-args
1212 @samp{-D} in @code{du}.
1213
1214 @item device
1215 Specify an I/O device (special file name).
1216
1217 @item diacritics
1218 @samp{-d} in @code{recode}.
1219
1220 @item dictionary-order
1221 @samp{-d} in @code{look}.
1222
1223 @item diff
1224 @samp{-d} in @code{tar}.
1225
1226 @item digits
1227 @samp{-n} in @code{csplit}.
1228
1229 @item directory
1230 Specify the directory to use, in various programs.  In @code{ls}, it
1231 means to show directories themselves rather than their contents.  In
1232 @code{rm} and @code{ln}, it means to not treat links to directories
1233 specially.
1234
1235 @item discard-all
1236 @samp{-x} in @code{strip}.
1237
1238 @item discard-locals
1239 @samp{-X} in @code{strip}.
1240
1241 @item dry-run
1242 @samp{-n} in Make.
1243
1244 @item ed
1245 @samp{-e} in @code{diff}.
1246
1247 @item elide-empty-files
1248 @samp{-z} in @code{csplit}.
1249
1250 @item end-delete
1251 @samp{-x} in @code{wdiff}.
1252
1253 @item end-insert
1254 @samp{-z} in @code{wdiff}.
1255
1256 @item entire-new-file
1257 @samp{-N} in @code{diff}.
1258
1259 @item environment-overrides
1260 @samp{-e} in Make.
1261
1262 @item eof
1263 @samp{-e} in @code{xargs}.
1264
1265 @item epoch
1266 Used in GDB.
1267
1268 @item error-limit
1269 Used in @code{makeinfo}.
1270
1271 @item error-output
1272 @samp{-o} in @code{m4}.
1273
1274 @item escape
1275 @samp{-b} in @code{ls}.
1276
1277 @item exclude-from
1278 @samp{-X} in @code{tar}.
1279
1280 @item exec
1281 Used in GDB.
1282
1283 @item exit
1284 @samp{-x} in @code{xargs}.
1285
1286 @item exit-0
1287 @samp{-e} in @code{unshar}.
1288
1289 @item expand-tabs
1290 @samp{-t} in @code{diff}.
1291
1292 @item expression
1293 @samp{-e} in @code{sed}.
1294
1295 @item extern-only
1296 @samp{-g} in @code{nm}.
1297
1298 @item extract
1299 @samp{-i} in @code{cpio};
1300 @samp{-x} in @code{tar}.
1301
1302 @item faces
1303 @samp{-f} in @code{finger}.
1304
1305 @item fast
1306 @samp{-f} in @code{su}.
1307
1308 @item fatal-warnings
1309 @samp{-E} in @code{m4}.
1310
1311 @item file
1312 @samp{-f} in @code{info}, @code{gawk}, Make, @code{mt}, and @code{tar};
1313 @samp{-n} in @code{sed};
1314 @samp{-r} in @code{touch}.
1315
1316 @item field-separator
1317 @samp{-F} in @code{gawk}.
1318
1319 @item file-prefix
1320 @samp{-b} in Bison.
1321
1322 @item file-type
1323 @samp{-F} in @code{ls}.
1324
1325 @item files-from
1326 @samp{-T} in @code{tar}.
1327
1328 @item fill-column
1329 Used in @code{makeinfo}.
1330
1331 @item flag-truncation
1332 @samp{-F} in @code{ptx}.
1333
1334 @item fixed-output-files
1335 @samp{-y} in Bison.
1336
1337 @item follow
1338 @samp{-f} in @code{tail}.
1339
1340 @item footnote-style
1341 Used in @code{makeinfo}.
1342
1343 @item force
1344 @samp{-f} in @code{cp}, @code{ln}, @code{mv}, and @code{rm}.
1345
1346 @item force-prefix
1347 @samp{-F} in @code{shar}.
1348
1349 @item foreground
1350 For server programs, run in the foreground;
1351 in other words, don't do anything special to run the server
1352 in the background.
1353
1354 @item format
1355 Used in @code{ls}, @code{time}, and @code{ptx}.
1356
1357 @item freeze-state
1358 @samp{-F} in @code{m4}.
1359
1360 @item fullname
1361 Used in GDB.
1362
1363 @item gap-size
1364 @samp{-g} in @code{ptx}.
1365
1366 @item get
1367 @samp{-x} in @code{tar}.
1368
1369 @item graphic
1370 @samp{-i} in @code{ul}.
1371
1372 @item graphics
1373 @samp{-g} in @code{recode}.
1374
1375 @item group
1376 @samp{-g} in @code{install}.
1377
1378 @item gzip
1379 @samp{-z} in @code{tar} and @code{shar}.
1380
1381 @item hashsize
1382 @samp{-H} in @code{m4}.
1383
1384 @item header
1385 @samp{-h} in @code{objdump} and @code{recode}
1386
1387 @item heading
1388 @samp{-H} in @code{who}.
1389
1390 @item help
1391 Used to ask for brief usage information.
1392
1393 @item here-delimiter
1394 @samp{-d} in @code{shar}.
1395
1396 @item hide-control-chars
1397 @samp{-q} in @code{ls}.
1398
1399 @item html
1400 In @code{makeinfo}, output HTML.
1401
1402 @item idle
1403 @samp{-u} in @code{who}.
1404
1405 @item ifdef
1406 @samp{-D} in @code{diff}.
1407
1408 @item ignore
1409 @samp{-I} in @code{ls};
1410 @samp{-x} in @code{recode}.
1411
1412 @item ignore-all-space
1413 @samp{-w} in @code{diff}.
1414
1415 @item ignore-backups
1416 @samp{-B} in @code{ls}.
1417
1418 @item ignore-blank-lines
1419 @samp{-B} in @code{diff}.
1420
1421 @item ignore-case
1422 @samp{-f} in @code{look} and @code{ptx};
1423 @samp{-i} in @code{diff} and @code{wdiff}.
1424
1425 @item ignore-errors
1426 @samp{-i} in Make.
1427
1428 @item ignore-file
1429 @samp{-i} in @code{ptx}.
1430
1431 @item ignore-indentation
1432 @samp{-I} in @code{etags}.
1433
1434 @item ignore-init-file
1435 @samp{-f} in Oleo.
1436
1437 @item ignore-interrupts
1438 @samp{-i} in @code{tee}.
1439
1440 @item ignore-matching-lines
1441 @samp{-I} in @code{diff}.
1442
1443 @item ignore-space-change
1444 @samp{-b} in @code{diff}.
1445
1446 @item ignore-zeros
1447 @samp{-i} in @code{tar}.
1448
1449 @item include
1450 @samp{-i} in @code{etags};
1451 @samp{-I} in @code{m4}.
1452
1453 @item include-dir
1454 @samp{-I} in Make.
1455
1456 @item incremental
1457 @samp{-G} in @code{tar}.
1458
1459 @item info
1460 @samp{-i}, @samp{-l}, and @samp{-m} in Finger.
1461
1462 @item init-file
1463 In some programs, specify the name of the file to read as the user's
1464 init file.
1465
1466 @item initial
1467 @samp{-i} in @code{expand}.
1468
1469 @item initial-tab
1470 @samp{-T} in @code{diff}.
1471
1472 @item inode
1473 @samp{-i} in @code{ls}.
1474
1475 @item interactive
1476 @samp{-i} in @code{cp}, @code{ln}, @code{mv}, @code{rm};
1477 @samp{-e} in @code{m4};
1478 @samp{-p} in @code{xargs};
1479 @samp{-w} in @code{tar}.
1480
1481 @item intermix-type
1482 @samp{-p} in @code{shar}.
1483
1484 @item iso-8601
1485 Used in @code{date}
1486
1487 @item jobs
1488 @samp{-j} in Make.
1489
1490 @item just-print
1491 @samp{-n} in Make.
1492
1493 @item keep-going
1494 @samp{-k} in Make.
1495
1496 @item keep-files
1497 @samp{-k} in @code{csplit}.
1498
1499 @item kilobytes
1500 @samp{-k} in @code{du} and @code{ls}.
1501
1502 @item language
1503 @samp{-l} in @code{etags}.
1504
1505 @item less-mode
1506 @samp{-l} in @code{wdiff}.
1507
1508 @item level-for-gzip
1509 @samp{-g} in @code{shar}.
1510
1511 @item line-bytes
1512 @samp{-C} in @code{split}.
1513
1514 @item lines
1515 Used in @code{split}, @code{head}, and @code{tail}.
1516
1517 @item link
1518 @samp{-l} in @code{cpio}.
1519
1520 @item lint
1521 @itemx lint-old
1522 Used in @code{gawk}.
1523
1524 @item list
1525 @samp{-t} in @code{cpio};
1526 @samp{-l} in @code{recode}.
1527
1528 @item list
1529 @samp{-t} in @code{tar}.
1530
1531 @item literal
1532 @samp{-N} in @code{ls}.
1533
1534 @item load-average
1535 @samp{-l} in Make.
1536
1537 @item login
1538 Used in @code{su}.
1539
1540 @item machine
1541 Used in @code{uname}.
1542
1543 @item macro-name
1544 @samp{-M} in @code{ptx}.
1545
1546 @item mail
1547 @samp{-m} in @code{hello} and @code{uname}.
1548
1549 @item make-directories
1550 @samp{-d} in @code{cpio}.
1551
1552 @item makefile
1553 @samp{-f} in Make.
1554
1555 @item mapped
1556 Used in GDB.
1557
1558 @item max-args
1559 @samp{-n} in @code{xargs}.
1560
1561 @item max-chars
1562 @samp{-n} in @code{xargs}.
1563
1564 @item max-lines
1565 @samp{-l} in @code{xargs}.
1566
1567 @item max-load
1568 @samp{-l} in Make.
1569
1570 @item max-procs
1571 @samp{-P} in @code{xargs}.
1572
1573 @item mesg
1574 @samp{-T} in @code{who}.
1575
1576 @item message
1577 @samp{-T} in @code{who}.
1578
1579 @item minimal
1580 @samp{-d} in @code{diff}.
1581
1582 @item mixed-uuencode
1583 @samp{-M} in @code{shar}.
1584
1585 @item mode
1586 @samp{-m} in @code{install}, @code{mkdir}, and @code{mkfifo}.
1587
1588 @item modification-time
1589 @samp{-m} in @code{tar}.
1590
1591 @item multi-volume
1592 @samp{-M} in @code{tar}.
1593
1594 @item name-prefix
1595 @samp{-a} in Bison.
1596
1597 @item nesting-limit
1598 @samp{-L} in @code{m4}.
1599
1600 @item net-headers
1601 @samp{-a} in @code{shar}.
1602
1603 @item new-file
1604 @samp{-W} in Make.
1605
1606 @item no-builtin-rules
1607 @samp{-r} in Make.
1608
1609 @item no-character-count
1610 @samp{-w} in @code{shar}.
1611
1612 @item no-check-existing
1613 @samp{-x} in @code{shar}.
1614
1615 @item no-common
1616 @samp{-3} in @code{wdiff}.
1617
1618 @item no-create
1619 @samp{-c} in @code{touch}.
1620
1621 @item no-defines
1622 @samp{-D} in @code{etags}.
1623
1624 @item no-deleted
1625 @samp{-1} in @code{wdiff}.
1626
1627 @item no-dereference
1628 @samp{-d} in @code{cp}.
1629
1630 @item no-inserted
1631 @samp{-2} in @code{wdiff}.
1632
1633 @item no-keep-going
1634 @samp{-S} in Make.
1635
1636 @item no-lines
1637 @samp{-l} in Bison.
1638
1639 @item no-piping
1640 @samp{-P} in @code{shar}.
1641
1642 @item no-prof
1643 @samp{-e} in @code{gprof}.
1644
1645 @item no-regex
1646 @samp{-R} in @code{etags}.
1647
1648 @item no-sort
1649 @samp{-p} in @code{nm}.
1650
1651 @item no-splash
1652 Don't print a startup splash screen.
1653
1654 @item no-split
1655 Used in @code{makeinfo}.
1656
1657 @item no-static
1658 @samp{-a} in @code{gprof}.
1659
1660 @item no-time
1661 @samp{-E} in @code{gprof}.
1662
1663 @item no-timestamp
1664 @samp{-m} in @code{shar}.
1665
1666 @item no-validate
1667 Used in @code{makeinfo}.
1668
1669 @item no-wait
1670 Used in @code{emacsclient}.
1671
1672 @item no-warn
1673 Used in various programs to inhibit warnings.
1674
1675 @item node
1676 @samp{-n} in @code{info}.
1677
1678 @item nodename
1679 @samp{-n} in @code{uname}.
1680
1681 @item nonmatching
1682 @samp{-f} in @code{cpio}.
1683
1684 @item nstuff
1685 @samp{-n} in @code{objdump}.
1686
1687 @item null
1688 @samp{-0} in @code{xargs}.
1689
1690 @item number
1691 @samp{-n} in @code{cat}.
1692
1693 @item number-nonblank
1694 @samp{-b} in @code{cat}.
1695
1696 @item numeric-sort
1697 @samp{-n} in @code{nm}.
1698
1699 @item numeric-uid-gid
1700 @samp{-n} in @code{cpio} and @code{ls}.
1701
1702 @item nx
1703 Used in GDB.
1704
1705 @item old-archive
1706 @samp{-o} in @code{tar}.
1707
1708 @item old-file
1709 @samp{-o} in Make.
1710
1711 @item one-file-system
1712 @samp{-l} in @code{tar}, @code{cp}, and @code{du}.
1713
1714 @item only-file
1715 @samp{-o} in @code{ptx}.
1716
1717 @item only-prof
1718 @samp{-f} in @code{gprof}.
1719
1720 @item only-time
1721 @samp{-F} in @code{gprof}.
1722
1723 @item options
1724 @samp{-o} in @code{getopt}, @code{fdlist}, @code{fdmount},
1725 @code{fdmountd}, and @code{fdumount}.
1726
1727 @item output
1728 In various programs, specify the output file name.
1729
1730 @item output-prefix
1731 @samp{-o} in @code{shar}.
1732
1733 @item override
1734 @samp{-o} in @code{rm}.
1735
1736 @item overwrite
1737 @samp{-c} in @code{unshar}.
1738
1739 @item owner
1740 @samp{-o} in @code{install}.
1741
1742 @item paginate
1743 @samp{-l} in @code{diff}.
1744
1745 @item paragraph-indent
1746 Used in @code{makeinfo}.
1747
1748 @item parents
1749 @samp{-p} in @code{mkdir} and @code{rmdir}.
1750
1751 @item pass-all
1752 @samp{-p} in @code{ul}.
1753
1754 @item pass-through
1755 @samp{-p} in @code{cpio}.
1756
1757 @item port
1758 @samp{-P} in @code{finger}.
1759
1760 @item portability
1761 @samp{-c} in @code{cpio} and @code{tar}.
1762
1763 @item posix
1764 Used in @code{gawk}.
1765
1766 @item prefix-builtins
1767 @samp{-P} in @code{m4}.
1768
1769 @item prefix
1770 @samp{-f} in @code{csplit}.
1771
1772 @item preserve
1773 Used in @code{tar} and @code{cp}.
1774
1775 @item preserve-environment
1776 @samp{-p} in @code{su}.
1777
1778 @item preserve-modification-time
1779 @samp{-m} in @code{cpio}.
1780
1781 @item preserve-order
1782 @samp{-s} in @code{tar}.
1783
1784 @item preserve-permissions
1785 @samp{-p} in @code{tar}.
1786
1787 @item print
1788 @samp{-l} in @code{diff}.
1789
1790 @item print-chars
1791 @samp{-L} in @code{cmp}.
1792
1793 @item print-data-base
1794 @samp{-p} in Make.
1795
1796 @item print-directory
1797 @samp{-w} in Make.
1798
1799 @item print-file-name
1800 @samp{-o} in @code{nm}.
1801
1802 @item print-symdefs
1803 @samp{-s} in @code{nm}.
1804
1805 @item printer
1806 @samp{-p} in @code{wdiff}.
1807
1808 @item prompt
1809 @samp{-p} in @code{ed}.
1810
1811 @item proxy
1812 Specify an HTTP proxy.
1813
1814 @item query-user
1815 @samp{-X} in @code{shar}.
1816
1817 @item question
1818 @samp{-q} in Make.
1819
1820 @item quiet
1821 Used in many programs to inhibit the usual output.  Every
1822 program accepting @samp{--quiet} should accept @samp{--silent} as a
1823 synonym.
1824
1825 @item quiet-unshar
1826 @samp{-Q} in @code{shar}
1827
1828 @item quote-name
1829 @samp{-Q} in @code{ls}.
1830
1831 @item rcs
1832 @samp{-n} in @code{diff}.
1833
1834 @item re-interval
1835 Used in @code{gawk}.
1836
1837 @item read-full-blocks
1838 @samp{-B} in @code{tar}.
1839
1840 @item readnow
1841 Used in GDB.
1842
1843 @item recon
1844 @samp{-n} in Make.
1845
1846 @item record-number
1847 @samp{-R} in @code{tar}.
1848
1849 @item recursive
1850 Used in @code{chgrp}, @code{chown}, @code{cp}, @code{ls}, @code{diff},
1851 and @code{rm}.
1852
1853 @item reference-limit
1854 Used in @code{makeinfo}.
1855
1856 @item references
1857 @samp{-r} in @code{ptx}.
1858
1859 @item regex
1860 @samp{-r} in @code{tac} and @code{etags}.
1861
1862 @item release
1863 @samp{-r} in @code{uname}.
1864
1865 @item reload-state
1866 @samp{-R} in @code{m4}.
1867
1868 @item relocation
1869 @samp{-r} in @code{objdump}.
1870
1871 @item rename
1872 @samp{-r} in @code{cpio}.
1873
1874 @item replace
1875 @samp{-i} in @code{xargs}.
1876
1877 @item report-identical-files
1878 @samp{-s} in @code{diff}.
1879
1880 @item reset-access-time
1881 @samp{-a} in @code{cpio}.
1882
1883 @item reverse
1884 @samp{-r} in @code{ls} and @code{nm}.
1885
1886 @item reversed-ed
1887 @samp{-f} in @code{diff}.
1888
1889 @item right-side-defs
1890 @samp{-R} in @code{ptx}.
1891
1892 @item same-order
1893 @samp{-s} in @code{tar}.
1894
1895 @item same-permissions
1896 @samp{-p} in @code{tar}.
1897
1898 @item save
1899 @samp{-g} in @code{stty}.
1900
1901 @item se
1902 Used in GDB.
1903
1904 @item sentence-regexp
1905 @samp{-S} in @code{ptx}.
1906
1907 @item separate-dirs
1908 @samp{-S} in @code{du}.
1909
1910 @item separator
1911 @samp{-s} in @code{tac}.
1912
1913 @item sequence
1914 Used by @code{recode} to chose files or pipes for sequencing passes.
1915
1916 @item shell
1917 @samp{-s} in @code{su}.
1918
1919 @item show-all
1920 @samp{-A} in @code{cat}.
1921
1922 @item show-c-function
1923 @samp{-p} in @code{diff}.
1924
1925 @item show-ends
1926 @samp{-E} in @code{cat}.
1927
1928 @item show-function-line
1929 @samp{-F} in @code{diff}.
1930
1931 @item show-tabs
1932 @samp{-T} in @code{cat}.
1933
1934 @item silent
1935 Used in many programs to inhibit the usual output.
1936 Every program accepting
1937 @samp{--silent} should accept @samp{--quiet} as a synonym.
1938
1939 @item size
1940 @samp{-s} in @code{ls}.
1941
1942 @item socket
1943 Specify a file descriptor for a network server to use for its socket,
1944 instead of opening and binding a new socket.  This provides a way to
1945 run, in a nonpriveledged process, a server that normally needs a
1946 reserved port number.
1947
1948 @item sort
1949 Used in @code{ls}.
1950
1951 @item source
1952 @samp{-W source} in @code{gawk}.
1953
1954 @item sparse
1955 @samp{-S} in @code{tar}.
1956
1957 @item speed-large-files
1958 @samp{-H} in @code{diff}.
1959
1960 @item split-at
1961 @samp{-E} in @code{unshar}.
1962
1963 @item split-size-limit
1964 @samp{-L} in @code{shar}.
1965
1966 @item squeeze-blank
1967 @samp{-s} in @code{cat}.
1968
1969 @item start-delete
1970 @samp{-w} in @code{wdiff}.
1971
1972 @item start-insert
1973 @samp{-y} in @code{wdiff}.
1974
1975 @item starting-file
1976 Used in @code{tar} and @code{diff} to specify which file within
1977 a directory to start processing with.
1978
1979 @item statistics
1980 @samp{-s} in @code{wdiff}.
1981
1982 @item stdin-file-list
1983 @samp{-S} in @code{shar}.
1984
1985 @item stop
1986 @samp{-S} in Make.
1987
1988 @item strict
1989 @samp{-s} in @code{recode}.
1990
1991 @item strip
1992 @samp{-s} in @code{install}.
1993
1994 @item strip-all
1995 @samp{-s} in @code{strip}.
1996
1997 @item strip-debug
1998 @samp{-S} in @code{strip}.
1999
2000 @item submitter
2001 @samp{-s} in @code{shar}.
2002
2003 @item suffix
2004 @samp{-S} in @code{cp}, @code{ln}, @code{mv}.
2005
2006 @item suffix-format
2007 @samp{-b} in @code{csplit}.
2008
2009 @item sum
2010 @samp{-s} in @code{gprof}.
2011
2012 @item summarize
2013 @samp{-s} in @code{du}.
2014
2015 @item symbolic
2016 @samp{-s} in @code{ln}.
2017
2018 @item symbols
2019 Used in GDB and @code{objdump}.
2020
2021 @item synclines
2022 @samp{-s} in @code{m4}.
2023
2024 @item sysname
2025 @samp{-s} in @code{uname}.
2026
2027 @item tabs
2028 @samp{-t} in @code{expand} and @code{unexpand}.
2029
2030 @item tabsize
2031 @samp{-T} in @code{ls}.
2032
2033 @item terminal
2034 @samp{-T} in @code{tput} and @code{ul}.
2035 @samp{-t} in @code{wdiff}.
2036
2037 @item text
2038 @samp{-a} in @code{diff}.
2039
2040 @item text-files
2041 @samp{-T} in @code{shar}.
2042
2043 @item time
2044 Used in @code{ls} and @code{touch}.
2045
2046 @item timeout
2047 Specify how long to wait before giving up on some operation.
2048
2049 @item to-stdout
2050 @samp{-O} in @code{tar}.
2051
2052 @item total
2053 @samp{-c} in @code{du}.
2054
2055 @item touch
2056 @samp{-t} in Make, @code{ranlib}, and @code{recode}.
2057
2058 @item trace
2059 @samp{-t} in @code{m4}.
2060
2061 @item traditional
2062 @samp{-t} in @code{hello};
2063 @samp{-W traditional} in @code{gawk};
2064 @samp{-G} in @code{ed}, @code{m4}, and @code{ptx}.
2065
2066 @item tty
2067 Used in GDB.
2068
2069 @item typedefs
2070 @samp{-t} in @code{ctags}.
2071
2072 @item typedefs-and-c++
2073 @samp{-T} in @code{ctags}.
2074
2075 @item typeset-mode
2076 @samp{-t} in @code{ptx}.
2077
2078 @item uncompress
2079 @samp{-z} in @code{tar}.
2080
2081 @item unconditional
2082 @samp{-u} in @code{cpio}.
2083
2084 @item undefine
2085 @samp{-U} in @code{m4}.
2086
2087 @item undefined-only
2088 @samp{-u} in @code{nm}.
2089
2090 @item update
2091 @samp{-u} in @code{cp}, @code{ctags}, @code{mv}, @code{tar}.
2092
2093 @item usage
2094 Used in @code{gawk}; same as @samp{--help}.
2095
2096 @item uuencode
2097 @samp{-B} in @code{shar}.
2098
2099 @item vanilla-operation
2100 @samp{-V} in @code{shar}.
2101
2102 @item verbose
2103 Print more information about progress.  Many programs support this.
2104
2105 @item verify
2106 @samp{-W} in @code{tar}.
2107
2108 @item version
2109 Print the version number.
2110
2111 @item version-control
2112 @samp{-V} in @code{cp}, @code{ln}, @code{mv}.
2113
2114 @item vgrind
2115 @samp{-v} in @code{ctags}.
2116
2117 @item volume
2118 @samp{-V} in @code{tar}.
2119
2120 @item what-if
2121 @samp{-W} in Make.
2122
2123 @item whole-size-limit
2124 @samp{-l} in @code{shar}.
2125
2126 @item width
2127 @samp{-w} in @code{ls} and @code{ptx}.
2128
2129 @item word-regexp
2130 @samp{-W} in @code{ptx}.
2131
2132 @item writable
2133 @samp{-T} in @code{who}.
2134
2135 @item zeros
2136 @samp{-z} in @code{gprof}.
2137 @end table
2138
2139 @node Memory Usage
2140 @section Memory Usage
2141 @cindex memory usage
2142
2143 If a program typically uses just a few meg of memory, don't bother making any
2144 effort to reduce memory usage.  For example, if it is impractical for
2145 other reasons to operate on files more than a few meg long, it is
2146 reasonable to read entire input files into core to operate on them.
2147
2148 However, for programs such as @code{cat} or @code{tail}, that can
2149 usefully operate on very large files, it is important to avoid using a
2150 technique that would artificially limit the size of files it can handle.
2151 If a program works by lines and could be applied to arbitrary
2152 user-supplied input files, it should keep only a line in memory, because
2153 this is not very hard and users will want to be able to operate on input
2154 files that are bigger than will fit in core all at once.
2155
2156 If your program creates complicated data structures, just make them in
2157 core and give a fatal error if @code{malloc} returns zero.
2158
2159 @node File Usage
2160 @section File Usage
2161 @cindex file usage
2162
2163 Programs should be prepared to operate when @file{/usr} and @file{/etc}
2164 are read-only file systems.  Thus, if the program manages log files,
2165 lock files, backup files, score files, or any other files which are
2166 modified for internal purposes, these files should not be stored in
2167 @file{/usr} or @file{/etc}.
2168
2169 There are two exceptions.  @file{/etc} is used to store system
2170 configuration information; it is reasonable for a program to modify
2171 files in @file{/etc} when its job is to update the system configuration.
2172 Also, if the user explicitly asks to modify one file in a directory, it
2173 is reasonable for the program to store other files in the same
2174 directory.
2175
2176 @node Writing C
2177 @chapter Making The Best Use of C
2178
2179 This chapter provides advice on how best to use the C language
2180 when writing GNU software.
2181
2182 @menu
2183 * Formatting::                  Formatting Your Source Code
2184 * Comments::                    Commenting Your Work
2185 * Syntactic Conventions::       Clean Use of C Constructs
2186 * Names::                       Naming Variables, Functions, and Files
2187 * System Portability::          Portability between different operating systems
2188 * CPU Portability::             Supporting the range of CPU types
2189 * System Functions::            Portability and ``standard'' library functions
2190 * Internationalization::        Techniques for internationalization
2191 * Character Set::               Use ASCII by default.
2192 * Quote Characters::            Use `...' in the C locale.
2193 * Mmap::                        How you can safely use @code{mmap}.
2194 @end menu
2195
2196 @node Formatting
2197 @section Formatting Your Source Code
2198 @cindex formatting source code
2199
2200 @cindex open brace
2201 @cindex braces, in C source
2202 It is important to put the open-brace that starts the body of a C
2203 function in column one, and avoid putting any other open-brace or
2204 open-parenthesis or open-bracket in column one.  Several tools look
2205 for open-braces in column one to find the beginnings of C functions.
2206 These tools will not work on code not formatted that way.
2207
2208 It is also important for function definitions to start the name of the
2209 function in column one.  This helps people to search for function
2210 definitions, and may also help certain tools recognize them.  Thus,
2211 using Standard C syntax, the format is this:
2212
2213 @example
2214 static char *
2215 concat (char *s1, char *s2)
2216 @{
2217   @dots{}
2218 @}
2219 @end example
2220
2221 @noindent
2222 or, if you want to use Standard C syntax, format the definition like
2223 this:
2224
2225 @example
2226 static char *
2227 concat (s1, s2)        /* Name starts in column one here */
2228      char *s1, *s2;
2229 @{                     /* Open brace in column one here */
2230   @dots{}
2231 @}
2232 @end example
2233
2234 In Standard C, if the arguments don't fit nicely on one line,
2235 split it like this:
2236
2237 @example
2238 int
2239 lots_of_args (int an_integer, long a_long, short a_short,
2240               double a_double, float a_float)
2241 @dots{}
2242 @end example
2243
2244 The rest of this section gives our recommendations for other aspects of
2245 C formatting style, which is also the default style of the @code{indent}
2246 program in version 1.2 and newer.  It corresponds to the options
2247
2248 @smallexample
2249 -nbad -bap -nbc -bbo -bl -bli2 -bls -ncdb -nce -cp1 -cs -di2
2250 -ndj -nfc1 -nfca -hnl -i2 -ip5 -lp -pcs -psl -nsc -nsob
2251 @end smallexample
2252
2253 We don't think of these recommendations as requirements, because it
2254 causes no problems for users if two different programs have different
2255 formatting styles.
2256
2257 But whatever style you use, please use it consistently, since a mixture
2258 of styles within one program tends to look ugly.  If you are
2259 contributing changes to an existing program, please follow the style of
2260 that program.
2261
2262 For the body of the function, our recommended style looks like this:
2263
2264 @example
2265 if (x < foo (y, z))
2266   haha = bar[4] + 5;
2267 else
2268   @{
2269     while (z)
2270       @{
2271         haha += foo (z, z);
2272         z--;
2273       @}
2274     return ++x + bar ();
2275   @}
2276 @end example
2277
2278 @cindex spaces before open-paren
2279 We find it easier to read a program when it has spaces before the
2280 open-parentheses and after the commas.  Especially after the commas.
2281
2282 When you split an expression into multiple lines, split it
2283 before an operator, not after one.  Here is the right way:
2284
2285 @cindex expressions, splitting
2286 @example
2287 if (foo_this_is_long && bar > win (x, y, z)
2288     && remaining_condition)
2289 @end example
2290
2291 Try to avoid having two operators of different precedence at the same
2292 level of indentation.  For example, don't write this:
2293
2294 @example
2295 mode = (inmode[j] == VOIDmode
2296         || GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])
2297         ? outmode[j] : inmode[j]);
2298 @end example
2299
2300 Instead, use extra parentheses so that the indentation shows the nesting:
2301
2302 @example
2303 mode = ((inmode[j] == VOIDmode
2304          || (GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])))
2305         ? outmode[j] : inmode[j]);
2306 @end example
2307
2308 Insert extra parentheses so that Emacs will indent the code properly.
2309 For example, the following indentation looks nice if you do it by hand,
2310
2311 @example
2312 v = rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2313     + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000;
2314 @end example
2315
2316 @noindent
2317 but Emacs would alter it.  Adding a set of parentheses produces
2318 something that looks equally nice, and which Emacs will preserve:
2319
2320 @example
2321 v = (rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2322      + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000);
2323 @end example
2324
2325 Format do-while statements like this:
2326
2327 @example
2328 do
2329   @{
2330     a = foo (a);
2331   @}
2332 while (a > 0);
2333 @end example
2334
2335 @cindex formfeed
2336 @cindex control-L
2337 Please use formfeed characters (control-L) to divide the program into
2338 pages at logical places (but not within a function).  It does not matter
2339 just how long the pages are, since they do not have to fit on a printed
2340 page.  The formfeeds should appear alone on lines by themselves.
2341
2342 @node Comments
2343 @section Commenting Your Work
2344 @cindex commenting
2345
2346 Every program should start with a comment saying briefly what it is for.
2347 Example: @samp{fmt - filter for simple filling of text}.  This comment
2348 should be at the top of the source file containing the @samp{main}
2349 function of the program.
2350
2351 Also, please write a brief comment at the start of each source file,
2352 with the file name and a line or two about the overall purpose of the
2353 file.
2354
2355 Please write the comments in a GNU program in English, because English
2356 is the one language that nearly all programmers in all countries can
2357 read.  If you do not write English well, please write comments in
2358 English as well as you can, then ask other people to help rewrite them.
2359 If you can't write comments in English, please find someone to work with
2360 you and translate your comments into English.
2361
2362 Please put a comment on each function saying what the function does,
2363 what sorts of arguments it gets, and what the possible values of
2364 arguments mean and are used for.  It is not necessary to duplicate in
2365 words the meaning of the C argument declarations, if a C type is being
2366 used in its customary fashion.  If there is anything nonstandard about
2367 its use (such as an argument of type @code{char *} which is really the
2368 address of the second character of a string, not the first), or any
2369 possible values that would not work the way one would expect (such as,
2370 that strings containing newlines are not guaranteed to work), be sure
2371 to say so.
2372
2373 Also explain the significance of the return value, if there is one.
2374
2375 Please put two spaces after the end of a sentence in your comments, so
2376 that the Emacs sentence commands will work.  Also, please write
2377 complete sentences and capitalize the first word.  If a lower-case
2378 identifier comes at the beginning of a sentence, don't capitalize it!
2379 Changing the spelling makes it a different identifier.  If you don't
2380 like starting a sentence with a lower case letter, write the sentence
2381 differently (e.g., ``The identifier lower-case is @dots{}'').
2382
2383 The comment on a function is much clearer if you use the argument
2384 names to speak about the argument values.  The variable name itself
2385 should be lower case, but write it in upper case when you are speaking
2386 about the value rather than the variable itself.  Thus, ``the inode
2387 number NODE_NUM'' rather than ``an inode''.
2388
2389 There is usually no purpose in restating the name of the function in
2390 the comment before it, because the reader can see that for himself.
2391 There might be an exception when the comment is so long that the function
2392 itself would be off the bottom of the screen.
2393
2394 There should be a comment on each static variable as well, like this:
2395
2396 @example
2397 /* Nonzero means truncate lines in the display;
2398    zero means continue them.  */
2399 int truncate_lines;
2400 @end example
2401
2402 @cindex conditionals, comments for
2403 @cindex @code{#endif}, commenting
2404 Every @samp{#endif} should have a comment, except in the case of short
2405 conditionals (just a few lines) that are not nested.  The comment should
2406 state the condition of the conditional that is ending, @emph{including
2407 its sense}.  @samp{#else} should have a comment describing the condition
2408 @emph{and sense} of the code that follows.  For example:
2409
2410 @example
2411 @group
2412 #ifdef foo
2413   @dots{}
2414 #else /* not foo */
2415   @dots{}
2416 #endif /* not foo */
2417 @end group
2418 @group
2419 #ifdef foo
2420   @dots{}
2421 #endif /* foo */
2422 @end group
2423 @end example
2424
2425 @noindent
2426 but, by contrast, write the comments this way for a @samp{#ifndef}:
2427
2428 @example
2429 @group
2430 #ifndef foo
2431   @dots{}
2432 #else /* foo */
2433   @dots{}
2434 #endif /* foo */
2435 @end group
2436 @group
2437 #ifndef foo
2438   @dots{}
2439 #endif /* not foo */
2440 @end group
2441 @end example
2442
2443 @node Syntactic Conventions
2444 @section Clean Use of C Constructs
2445 @cindex syntactic conventions
2446
2447 @cindex implicit @code{int}
2448 @cindex function argument, declaring
2449 Please explicitly declare the types of all objects.  For example, you
2450 should explicitly declare all arguments to functions, and you should
2451 declare functions to return @code{int} rather than omitting the
2452 @code{int}.
2453
2454 @cindex compiler warnings
2455 @cindex @samp{-Wall} compiler option
2456 Some programmers like to use the GCC @samp{-Wall} option, and change the
2457 code whenever it issues a warning.  If you want to do this, then do.
2458 Other programmers prefer not to use @samp{-Wall}, because it gives
2459 warnings for valid and legitimate code which they do not want to change.
2460 If you want to do this, then do.  The compiler should be your servant,
2461 not your master.
2462
2463 Declarations of external functions and functions to appear later in the
2464 source file should all go in one place near the beginning of the file
2465 (somewhere before the first function definition in the file), or else
2466 should go in a header file.  Don't put @code{extern} declarations inside
2467 functions.
2468
2469 @cindex temporary variables
2470 It used to be common practice to use the same local variables (with
2471 names like @code{tem}) over and over for different values within one
2472 function.  Instead of doing this, it is better to declare a separate local
2473 variable for each distinct purpose, and give it a name which is
2474 meaningful.  This not only makes programs easier to understand, it also
2475 facilitates optimization by good compilers.  You can also move the
2476 declaration of each local variable into the smallest scope that includes
2477 all its uses.  This makes the program even cleaner.
2478
2479 Don't use local variables or parameters that shadow global identifiers.
2480
2481 @cindex multiple variables in a line
2482 Don't declare multiple variables in one declaration that spans lines.
2483 Start a new declaration on each line, instead.  For example, instead
2484 of this:
2485
2486 @example
2487 @group
2488 int    foo,
2489        bar;
2490 @end group
2491 @end example
2492
2493 @noindent
2494 write either this:
2495
2496 @example
2497 int foo, bar;
2498 @end example
2499
2500 @noindent
2501 or this:
2502
2503 @example
2504 int foo;
2505 int bar;
2506 @end example
2507
2508 @noindent
2509 (If they are global variables, each should have a comment preceding it
2510 anyway.)
2511
2512 When you have an @code{if}-@code{else} statement nested in another
2513 @code{if} statement, always put braces around the @code{if}-@code{else}.
2514 Thus, never write like this:
2515
2516 @example
2517 if (foo)
2518   if (bar)
2519     win ();
2520   else
2521     lose ();
2522 @end example
2523
2524 @noindent
2525 always like this:
2526
2527 @example
2528 if (foo)
2529   @{
2530     if (bar)
2531       win ();
2532     else
2533       lose ();
2534   @}
2535 @end example
2536
2537 If you have an @code{if} statement nested inside of an @code{else}
2538 statement, either write @code{else if} on one line, like this,
2539
2540 @example
2541 if (foo)
2542   @dots{}
2543 else if (bar)
2544   @dots{}
2545 @end example
2546
2547 @noindent
2548 with its @code{then}-part indented like the preceding @code{then}-part,
2549 or write the nested @code{if} within braces like this:
2550
2551 @example
2552 if (foo)
2553   @dots{}
2554 else
2555   @{
2556     if (bar)
2557       @dots{}
2558   @}
2559 @end example
2560
2561 Don't declare both a structure tag and variables or typedefs in the
2562 same declaration.  Instead, declare the structure tag separately
2563 and then use it to declare the variables or typedefs.
2564
2565 Try to avoid assignments inside @code{if}-conditions.  For example,
2566 don't write this:
2567
2568 @example
2569 if ((foo = (char *) malloc (sizeof *foo)) == 0)
2570   fatal ("virtual memory exhausted");
2571 @end example
2572
2573 @noindent
2574 instead, write this:
2575
2576 @example
2577 foo = (char *) malloc (sizeof *foo);
2578 if (foo == 0)
2579   fatal ("virtual memory exhausted");
2580 @end example
2581
2582 @pindex lint
2583 Don't make the program ugly to placate @code{lint}.  Please don't insert any
2584 casts to @code{void}.  Zero without a cast is perfectly fine as a null
2585 pointer constant, except when calling a varargs function.
2586
2587 @node Names
2588 @section Naming Variables, Functions, and Files
2589
2590 @cindex names of variables, functions, and files
2591 The names of global variables and functions in a program serve as
2592 comments of a sort.  So don't choose terse names---instead, look for
2593 names that give useful information about the meaning of the variable or
2594 function.  In a GNU program, names should be English, like other
2595 comments.
2596
2597 Local variable names can be shorter, because they are used only within
2598 one context, where (presumably) comments explain their purpose.
2599
2600 Try to limit your use of abbreviations in symbol names.  It is ok to
2601 make a few abbreviations, explain what they mean, and then use them
2602 frequently, but don't use lots of obscure abbreviations.
2603
2604 Please use underscores to separate words in a name, so that the Emacs
2605 word commands can be useful within them.  Stick to lower case; reserve
2606 upper case for macros and @code{enum} constants, and for name-prefixes
2607 that follow a uniform convention.
2608
2609 For example, you should use names like @code{ignore_space_change_flag};
2610 don't use names like @code{iCantReadThis}.
2611
2612 Variables that indicate whether command-line options have been
2613 specified should be named after the meaning of the option, not after
2614 the option-letter.  A comment should state both the exact meaning of
2615 the option and its letter.  For example,
2616
2617 @example
2618 @group
2619 /* Ignore changes in horizontal whitespace (-b).  */
2620 int ignore_space_change_flag;
2621 @end group
2622 @end example
2623
2624 When you want to define names with constant integer values, use
2625 @code{enum} rather than @samp{#define}.  GDB knows about enumeration
2626 constants.
2627
2628 @cindex file-name limitations
2629 @pindex doschk
2630 You might want to make sure that none of the file names would conflict
2631 if the files were loaded onto an MS-DOS file system which shortens the
2632 names.  You can use the program @code{doschk} to test for this.
2633
2634 Some GNU programs were designed to limit themselves to file names of 14
2635 characters or less, to avoid file name conflicts if they are read into
2636 older System V systems.  Please preserve this feature in the existing
2637 GNU programs that have it, but there is no need to do this in new GNU
2638 programs.  @code{doschk} also reports file names longer than 14
2639 characters.
2640
2641 @node System Portability
2642 @section Portability between System Types
2643 @cindex portability, between system types
2644
2645 In the Unix world, ``portability'' refers to porting to different Unix
2646 versions.  For a GNU program, this kind of portability is desirable, but
2647 not paramount.
2648
2649 The primary purpose of GNU software is to run on top of the GNU kernel,
2650 compiled with the GNU C compiler, on various types of @sc{cpu}.  So the
2651 kinds of portability that are absolutely necessary are quite limited.
2652 But it is important to support Linux-based GNU systems, since they
2653 are the form of GNU that is popular.
2654
2655 Beyond that, it is good to support the other free operating systems
2656 (*BSD), and it is nice to support other Unix-like systems if you want
2657 to.  Supporting a variety of Unix-like systems is desirable, although
2658 not paramount.  It is usually not too hard, so you may as well do it.
2659 But you don't have to consider it an obligation, if it does turn out to
2660 be hard.
2661
2662 @pindex autoconf
2663 The easiest way to achieve portability to most Unix-like systems is to
2664 use Autoconf.  It's unlikely that your program needs to know more
2665 information about the host platform than Autoconf can provide, simply
2666 because most of the programs that need such knowledge have already been
2667 written.
2668
2669 Avoid using the format of semi-internal data bases (e.g., directories)
2670 when there is a higher-level alternative (@code{readdir}).
2671
2672 @cindex non-@sc{posix} systems, and portability
2673 As for systems that are not like Unix, such as MSDOS, Windows, VMS, MVS,
2674 and older Macintosh systems, supporting them is often a lot of work.
2675 When that is the case, it is better to spend your time adding features
2676 that will be useful on GNU and GNU/Linux, rather than on supporting
2677 other incompatible systems.
2678
2679 If you do support Windows, please do not abbreviate it as ``win''.  In
2680 hacker terminology, calling something a ``win'' is a form of praise.
2681 You're free to praise Microsoft Windows on your own if you want, but
2682 please don't do this in GNU packages.  Instead of abbreviating
2683 ``Windows'' to ``un'', you can write it in full or abbreviate it to
2684 ``woe'' or ``w''.  In GNU Emacs, for instance, we use @samp{w32} in
2685 file names of Windows-specific files, but the macro for Windows
2686 conditionals is called @code{WINDOWSNT}.
2687
2688 It is a good idea to define the ``feature test macro''
2689 @code{_GNU_SOURCE} when compiling your C files.  When you compile on GNU
2690 or GNU/Linux, this will enable the declarations of GNU library extension
2691 functions, and that will usually give you a compiler error message if
2692 you define the same function names in some other way in your program.
2693 (You don't have to actually @emph{use} these functions, if you prefer
2694 to make the program more portable to other systems.)
2695
2696 But whether or not you use these GNU extensions, you should avoid
2697 using their names for any other meanings.  Doing so would make it hard
2698 to move your code into other GNU programs.
2699
2700 @node CPU Portability
2701 @section Portability between @sc{cpu}s
2702
2703 @cindex data types, and portability
2704 @cindex portability, and data types
2705 Even GNU systems will differ because of differences among @sc{cpu}
2706 types---for example, difference in byte ordering and alignment
2707 requirements.  It is absolutely essential to handle these differences.
2708 However, don't make any effort to cater to the possibility that an
2709 @code{int} will be less than 32 bits.  We don't support 16-bit machines
2710 in GNU.
2711
2712 Similarly, don't make any effort to cater to the possibility that
2713 @code{long} will be smaller than predefined types like @code{size_t}.
2714 For example, the following code is ok:
2715
2716 @example
2717 printf ("size = %lu\n", (unsigned long) sizeof array);
2718 printf ("diff = %ld\n", (long) (pointer2 - pointer1));
2719 @end example
2720
2721 1989 Standard C requires this to work, and we know of only one
2722 counterexample: 64-bit programs on Microsoft Windows.  We will
2723 leave it to those who want to port GNU programs to that environment
2724 to figure out how to do it.
2725
2726 Predefined file-size types like @code{off_t} are an exception: they are
2727 longer than @code{long} on many platforms, so code like the above won't
2728 work with them.  One way to print an @code{off_t} value portably is to
2729 print its digits yourself, one by one.
2730
2731 Don't assume that the address of an @code{int} object is also the
2732 address of its least-significant byte.  This is false on big-endian
2733 machines.  Thus, don't make the following mistake:
2734
2735 @example
2736 int c;
2737 @dots{}
2738 while ((c = getchar()) != EOF)
2739   write(file_descriptor, &c, 1);
2740 @end example
2741
2742 It used to be ok to not worry about the difference between pointers
2743 and integers when passing arguments to functions.  However, on most
2744 modern 64-bit machines pointers are wider than @code{int}.
2745 Conversely, integer types like @code{long long int} and @code{off_t}
2746 are wider than pointers on most modern 32-bit machines.  Hence it's
2747 often better nowadays to use prototypes to define functions whose
2748 argument types are not trivial.
2749
2750 In particular, if functions accept varying argument counts or types
2751 they should be declared using prototypes containing @samp{...} and
2752 defined using @file{stdarg.h}.  For an example of this, please see the
2753 @uref{http://www.gnu.org/software/gnulib/, Gnulib} error module, which
2754 declares and defines the following function:
2755
2756 @example
2757 /* Print a message with `fprintf (stderr, FORMAT, ...)';
2758    if ERRNUM is nonzero, follow it with ": " and strerror (ERRNUM).
2759    If STATUS is nonzero, terminate the program with `exit (STATUS)'.  */
2760
2761 void error (int status, int errnum, const char *format, ...);
2762 @end example
2763
2764 A simple way to use the Gnulib error module is to obtain the two
2765 source files @file{error.c} and @file{error.h} from the Gnulib library
2766 source code repository at
2767 @uref{http://savannah.gnu.org/cgi-bin/viewcvs/gnulib/gnulib/lib/}.
2768 Here's a sample use:
2769
2770 @example
2771 #include "error.h"
2772 #include <errno.h>
2773 #include <stdio.h>
2774
2775 char *program_name = "myprogram";
2776
2777 FILE *
2778 xfopen (char const *name)
2779 @{
2780   FILE *fp = fopen (name, "r");
2781   if (! fp)
2782     error (1, errno, "cannot read %s", name);
2783   return fp;
2784 @}
2785 @end example
2786
2787 @cindex casting pointers to integers
2788 Avoid casting pointers to integers if you can.  Such casts greatly
2789 reduce portability, and in most programs they are easy to avoid.  In the
2790 cases where casting pointers to integers is essential---such as, a Lisp
2791 interpreter which stores type information as well as an address in one
2792 word---you'll have to make explicit provisions to handle different word
2793 sizes.  You will also need to make provision for systems in which the
2794 normal range of addresses you can get from @code{malloc} starts far away
2795 from zero.
2796
2797 @node System Functions
2798 @section Calling System Functions
2799 @cindex library functions, and portability
2800 @cindex portability, and library functions
2801
2802 C implementations differ substantially.  Standard C reduces but does
2803 not eliminate the incompatibilities; meanwhile, many GNU packages still
2804 support pre-standard compilers because this is not hard to do.  This
2805 chapter gives recommendations for how to use the more-or-less standard C
2806 library functions to avoid unnecessary loss of portability.
2807
2808 @itemize @bullet
2809 @item
2810 Don't use the return value of @code{sprintf}.  It returns the number of
2811 characters written on some systems, but not on all systems.
2812
2813 @item
2814 Be aware that @code{vfprintf} is not always available.
2815
2816 @item
2817 @code{main} should be declared to return type @code{int}.  It should
2818 terminate either by calling @code{exit} or by returning the integer
2819 status code; make sure it cannot ever return an undefined value.
2820
2821 @cindex declaration for system functions
2822 @item
2823 Don't declare system functions explicitly.
2824
2825 Almost any declaration for a system function is wrong on some system.
2826 To minimize conflicts, leave it to the system header files to declare
2827 system functions.  If the headers don't declare a function, let it
2828 remain undeclared.
2829
2830 While it may seem unclean to use a function without declaring it, in
2831 practice this works fine for most system library functions on the
2832 systems where this really happens; thus, the disadvantage is only
2833 theoretical.  By contrast, actual declarations have frequently caused
2834 actual conflicts.
2835
2836 @item
2837 If you must declare a system function, don't specify the argument types.
2838 Use an old-style declaration, not a Standard C prototype.  The more you
2839 specify about the function, the more likely a conflict.
2840
2841 @item
2842 In particular, don't unconditionally declare @code{malloc} or
2843 @code{realloc}.
2844
2845 Most GNU programs use those functions just once, in functions
2846 conventionally named @code{xmalloc} and @code{xrealloc}.  These
2847 functions call @code{malloc} and @code{realloc}, respectively, and
2848 check the results.
2849
2850 Because @code{xmalloc} and @code{xrealloc} are defined in your program,
2851 you can declare them in other files without any risk of type conflict.
2852
2853 On most systems, @code{int} is the same length as a pointer; thus, the
2854 calls to @code{malloc} and @code{realloc} work fine.  For the few
2855 exceptional systems (mostly 64-bit machines), you can use
2856 @strong{conditionalized} declarations of @code{malloc} and
2857 @code{realloc}---or put these declarations in configuration files
2858 specific to those systems.
2859
2860 @cindex string library functions
2861 @item
2862 The string functions require special treatment.  Some Unix systems have
2863 a header file @file{string.h}; others have @file{strings.h}.  Neither
2864 file name is portable.  There are two things you can do: use Autoconf to
2865 figure out which file to include, or don't include either file.
2866
2867 @item
2868 If you don't include either strings file, you can't get declarations for
2869 the string functions from the header file in the usual way.
2870
2871 That causes less of a problem than you might think.  The newer standard
2872 string functions should be avoided anyway because many systems still
2873 don't support them.  The string functions you can use are these:
2874
2875 @example
2876 strcpy   strncpy   strcat   strncat
2877 strlen   strcmp    strncmp
2878 strchr   strrchr
2879 @end example
2880
2881 The copy and concatenate functions work fine without a declaration as
2882 long as you don't use their values.  Using their values without a
2883 declaration fails on systems where the width of a pointer differs from
2884 the width of @code{int}, and perhaps in other cases.  It is trivial to
2885 avoid using their values, so do that.
2886
2887 The compare functions and @code{strlen} work fine without a declaration
2888 on most systems, possibly all the ones that GNU software runs on.
2889 You may find it necessary to declare them @strong{conditionally} on a
2890 few systems.
2891
2892 The search functions must be declared to return @code{char *}.  Luckily,
2893 there is no variation in the data type they return.  But there is
2894 variation in their names.  Some systems give these functions the names
2895 @code{index} and @code{rindex}; other systems use the names
2896 @code{strchr} and @code{strrchr}.  Some systems support both pairs of
2897 names, but neither pair works on all systems.
2898
2899 You should pick a single pair of names and use it throughout your
2900 program.  (Nowadays, it is better to choose @code{strchr} and
2901 @code{strrchr} for new programs, since those are the standard
2902 names.)  Declare both of those names as functions returning @code{char
2903 *}.  On systems which don't support those names, define them as macros
2904 in terms of the other pair.  For example, here is what to put at the
2905 beginning of your file (or in a header) if you want to use the names
2906 @code{strchr} and @code{strrchr} throughout:
2907
2908 @example
2909 #ifndef HAVE_STRCHR
2910 #define strchr index
2911 #endif
2912 #ifndef HAVE_STRRCHR
2913 #define strrchr rindex
2914 #endif
2915
2916 char *strchr ();
2917 char *strrchr ();
2918 @end example
2919 @end itemize
2920
2921 Here we assume that @code{HAVE_STRCHR} and @code{HAVE_STRRCHR} are
2922 macros defined in systems where the corresponding functions exist.
2923 One way to get them properly defined is to use Autoconf.
2924
2925 @node Internationalization
2926 @section Internationalization
2927 @cindex internationalization
2928
2929 @pindex gettext
2930 GNU has a library called GNU gettext that makes it easy to translate the
2931 messages in a program into various languages.  You should use this
2932 library in every program.  Use English for the messages as they appear
2933 in the program, and let gettext provide the way to translate them into
2934 other languages.
2935
2936 Using GNU gettext involves putting a call to the @code{gettext} macro
2937 around each string that might need translation---like this:
2938
2939 @example
2940 printf (gettext ("Processing file `%s'..."));
2941 @end example
2942
2943 @noindent
2944 This permits GNU gettext to replace the string @code{"Processing file
2945 `%s'..."} with a translated version.
2946
2947 Once a program uses gettext, please make a point of writing calls to
2948 @code{gettext} when you add new strings that call for translation.
2949
2950 Using GNU gettext in a package involves specifying a @dfn{text domain
2951 name} for the package.  The text domain name is used to separate the
2952 translations for this package from the translations for other packages.
2953 Normally, the text domain name should be the same as the name of the
2954 package---for example, @samp{fileutils} for the GNU file utilities.
2955
2956 @cindex message text, and internationalization
2957 To enable gettext to work well, avoid writing code that makes
2958 assumptions about the structure of words or sentences.  When you want
2959 the precise text of a sentence to vary depending on the data, use two or
2960 more alternative string constants each containing a complete sentences,
2961 rather than inserting conditionalized words or phrases into a single
2962 sentence framework.
2963
2964 Here is an example of what not to do:
2965
2966 @example
2967 printf ("%d file%s processed", nfiles,
2968         nfiles != 1 ? "s" : "");
2969 @end example
2970
2971 @noindent
2972 The problem with that example is that it assumes that plurals are made
2973 by adding `s'.  If you apply gettext to the format string, like this,
2974
2975 @example
2976 printf (gettext ("%d file%s processed"), nfiles,
2977         nfiles != 1 ? "s" : "");
2978 @end example
2979
2980 @noindent
2981 the message can use different words, but it will still be forced to use
2982 `s' for the plural.  Here is a better way:
2983
2984 @example
2985 printf ((nfiles != 1 ? "%d files processed"
2986          : "%d file processed"),
2987         nfiles);
2988 @end example
2989
2990 @noindent
2991 This way, you can apply gettext to each of the two strings
2992 independently:
2993
2994 @example
2995 printf ((nfiles != 1 ? gettext ("%d files processed")
2996          : gettext ("%d file processed")),
2997         nfiles);
2998 @end example
2999
3000 @noindent
3001 This can be any method of forming the plural of the word for ``file'', and
3002 also handles languages that require agreement in the word for
3003 ``processed''.
3004
3005 A similar problem appears at the level of sentence structure with this
3006 code:
3007
3008 @example
3009 printf ("#  Implicit rule search has%s been done.\n",
3010         f->tried_implicit ? "" : " not");
3011 @end example
3012
3013 @noindent
3014 Adding @code{gettext} calls to this code cannot give correct results for
3015 all languages, because negation in some languages requires adding words
3016 at more than one place in the sentence.  By contrast, adding
3017 @code{gettext} calls does the job straightfowardly if the code starts
3018 out like this:
3019
3020 @example
3021 printf (f->tried_implicit
3022         ? "#  Implicit rule search has been done.\n",
3023         : "#  Implicit rule search has not been done.\n");
3024 @end example
3025
3026
3027 @node Character Set
3028 @section Character Set
3029 @cindex character set
3030 @cindex encodings
3031 @cindex ASCII characters
3032 @cindex non-ASCII characters
3033
3034 Sticking to the ASCII character set (plain text, 7-bit characters) is
3035 preferred in GNU source code comments, text documents, and other
3036 contexts, unless there is good reason to do something else because of
3037 the application domain.  For example, if source code deals with the
3038 French Revolutionary calendar, it is OK if its literal strings contain
3039 accented characters in month names like ``Flor@'eal''.  Also, it is OK
3040 to use non-ASCII characters to represent proper names of contributors in
3041 change logs (@pxref{Change Logs}).
3042
3043 If you need to use non-ASCII characters, you should normally stick with
3044 one encoding, as one cannot in general mix encodings reliably.
3045
3046
3047 @node Quote Characters
3048 @section Quote Characters
3049 @cindex quote characters
3050 @cindex locale-specific quote characters
3051 @cindex left quote
3052 @cindex grave accent
3053
3054 In the C locale, GNU programs should stick to plain ASCII for quotation
3055 characters in messages to users: preferably 0x60 (@samp{`}) for left
3056 quotes and 0x27 (@samp{'}) for right quotes.  It is ok, but not
3057 required, to use locale-specific quotes in other locales.
3058
3059 The @uref{http://www.gnu.org/software/gnulib/, Gnulib} @code{quote} and
3060 @code{quotearg} modules provide a reasonably straightforward way to
3061 support locale-specific quote characters, as well as taking care of
3062 other issues, such as quoting a filename that itself contains a quote
3063 character.  See the Gnulib documentation for usage details.
3064
3065 In any case, the documentation for your program should clearly specify
3066 how it does quoting, if different than the preferred method of @samp{`}
3067 and @samp{'}.  This is especially important if the output of your
3068 program is ever likely to be parsed by another program.
3069
3070 Quotation characters are a difficult area in the computing world at
3071 this time: there are no true left or right quote characters in Latin1;
3072 the @samp{`} character we use was standardized there as a grave
3073 accent.  Moreover, Latin1 is still not universally usable.
3074
3075 Unicode contains the unambiguous quote characters required, and its
3076 common encoding UTF-8 is upward compatible with Latin1.  However,
3077 Unicode and UTF-8 are not universally well-supported, either. 
3078
3079 This may change over the next few years, and then we will revisit
3080 this.
3081
3082
3083 @node Mmap
3084 @section Mmap
3085 @findex mmap
3086
3087 Don't assume that @code{mmap} either works on all files or fails
3088 for all files.  It may work on some files and fail on others.
3089
3090 The proper way to use @code{mmap} is to try it on the specific file for
3091 which you want to use it---and if @code{mmap} doesn't work, fall back on
3092 doing the job in another way using @code{read} and @code{write}.
3093
3094 The reason this precaution is needed is that the GNU kernel (the HURD)
3095 provides a user-extensible file system, in which there can be many
3096 different kinds of ``ordinary files.''  Many of them support
3097 @code{mmap}, but some do not.  It is important to make programs handle
3098 all these kinds of files.
3099
3100 @node Documentation
3101 @chapter Documenting Programs
3102 @cindex documentation
3103
3104 A GNU program should ideally come with full free documentation, adequate
3105 for both reference and tutorial purposes.  If the package can be
3106 programmed or extended, the documentation should cover programming or
3107 extending it, as well as just using it.
3108
3109 @menu
3110 * GNU Manuals::                 Writing proper manuals.
3111 * Doc Strings and Manuals::     Compiling doc strings doesn't make a manual.
3112 * Manual Structure Details::    Specific structure conventions.
3113 * License for Manuals::         Writing the distribution terms for a manual.
3114 * Manual Credits::              Giving credit to documentation contributors.
3115 * Printed Manuals::             Mentioning the printed manual.
3116 * NEWS File::                   NEWS files supplement manuals.
3117 * Change Logs::                 Recording Changes
3118 * Man Pages::                   Man pages are secondary.
3119 * Reading other Manuals::       How far you can go in learning
3120                                 from other manuals.
3121 @end menu
3122
3123 @node GNU Manuals
3124 @section GNU Manuals
3125
3126 The preferred document format for the GNU system is the Texinfo
3127 formatting language.  Every GNU package should (ideally) have
3128 documentation in Texinfo both for reference and for learners.  Texinfo
3129 makes it possible to produce a good quality formatted book, using
3130 @TeX{}, and to generate an Info file.  It is also possible to generate
3131 HTML output from Texinfo source.  See the Texinfo manual, either the
3132 hardcopy, or the on-line version available through @code{info} or the
3133 Emacs Info subsystem (@kbd{C-h i}).
3134
3135 Nowadays some other formats such as Docbook and Sgmltexi can be
3136 converted automatically into Texinfo.  It is ok to produce the Texinfo
3137 documentation by conversion this way, as long as it gives good results.
3138
3139 Programmers often find it most natural to structure the documentation
3140 following the structure of the implementation, which they know.  But
3141 this structure is not necessarily good for explaining how to use the
3142 program; it may be irrelevant and confusing for a user.
3143
3144 At every level, from the sentences in a paragraph to the grouping of
3145 topics into separate manuals, the right way to structure documentation
3146 is according to the concepts and questions that a user will have in mind
3147 when reading it.  Sometimes this structure of ideas matches the
3148 structure of the implementation of the software being documented---but
3149 often they are different.  Often the most important part of learning to
3150 write good documentation is learning to notice when you are structuring
3151 the documentation like the implementation, and think about better
3152 alternatives.
3153
3154 For example, each program in the GNU system probably ought to be
3155 documented in one manual; but this does not mean each program should
3156 have its own manual.  That would be following the structure of the
3157 implementation, rather than the structure that helps the user
3158 understand.
3159
3160 Instead, each manual should cover a coherent @emph{topic}.  For example,
3161 instead of a manual for @code{diff} and a manual for @code{diff3}, we
3162 have one manual for ``comparison of files'' which covers both of those
3163 programs, as well as @code{cmp}.  By documenting these programs
3164 together, we can make the whole subject clearer.
3165
3166 The manual which discusses a program should certainly document all of
3167 the program's command-line options and all of its commands.  It should
3168 give examples of their use.  But don't organize the manual as a list
3169 of features.  Instead, organize it logically, by subtopics.  Address
3170 the questions that a user will ask when thinking about the job that
3171 the program does.  Don't just tell the reader what each feature can
3172 do---say what jobs it is good for, and show how to use it for those
3173 jobs.  Explain what is recommended usage, and what kinds of usage
3174 users should avoid.
3175
3176 In general, a GNU manual should serve both as tutorial and reference.
3177 It should be set up for convenient access to each topic through Info,
3178 and for reading straight through (appendixes aside).  A GNU manual
3179 should give a good introduction to a beginner reading through from the
3180 start, and should also provide all the details that hackers want.
3181 The Bison manual is a good example of this---please take a look at it
3182 to see what we mean.
3183
3184 That is not as hard as it first sounds.  Arrange each chapter as a
3185 logical breakdown of its topic, but order the sections, and write their
3186 text, so that reading the chapter straight through makes sense.  Do
3187 likewise when structuring the book into chapters, and when structuring a
3188 section into paragraphs.  The watchword is, @emph{at each point, address
3189 the most fundamental and important issue raised by the preceding text.}
3190
3191 If necessary, add extra chapters at the beginning of the manual which
3192 are purely tutorial and cover the basics of the subject.  These provide
3193 the framework for a beginner to understand the rest of the manual.  The
3194 Bison manual provides a good example of how to do this.
3195
3196 To serve as a reference, a manual should have an Index that list all the
3197 functions, variables, options, and important concepts that are part of
3198 the program.  One combined Index should do for a short manual, but
3199 sometimes for a complex package it is better to use multiple indices.
3200 The Texinfo manual includes advice on preparing good index entries, see
3201 @ref{Index Entries, , Making Index Entries, texinfo, GNU Texinfo}, and
3202 see @ref{Indexing Commands, , Defining the Entries of an
3203 Index, texinfo, GNU Texinfo}.
3204
3205 Don't use Unix man pages as a model for how to write GNU documentation;
3206 most of them are terse, badly structured, and give inadequate
3207 explanation of the underlying concepts.  (There are, of course, some
3208 exceptions.)  Also, Unix man pages use a particular format which is
3209 different from what we use in GNU manuals.
3210
3211 Please include an email address in the manual for where to report
3212 bugs @emph{in the text of the manual}.
3213
3214 Please do not use the term ``pathname'' that is used in Unix
3215 documentation; use ``file name'' (two words) instead.  We use the term
3216 ``path'' only for search paths, which are lists of directory names.
3217
3218 Please do not use the term ``illegal'' to refer to erroneous input to
3219 a computer program.  Please use ``invalid'' for this, and reserve the
3220 term ``illegal'' for activities prohibited by law.
3221
3222 @node Doc Strings and Manuals
3223 @section Doc Strings and Manuals
3224
3225 Some programming systems, such as Emacs, provide a documentation string
3226 for each function, command or variable.  You may be tempted to write a
3227 reference manual by compiling the documentation strings and writing a
3228 little additional text to go around them---but you must not do it.  That
3229 approach is a fundamental mistake.  The text of well-written
3230 documentation strings will be entirely wrong for a manual.
3231
3232 A documentation string needs to stand alone---when it appears on the
3233 screen, there will be no other text to introduce or explain it.
3234 Meanwhile, it can be rather informal in style.
3235
3236 The text describing a function or variable in a manual must not stand
3237 alone; it appears in the context of a section or subsection.  Other text
3238 at the beginning of the section should explain some of the concepts, and
3239 should often make some general points that apply to several functions or
3240 variables.  The previous descriptions of functions and variables in the
3241 section will also have given information about the topic.  A description
3242 written to stand alone would repeat some of that information; this
3243 redundance looks bad.  Meanwhile, the informality that is acceptable in
3244 a documentation string is totally unacceptable in a manual.
3245
3246 The only good way to use documentation strings in writing a good manual
3247 is to use them as a source of information for writing good text.
3248
3249 @node Manual Structure Details
3250 @section Manual Structure Details
3251 @cindex manual structure
3252
3253 The title page of the manual should state the version of the programs or
3254 packages documented in the manual.  The Top node of the manual should
3255 also contain this information.  If the manual is changing more
3256 frequently than or independent of the program, also state a version
3257 number for the manual in both of these places.
3258
3259 Each program documented in the manual should have a node named
3260 @samp{@var{program} Invocation} or @samp{Invoking @var{program}}.  This
3261 node (together with its subnodes, if any) should describe the program's
3262 command line arguments and how to run it (the sort of information people
3263 would look for in a man page).  Start with an @samp{@@example}
3264 containing a template for all the options and arguments that the program
3265 uses.
3266
3267 Alternatively, put a menu item in some menu whose item name fits one of
3268 the above patterns.  This identifies the node which that item points to
3269 as the node for this purpose, regardless of the node's actual name.
3270
3271 The @samp{--usage} feature of the Info reader looks for such a node
3272 or menu item in order to find the relevant text, so it is essential
3273 for every Texinfo file to have one.
3274
3275 If one manual describes several programs, it should have such a node for
3276 each program described in the manual.
3277
3278 @node License for Manuals
3279 @section License for Manuals
3280 @cindex license for manuals
3281
3282 Please use the GNU Free Documentation License for all GNU manuals that
3283 are more than a few pages long.  Likewise for a collection of short
3284 documents---you only need one copy of the GNU FDL for the whole
3285 collection.  For a single short document, you can use a very permissive
3286 non-copyleft license, to avoid taking up space with a long license.
3287
3288 See @uref{http://www.gnu.org/copyleft/fdl-howto.html} for more explanation
3289 of how to employ the GFDL.
3290
3291 Note that it is not obligatory to include a copy of the GNU GPL or GNU
3292 LGPL in a manual whose license is neither the GPL nor the LGPL.  It can
3293 be a good idea to include the program's license in a large manual; in a
3294 short manual, whose size would be increased considerably by including
3295 the program's license, it is probably better not to include it.
3296
3297 @node Manual Credits
3298 @section Manual Credits
3299 @cindex credits for manuals
3300
3301 Please credit the principal human writers of the manual as the authors,
3302 on the title page of the manual.  If a company sponsored the work, thank
3303 the company in a suitable place in the manual, but do not cite the
3304 company as an author.
3305
3306 @node Printed Manuals
3307 @section Printed Manuals
3308
3309 The FSF publishes some GNU manuals in printed form.  To encourage sales
3310 of these manuals, the on-line versions of the manual should mention at
3311 the very start that the printed manual is available and should point at
3312 information for getting it---for instance, with a link to the page
3313 @url{http://www.gnu.org/order/order.html}.  This should not be included
3314 in the printed manual, though, because there it is redundant.
3315
3316 It is also useful to explain in the on-line forms of the manual how the
3317 user can print out the manual from the sources.
3318
3319 @node NEWS File
3320 @section The NEWS File
3321 @cindex @file{NEWS} file
3322
3323 In addition to its manual, the package should have a file named
3324 @file{NEWS} which contains a list of user-visible changes worth
3325 mentioning.  In each new release, add items to the front of the file and
3326 identify the version they pertain to.  Don't discard old items; leave
3327 them in the file after the newer items.  This way, a user upgrading from
3328 any previous version can see what is new.
3329
3330 If the @file{NEWS} file gets very long, move some of the older items
3331 into a file named @file{ONEWS} and put a note at the end referring the
3332 user to that file.
3333
3334 @node Change Logs
3335 @section Change Logs
3336 @cindex change logs
3337
3338 Keep a change log to describe all the changes made to program source
3339 files.  The purpose of this is so that people investigating bugs in the
3340 future will know about the changes that might have introduced the bug.
3341 Often a new bug can be found by looking at what was recently changed.
3342 More importantly, change logs can help you eliminate conceptual
3343 inconsistencies between different parts of a program, by giving you a
3344 history of how the conflicting concepts arose and who they came from.
3345
3346 @menu
3347 * Change Log Concepts::         
3348 * Style of Change Logs::        
3349 * Simple Changes::              
3350 * Conditional Changes::         
3351 * Indicating the Part Changed::
3352 @end menu
3353
3354 @node Change Log Concepts
3355 @subsection Change Log Concepts
3356
3357 You can think of the change log as a conceptual ``undo list'' which
3358 explains how earlier versions were different from the current version.
3359 People can see the current version; they don't need the change log
3360 to tell them what is in it.  What they want from a change log is a
3361 clear explanation of how the earlier version differed.
3362
3363 The change log file is normally called @file{ChangeLog} and covers an
3364 entire directory.  Each directory can have its own change log, or a
3365 directory can use the change log of its parent directory--it's up to
3366 you.
3367
3368 Another alternative is to record change log information with a version
3369 control system such as RCS or CVS.  This can be converted automatically
3370 to a @file{ChangeLog} file using @code{rcs2log}; in Emacs, the command
3371 @kbd{C-x v a} (@code{vc-update-change-log}) does the job.
3372
3373 There's no need to describe the full purpose of the changes or how they
3374 work together.  If you think that a change calls for explanation, you're
3375 probably right.  Please do explain it---but please put the explanation
3376 in comments in the code, where people will see it whenever they see the
3377 code.  For example, ``New function'' is enough for the change log when
3378 you add a function, because there should be a comment before the
3379 function definition to explain what it does.
3380
3381 In the past, we recommended not mentioning changes in non-software
3382 files (manuals, help files, etc.) in change logs.  However, we've been
3383 advised that it is a good idea to include them, for the sake of
3384 copyright records.
3385
3386 However, sometimes it is useful to write one line to describe the
3387 overall purpose of a batch of changes.
3388
3389 The easiest way to add an entry to @file{ChangeLog} is with the Emacs
3390 command @kbd{M-x add-change-log-entry}.  An entry should have an
3391 asterisk, the name of the changed file, and then in parentheses the name
3392 of the changed functions, variables or whatever, followed by a colon.
3393 Then describe the changes you made to that function or variable.
3394
3395 @node Style of Change Logs
3396 @subsection Style of Change Logs
3397 @cindex change logs, style
3398
3399 Here are some simple examples of change log entries, starting with the
3400 header line that says who made the change and when it was installed,
3401 followed by descriptions of specific changes.  (These examples are
3402 drawn from Emacs and GCC.)
3403
3404 @example
3405 1998-08-17  Richard Stallman  <rms@@gnu.org>
3406
3407 * register.el (insert-register): Return nil.
3408 (jump-to-register): Likewise.
3409
3410 * sort.el (sort-subr): Return nil.
3411
3412 * tex-mode.el (tex-bibtex-file, tex-file, tex-region):
3413 Restart the tex shell if process is gone or stopped.
3414 (tex-shell-running): New function.
3415
3416 * expr.c (store_one_arg): Round size up for move_block_to_reg.
3417 (expand_call): Round up when emitting USE insns.
3418 * stmt.c (assign_parms): Round size up for move_block_from_reg.
3419 @end example
3420
3421 It's important to name the changed function or variable in full.  Don't
3422 abbreviate function or variable names, and don't combine them.
3423 Subsequent maintainers will often search for a function name to find all
3424 the change log entries that pertain to it; if you abbreviate the name,
3425 they won't find it when they search.
3426
3427 For example, some people are tempted to abbreviate groups of function
3428 names by writing @samp{* register.el (@{insert,jump-to@}-register)};
3429 this is not a good idea, since searching for @code{jump-to-register} or
3430 @code{insert-register} would not find that entry.
3431
3432 Separate unrelated change log entries with blank lines.  When two
3433 entries represent parts of the same change, so that they work together,
3434 then don't put blank lines between them.  Then you can omit the file
3435 name and the asterisk when successive entries are in the same file.
3436
3437 Break long lists of function names by closing continued lines with
3438 @samp{)}, rather than @samp{,}, and opening the continuation with
3439 @samp{(} as in this example:
3440
3441 @example
3442 * keyboard.c (menu_bar_items, tool_bar_items)
3443 (Fexecute_extended_command): Deal with `keymap' property.
3444 @end example
3445
3446 When you install someone else's changes, put the contributor's name in
3447 the change log entry rather than in the text of the entry.  In other
3448 words, write this:
3449
3450 @example
3451 2002-07-14  John Doe  <jdoe@@gnu.org>
3452
3453         * sewing.c: Make it sew.
3454 @end example
3455
3456 @noindent
3457 rather than this:
3458
3459 @example
3460 2002-07-14  Usual Maintainer  <usual@@gnu.org>
3461
3462         * sewing.c: Make it sew.  Patch by jdoe@@gnu.org.
3463 @end example
3464
3465 As for the date, that should be the date you applied the change.
3466
3467 @node Simple Changes
3468 @subsection Simple Changes
3469
3470 Certain simple kinds of changes don't need much detail in the change
3471 log.
3472
3473 When you change the calling sequence of a function in a simple fashion,
3474 and you change all the callers of the function to use the new calling
3475 sequence, there is no need to make individual entries for all the
3476 callers that you changed.  Just write in the entry for the function
3477 being called, ``All callers changed''---like this:
3478
3479 @example
3480 * keyboard.c (Fcommand_execute): New arg SPECIAL.
3481 All callers changed.
3482 @end example
3483
3484 When you change just comments or doc strings, it is enough to write an
3485 entry for the file, without mentioning the functions.  Just ``Doc
3486 fixes'' is enough for the change log.
3487
3488 There's no technical need to make change log entries for documentation
3489 files.  This is because documentation is not susceptible to bugs that
3490 are hard to fix.  Documentation does not consist of parts that must
3491 interact in a precisely engineered fashion.  To correct an error, you
3492 need not know the history of the erroneous passage; it is enough to
3493 compare what the documentation says with the way the program actually
3494 works.
3495
3496 However, you should keep change logs for documentation files when the
3497 project gets copyright assignments from its contributors, so as to
3498 make the records of authorship more accurate.
3499
3500 @node Conditional Changes
3501 @subsection Conditional Changes
3502 @cindex conditional changes, and change logs
3503 @cindex change logs, conditional changes
3504
3505 C programs often contain compile-time @code{#if} conditionals.  Many
3506 changes are conditional; sometimes you add a new definition which is
3507 entirely contained in a conditional.  It is very useful to indicate in
3508 the change log the conditions for which the change applies.
3509
3510 Our convention for indicating conditional changes is to use square
3511 brackets around the name of the condition.
3512
3513 Here is a simple example, describing a change which is conditional but
3514 does not have a function or entity name associated with it:
3515
3516 @example
3517 * xterm.c [SOLARIS2]: Include string.h.
3518 @end example
3519
3520 Here is an entry describing a new definition which is entirely
3521 conditional.  This new definition for the macro @code{FRAME_WINDOW_P} is
3522 used only when @code{HAVE_X_WINDOWS} is defined:
3523
3524 @example
3525 * frame.h [HAVE_X_WINDOWS] (FRAME_WINDOW_P): Macro defined.
3526 @end example
3527
3528 Here is an entry for a change within the function @code{init_display},
3529 whose definition as a whole is unconditional, but the changes themselves
3530 are contained in a @samp{#ifdef HAVE_LIBNCURSES} conditional:
3531
3532 @example
3533 * dispnew.c (init_display) [HAVE_LIBNCURSES]: If X, call tgetent.
3534 @end example
3535
3536 Here is an entry for a change that takes affect only when
3537 a certain macro is @emph{not} defined:
3538
3539 @example
3540 (gethostname) [!HAVE_SOCKETS]: Replace with winsock version.
3541 @end example
3542
3543 @node Indicating the Part Changed
3544 @subsection Indicating the Part Changed
3545
3546 Indicate the part of a function which changed by using angle brackets
3547 enclosing an indication of what the changed part does.  Here is an entry
3548 for a change in the part of the function @code{sh-while-getopts} that
3549 deals with @code{sh} commands:
3550
3551 @example
3552 * progmodes/sh-script.el (sh-while-getopts) <sh>: Handle case that
3553 user-specified option string is empty.
3554 @end example
3555
3556
3557 @node Man Pages
3558 @section Man Pages
3559 @cindex man pages
3560
3561 In the GNU project, man pages are secondary.  It is not necessary or
3562 expected for every GNU program to have a man page, but some of them do.
3563 It's your choice whether to include a man page in your program.
3564
3565 When you make this decision, consider that supporting a man page
3566 requires continual effort each time the program is changed.  The time
3567 you spend on the man page is time taken away from more useful work.
3568
3569 For a simple program which changes little, updating the man page may be
3570 a small job.  Then there is little reason not to include a man page, if
3571 you have one.
3572
3573 For a large program that changes a great deal, updating a man page may
3574 be a substantial burden.  If a user offers to donate a man page, you may
3575 find this gift costly to accept.  It may be better to refuse the man
3576 page unless the same person agrees to take full responsibility for
3577 maintaining it---so that you can wash your hands of it entirely.  If
3578 this volunteer later ceases to do the job, then don't feel obliged to
3579 pick it up yourself; it may be better to withdraw the man page from the
3580 distribution until someone else agrees to update it.
3581
3582 When a program changes only a little, you may feel that the
3583 discrepancies are small enough that the man page remains useful without
3584 updating.  If so, put a prominent note near the beginning of the man
3585 page explaining that you don't maintain it and that the Texinfo manual
3586 is more authoritative.  The note should say how to access the Texinfo
3587 documentation.
3588
3589 Be sure that man pages include a copyright statement and free
3590 license.  The simple all-permissive license is appropriate for simple
3591 man pages:
3592
3593 @example
3594 Copying and distribution of this file, with or without modification,
3595 are permitted in any medium without royalty provided the copyright
3596 notice and this notice are preserved.
3597 @end example
3598
3599 For long man pages, with enough explanation and documentation that
3600 they can be considered true manuals, use the GFDL (@pxref{License for
3601 Manuals}).
3602
3603 Finally, the GNU help2man program
3604 (@uref{http://www.gnu.org/software/help2man/}) is one way to automate
3605 generation of a man page, in this case from @option{--help} output.
3606 This is sufficient in many cases.
3607
3608 @node Reading other Manuals
3609 @section Reading other Manuals
3610
3611 There may be non-free books or documentation files that describe the
3612 program you are documenting.
3613
3614 It is ok to use these documents for reference, just as the author of a
3615 new algebra textbook can read other books on algebra.  A large portion
3616 of any non-fiction book consists of facts, in this case facts about how
3617 a certain program works, and these facts are necessarily the same for
3618 everyone who writes about the subject.  But be careful not to copy your
3619 outline structure, wording, tables or examples from preexisting non-free
3620 documentation.  Copying from free documentation may be ok; please check
3621 with the FSF about the individual case.
3622
3623 @node Managing Releases
3624 @chapter The Release Process
3625 @cindex releasing
3626
3627 Making a release is more than just bundling up your source files in a
3628 tar file and putting it up for FTP.  You should set up your software so
3629 that it can be configured to run on a variety of systems.  Your Makefile
3630 should conform to the GNU standards described below, and your directory
3631 layout should also conform to the standards discussed below.  Doing so
3632 makes it easy to include your package into the larger framework of
3633 all GNU software.
3634
3635 @menu
3636 * Configuration::               How Configuration Should Work
3637 * Makefile Conventions::        Makefile Conventions
3638 * Releases::                    Making Releases
3639 @end menu
3640
3641 @node Configuration
3642 @section How Configuration Should Work
3643 @cindex program configuration
3644
3645 @pindex configure
3646 Each GNU distribution should come with a shell script named
3647 @code{configure}.  This script is given arguments which describe the
3648 kind of machine and system you want to compile the program for.
3649
3650 The @code{configure} script must record the configuration options so
3651 that they affect compilation.
3652
3653 One way to do this is to make a link from a standard name such as
3654 @file{config.h} to the proper configuration file for the chosen system.
3655 If you use this technique, the distribution should @emph{not} contain a
3656 file named @file{config.h}.  This is so that people won't be able to
3657 build the program without configuring it first.
3658
3659 Another thing that @code{configure} can do is to edit the Makefile.  If
3660 you do this, the distribution should @emph{not} contain a file named
3661 @file{Makefile}.  Instead, it should include a file @file{Makefile.in} which
3662 contains the input used for editing.  Once again, this is so that people
3663 won't be able to build the program without configuring it first.
3664
3665 If @code{configure} does write the @file{Makefile}, then @file{Makefile}
3666 should have a target named @file{Makefile} which causes @code{configure}
3667 to be rerun, setting up the same configuration that was set up last
3668 time.  The files that @code{configure} reads should be listed as
3669 dependencies of @file{Makefile}.
3670
3671 All the files which are output from the @code{configure} script should
3672 have comments at the beginning explaining that they were generated
3673 automatically using @code{configure}.  This is so that users won't think
3674 of trying to edit them by hand.
3675
3676 The @code{configure} script should write a file named @file{config.status}
3677 which describes which configuration options were specified when the
3678 program was last configured.  This file should be a shell script which,
3679 if run, will recreate the same configuration.
3680
3681 The @code{configure} script should accept an option of the form
3682 @samp{--srcdir=@var{dirname}} to specify the directory where sources are found
3683 (if it is not the current directory).  This makes it possible to build
3684 the program in a separate directory, so that the actual source directory
3685 is not modified.
3686
3687 If the user does not specify @samp{--srcdir}, then @code{configure} should
3688 check both @file{.} and @file{..} to see if it can find the sources.  If
3689 it finds the sources in one of these places, it should use them from
3690 there.  Otherwise, it should report that it cannot find the sources, and
3691 should exit with nonzero status.
3692
3693 Usually the easy way to support @samp{--srcdir} is by editing a
3694 definition of @code{VPATH} into the Makefile.  Some rules may need to
3695 refer explicitly to the specified source directory.  To make this
3696 possible, @code{configure} can add to the Makefile a variable named
3697 @code{srcdir} whose value is precisely the specified directory.
3698
3699 The @code{configure} script should also take an argument which specifies the
3700 type of system to build the program for.  This argument should look like
3701 this:
3702
3703 @example
3704 @var{cpu}-@var{company}-@var{system}
3705 @end example
3706
3707 For example, an Athlon-based GNU/Linux system might be
3708 @samp{i686-pc-linux-gnu}.
3709
3710 The @code{configure} script needs to be able to decode all plausible
3711 alternatives for how to describe a machine.  Thus,
3712 @samp{athlon-pc-gnu/linux} would be a valid alias.  There is a shell
3713 script called
3714 @uref{http://savannah.gnu.org/cgi-bin/viewcvs/*checkout*/config/config/config.sub,
3715 @file{config.sub}} that you can use as a subroutine to validate system
3716 types and canonicalize aliases.
3717
3718 The @code{configure} script should also take the option
3719 @option{--build=@var{buildtype}}, which should be equivalent to a
3720 plain @var{buildtype} argument.  For example, @samp{configure
3721 --build=i686-pc-linux-gnu} is equivalent to @samp{configure
3722 i686-pc-linux-gnu}.  When the build type is not specified by an option
3723 or argument, the @code{configure} script should normally guess it using
3724 the shell script
3725 @uref{http://savannah.gnu.org/cgi-bin/viewcvs/*checkout*/config/config/config.guess,
3726 @file{config.guess}}.
3727
3728 @cindex optional features, configure-time
3729 Other options are permitted to specify in more detail the software
3730 or hardware present on the machine, and include or exclude optional
3731 parts of the package:
3732
3733 @table @samp
3734 @item --enable-@var{feature}@r{[}=@var{parameter}@r{]}
3735 Configure the package to build and install an optional user-level
3736 facility called @var{feature}.  This allows users to choose which
3737 optional features to include.  Giving an optional @var{parameter} of
3738 @samp{no} should omit @var{feature}, if it is built by default.
3739
3740 No @samp{--enable} option should @strong{ever} cause one feature to
3741 replace another.  No @samp{--enable} option should ever substitute one
3742 useful behavior for another useful behavior.  The only proper use for
3743 @samp{--enable} is for questions of whether to build part of the program
3744 or exclude it.
3745
3746 @item --with-@var{package}
3747 @c @r{[}=@var{parameter}@r{]}
3748 The package @var{package} will be installed, so configure this package
3749 to work with @var{package}.
3750
3751 @c  Giving an optional @var{parameter} of
3752 @c @samp{no} should omit @var{package}, if it is used by default.
3753
3754 Possible values of @var{package} include
3755 @samp{gnu-as} (or @samp{gas}), @samp{gnu-ld}, @samp{gnu-libc},
3756 @samp{gdb},
3757 @samp{x},
3758 and
3759 @samp{x-toolkit}.
3760
3761 Do not use a @samp{--with} option to specify the file name to use to
3762 find certain files.  That is outside the scope of what @samp{--with}
3763 options are for.
3764 @end table
3765
3766 All @code{configure} scripts should accept all of these ``detail''
3767 options, whether or not they make any difference to the particular
3768 package at hand.  In particular, they should accept any option that
3769 starts with @samp{--with-} or @samp{--enable-}.  This is so users will
3770 be able to configure an entire GNU source tree at once with a single set
3771 of options.
3772
3773 You will note that the categories @samp{--with-} and @samp{--enable-}
3774 are narrow: they @strong{do not} provide a place for any sort of option
3775 you might think of.  That is deliberate.  We want to limit the possible
3776 configuration options in GNU software.  We do not want GNU programs to
3777 have idiosyncratic configuration options.
3778
3779 Packages that perform part of the compilation process may support
3780 cross-compilation.  In such a case, the host and target machines for the
3781 program may be different.
3782
3783 The @code{configure} script should normally treat the specified type of
3784 system as both the host and the target, thus producing a program which
3785 works for the same type of machine that it runs on.
3786
3787 To compile a program to run on a host type that differs from the build
3788 type, use the configure option @option{--host=@var{hosttype}}, where
3789 @var{hosttype} uses the same syntax as @var{buildtype}.  The host type
3790 normally defaults to the build type.
3791
3792 To configure a cross-compiler, cross-assembler, or what have you, you
3793 should specify a target different from the host, using the configure
3794 option @samp{--target=@var{targettype}}.  The syntax for
3795 @var{targettype} is the same as for the host type.  So the command would
3796 look like this:
3797
3798 @example
3799 ./configure --host=@var{hosttype} --target=@var{targettype}
3800 @end example
3801
3802 The target type normally defaults to the host type.
3803 Programs for which cross-operation is not meaningful need not accept the
3804 @samp{--target} option, because configuring an entire operating system for
3805 cross-operation is not a meaningful operation.
3806
3807 Some programs have ways of configuring themselves automatically.  If
3808 your program is set up to do this, your @code{configure} script can simply
3809 ignore most of its arguments.
3810
3811 @comment The makefile standards are in a separate file that is also
3812 @comment included by make.texinfo.  Done by roland@gnu.ai.mit.edu on 1/6/93.
3813 @comment For this document, turn chapters into sections, etc.
3814 @lowersections
3815 @include make-stds.texi
3816 @raisesections
3817
3818 @node Releases
3819 @section Making Releases
3820 @cindex packaging
3821
3822 You should identify each release with a pair of version numbers, a
3823 major version and a minor.  We have no objection to using more than
3824 two numbers, but it is very unlikely that you really need them.
3825
3826 Package the distribution of @code{Foo version 69.96} up in a gzipped tar
3827 file with the name @file{foo-69.96.tar.gz}.  It should unpack into a
3828 subdirectory named @file{foo-69.96}.
3829
3830 Building and installing the program should never modify any of the files
3831 contained in the distribution.  This means that all the files that form
3832 part of the program in any way must be classified into @dfn{source
3833 files} and @dfn{non-source files}.  Source files are written by humans
3834 and never changed automatically; non-source files are produced from
3835 source files by programs under the control of the Makefile.
3836
3837 @cindex @file{README} file
3838 The distribution should contain a file named @file{README} which gives
3839 the name of the package, and a general description of what it does.  It
3840 is also good to explain the purpose of each of the first-level
3841 subdirectories in the package, if there are any.  The @file{README} file
3842 should either state the version number of the package, or refer to where
3843 in the package it can be found.
3844
3845 The @file{README} file should refer to the file @file{INSTALL}, which
3846 should contain an explanation of the installation procedure.
3847
3848 The @file{README} file should also refer to the file which contains the
3849 copying conditions.  The GNU GPL, if used, should be in a file called
3850 @file{COPYING}.  If the GNU LGPL is used, it should be in a file called
3851 @file{COPYING.LIB}.
3852
3853 Naturally, all the source files must be in the distribution.  It is okay
3854 to include non-source files in the distribution, provided they are
3855 up-to-date and machine-independent, so that building the distribution
3856 normally will never modify them.  We commonly include non-source files
3857 produced by Bison, @code{lex}, @TeX{}, and @code{makeinfo}; this helps avoid
3858 unnecessary dependencies between our distributions, so that users can
3859 install whichever packages they want to install.
3860
3861 Non-source files that might actually be modified by building and
3862 installing the program should @strong{never} be included in the
3863 distribution.  So if you do distribute non-source files, always make
3864 sure they are up to date when you make a new distribution.
3865
3866 Make sure that the directory into which the distribution unpacks (as
3867 well as any subdirectories) are all world-writable (octal mode 777).
3868 This is so that old versions of @code{tar} which preserve the
3869 ownership and permissions of the files from the tar archive will be
3870 able to extract all the files even if the user is unprivileged.
3871
3872 Make sure that all the files in the distribution are world-readable.
3873
3874 Don't include any symbolic links in the distribution itself.  If the tar
3875 file contains symbolic links, then people cannot even unpack it on
3876 systems that don't support symbolic links.  Also, don't use multiple
3877 names for one file in different directories, because certain file
3878 systems cannot handle this and that prevents unpacking the
3879 distribution.
3880
3881 Try to make sure that all the file names will be unique on MS-DOS.  A
3882 name on MS-DOS consists of up to 8 characters, optionally followed by a
3883 period and up to three characters.  MS-DOS will truncate extra
3884 characters both before and after the period.  Thus,
3885 @file{foobarhacker.c} and @file{foobarhacker.o} are not ambiguous; they
3886 are truncated to @file{foobarha.c} and @file{foobarha.o}, which are
3887 distinct.
3888
3889 @cindex @file{texinfo.tex}, in a distribution
3890 Include in your distribution a copy of the @file{texinfo.tex} you used
3891 to test print any @file{*.texinfo} or @file{*.texi} files.
3892
3893 Likewise, if your program uses small GNU software packages like regex,
3894 getopt, obstack, or termcap, include them in the distribution file.
3895 Leaving them out would make the distribution file a little smaller at
3896 the expense of possible inconvenience to a user who doesn't know what
3897 other files to get.
3898
3899 @node References
3900 @chapter References to Non-Free Software and Documentation
3901 @cindex references to non-free material
3902
3903 A GNU program should not recommend use of any non-free program.  We
3904 can't stop some people from writing proprietary programs, or stop
3905 other people from using them, but we can and should refuse to
3906 advertise them to new potential customers.  Proprietary software is a
3907 social and ethical problem, and the point of GNU is to solve that
3908 problem.
3909
3910 The GNU definition of free software is found on the GNU web site at
3911 @url{http://www.gnu.org/philosophy/free-sw.html}, and the definition
3912 of free documentation is found at
3913 @url{http://www.gnu.org/philosophy/free-doc.html}.  A list of
3914 important licenses and whether they qualify as free is in
3915 @url{http://www.gnu.org/licenses/license-list.html}.  The terms
3916 ``free'' and ``non-free'', used in this document, refer to that
3917 definition.  If it is not clear whether a license qualifies as free
3918 under this definition, please ask the GNU Project by writing to
3919 @email{licensing@@gnu.org}.  We will answer, and if the license is an
3920 important one, we will add it to the list.
3921
3922 When a non-free program or system is well known, you can mention it in
3923 passing---that is harmless, since users who might want to use it
3924 probably already know about it.  For instance, it is fine to explain
3925 how to build your package on top of some widely used non-free
3926 operating system, or how to use it together with some widely used
3927 non-free program.
3928
3929 However, you should give only the necessary information to help those
3930 who already use the non-free program to use your program with
3931 it---don't give, or refer to, any further information about the
3932 proprietary program, and don't imply that the proprietary program
3933 enhances your program, or that its existence is in any way a good
3934 thing.  The goal should be that people already using the proprietary
3935 program will get the advice they need about how to use your free
3936 program with it, while people who don't already use the proprietary
3937 program will not see anything to lead them to take an interest in it.
3938
3939 If a non-free program or system is obscure in your program's domain,
3940 your program should not mention or support it at all, since doing so
3941 would tend to popularize the non-free program more than it popularizes
3942 your program.  (You cannot hope to find many additional users among
3943 the users of Foobar if the users of Foobar are few.)
3944
3945 Sometimes a program is free software in itself but depends on a
3946 non-free platform in order to run.  For instance, many Java programs
3947 depend on Sun's Java implementation, and won't run on the GNU Java
3948 Compiler (which does not yet have all the features) or won't run with
3949 the GNU Java libraries.  To recommend that program is inherently to
3950 recommend the non-free platform as well; if you should not do the
3951 latter, then don't do the former.
3952
3953 A GNU package should not refer the user to any non-free documentation
3954 for free software.  Free documentation that can be included in free
3955 operating systems is essential for completing the GNU system, or any
3956 free operating system, so it is a major focus of the GNU Project; to
3957 recommend use of documentation that we are not allowed to use in GNU
3958 would weaken the impetus for the community to produce documentation
3959 that we can include.  So GNU packages should never recommend non-free
3960 documentation.
3961
3962 By contrast, it is ok to refer to journal articles and textbooks in
3963 the comments of a program for explanation of how it functions, even
3964 though they be non-free.  This is because we don't include such things
3965 in the GNU system even if we are allowed to--they are outside the
3966 scope of an operating system project.
3967
3968 Referring to a web site that describes or recommends a non-free
3969 program is in effect promoting that software, so please do not make
3970 links (or mention by name) web sites that contain such material.  This
3971 policy is relevant particularly for the web pages for a GNU package.
3972
3973 Following links from nearly any web site can lead to non-free
3974 software; this is an inescapable aspect of the nature of the web, and
3975 in itself is no objection to linking to a site.  As long as the site
3976 does not itself recommend a non-free program, there is no need be
3977 concerned about the sites it links to for other reasons.
3978
3979 Thus, for example, you should not make a link to AT&T's web site,
3980 because that recommends AT&T's non-free software packages; you should
3981 not make a link to a site that links to AT&T's site saying it is a
3982 place to get a non-free program; but if a site you want to link to
3983 refers to AT&T's web site in some other context (such as long-distance
3984 telephone service), that is not a problem.
3985
3986 @node Copying This Manual
3987 @appendix Copying This Manual
3988
3989 @menu
3990 * GNU Free Documentation License::  License for copying this manual
3991 @end menu
3992
3993 @include fdl.texi
3994
3995 @node Index
3996 @unnumbered Index
3997 @printindex cp
3998
3999 @bye
4000
4001 Local variables:
4002 eval: (add-hook 'write-file-hooks 'time-stamp)
4003 time-stamp-start: "@set lastupdate "
4004 time-stamp-end: "$"
4005 time-stamp-format: "%:b %:d, %:y"
4006 compile-command: "make just-standards"
4007 End: