standards update
[gnulib.git] / doc / standards.texi
1 \input texinfo @c -*-texinfo-*-
2 @c %**start of header
3 @setfilename standards.info
4 @settitle GNU Coding Standards
5 @c This date is automagically updated when you save this file:
6 @set lastupdate December 30, 2004
7 @c %**end of header
8
9 @dircategory GNU organization
10 @direntry
11 * Standards: (standards).        GNU coding standards.
12 @end direntry
13
14 @c @setchapternewpage odd
15 @setchapternewpage off
16
17 @c Put everything in one index (arbitrarily chosen to be the concept index).
18 @syncodeindex fn cp
19 @syncodeindex ky cp
20 @syncodeindex pg cp
21 @syncodeindex vr cp
22
23 @c This is used by a cross ref in make-stds.texi
24 @set CODESTD  1
25 @iftex
26 @set CHAPTER chapter
27 @end iftex
28 @ifinfo
29 @set CHAPTER node
30 @end ifinfo
31
32 @copying
33 The GNU coding standards, last updated @value{lastupdate}.
34
35 Copyright (C) 1992, 1993, 1994, 1995, 1996, 1997, 1998, 1999, 2000,
36 2001, 2002, 2003, 2004 Free Software Foundation, Inc.
37
38 Permission is granted to copy, distribute and/or modify this document
39 under the terms of the GNU Free Documentation License, Version 1.1
40 or any later version published by the Free Software Foundation;
41 with no Invariant Sections, with no
42 Front-Cover Texts, and with no Back-Cover Texts.
43 A copy of the license is included in the section entitled ``GNU
44 Free Documentation License''.
45 @end copying
46
47 @titlepage
48 @title GNU Coding Standards
49 @author Richard Stallman, et al.
50 @author last updated @value{lastupdate}
51 @page
52 @vskip 0pt plus 1filll
53 @insertcopying
54 @end titlepage
55
56 @contents
57
58 @ifnottex
59 @node Top, Preface, (dir), (dir)
60 @top Version
61
62 @insertcopying
63 @end ifnottex
64
65 @menu
66 * Preface::                     About the GNU Coding Standards
67 * Legal Issues::                Keeping Free Software Free
68 * Design Advice::               General Program Design
69 * Program Behavior::            Program Behavior for All Programs
70 * Writing C::                   Making The Best Use of C
71 * Documentation::               Documenting Programs
72 * Managing Releases::           The Release Process
73 * References::                  References to Non-Free Software or Documentation
74 * Copying This Manual::         How to Make Copies of This Manual
75 * Index::                       
76
77 @end menu
78
79 @node Preface
80 @chapter About the GNU Coding Standards
81
82 The GNU Coding Standards were written by Richard Stallman and other GNU
83 Project volunteers.  Their purpose is to make the GNU system clean,
84 consistent, and easy to install.  This document can also be read as a
85 guide to writing portable, robust and reliable programs.  It focuses on
86 programs written in C, but many of the rules and principles are useful
87 even if you write in another programming language.  The rules often
88 state reasons for writing in a certain way.
89
90 This release of the GNU Coding Standards was last updated
91 @value{lastupdate}.
92
93 @cindex where to obtain @code{standards.texi}
94 @cindex downloading this manual
95 If you did not obtain this file directly from the GNU project and
96 recently, please check for a newer version.  You can get the GNU
97 Coding Standards from the GNU web server in many
98 different formats, including the Texinfo source, PDF, HTML, DVI, plain
99 text, and more, at: @uref{http://www.gnu.org/prep/standards/}.
100
101 Corrections or suggestions for this document should be sent to
102 @email{bug-standards@@gnu.org}.  If you make a suggestion, please include a
103 suggested new wording for it; our time is limited.  We prefer a context
104 diff to the @file{standards.texi} or @file{make-stds.texi} files, but if
105 you don't have those files, please mail your suggestion anyway.
106
107 These standards cover the minimum of what is important when writing a
108 GNU package.  Likely, the needs for additional standards will come up.
109 Sometimes, you might suggest that such standards be added to this
110 document.  If you think your standards would be generally useful, please
111 do suggest them.
112
113 You should also set standards for your package on many questions not
114 addressed or not firmly specified here.  The most important point is to
115 be self-consistent---try to stick to the conventions you pick, and try
116 to document them as much as possible.  That way, your program will be
117 more maintainable by others.
118
119 The GNU Hello program serves as an example of how to follow the GNU
120 coding standards for a trivial program which prints @samp{Hello,
121 world!}.  @uref{http://www.gnu.org/software/hello/hello.html}.
122
123 @node Legal Issues
124 @chapter Keeping Free Software Free
125 @cindex legal aspects
126
127 This chapter discusses how you can make sure that GNU software
128 avoids legal difficulties, and other related issues.
129
130 @menu
131 * Reading Non-Free Code::       Referring to Proprietary Programs
132 * Contributions::               Accepting Contributions
133 * Trademarks::                  How We Deal with Trademark Issues
134 @end menu
135
136 @node Reading Non-Free Code
137 @section Referring to Proprietary Programs
138 @cindex proprietary programs
139 @cindex avoiding proprietary code
140
141 Don't in any circumstances refer to Unix source code for or during
142 your work on GNU!  (Or to any other proprietary programs.)
143
144 If you have a vague recollection of the internals of a Unix program,
145 this does not absolutely mean you can't write an imitation of it, but
146 do try to organize the imitation internally along different lines,
147 because this is likely to make the details of the Unix version
148 irrelevant and dissimilar to your results.
149
150 For example, Unix utilities were generally optimized to minimize
151 memory use; if you go for speed instead, your program will be very
152 different.  You could keep the entire input file in core and scan it
153 there instead of using stdio.  Use a smarter algorithm discovered more
154 recently than the Unix program.  Eliminate use of temporary files.  Do
155 it in one pass instead of two (we did this in the assembler).
156
157 Or, on the contrary, emphasize simplicity instead of speed.  For some
158 applications, the speed of today's computers makes simpler algorithms
159 adequate.
160
161 Or go for generality.  For example, Unix programs often have static
162 tables or fixed-size strings, which make for arbitrary limits; use
163 dynamic allocation instead.  Make sure your program handles NULs and
164 other funny characters in the input files.  Add a programming language
165 for extensibility and write part of the program in that language.
166
167 Or turn some parts of the program into independently usable libraries.
168 Or use a simple garbage collector instead of tracking precisely when
169 to free memory, or use a new GNU facility such as obstacks.
170
171 @node Contributions
172 @section Accepting Contributions
173 @cindex legal papers
174 @cindex accepting contributions
175
176 If the program you are working on is copyrighted by the Free Software
177 Foundation, then when someone else sends you a piece of code to add to
178 the program, we need legal papers to use it---just as we asked you to
179 sign papers initially.  @emph{Each} person who makes a nontrivial
180 contribution to a program must sign some sort of legal papers in order
181 for us to have clear title to the program; the main author alone is not
182 enough.
183
184 So, before adding in any contributions from other people, please tell
185 us, so we can arrange to get the papers.  Then wait until we tell you
186 that we have received the signed papers, before you actually use the
187 contribution.
188
189 This applies both before you release the program and afterward.  If
190 you receive diffs to fix a bug, and they make significant changes, we
191 need legal papers for that change.
192
193 This also applies to comments and documentation files.  For copyright
194 law, comments and code are just text.  Copyright applies to all kinds of
195 text, so we need legal papers for all kinds.
196
197 We know it is frustrating to ask for legal papers; it's frustrating for
198 us as well.  But if you don't wait, you are going out on a limb---for
199 example, what if the contributor's employer won't sign a disclaimer?
200 You might have to take that code out again!
201
202 You don't need papers for changes of a few lines here or there, since
203 they are not significant for copyright purposes.  Also, you don't need
204 papers if all you get from the suggestion is some ideas, not actual code
205 which you use.  For example, if someone sent you one implementation, but
206 you write a different implementation of the same idea, you don't need to
207 get papers.
208
209 The very worst thing is if you forget to tell us about the other
210 contributor.  We could be very embarrassed in court some day as a
211 result.
212
213 We have more detailed advice for maintainers of programs; if you have
214 reached the stage of actually maintaining a program for GNU (whether
215 released or not), please ask us for a copy.  It is also available
216 online for your perusal: @uref{http://www.gnu.org/prep/maintain/}.
217
218 @node Trademarks
219 @section Trademarks
220 @cindex trademarks
221
222 Please do not include any trademark acknowledgements in GNU software
223 packages or documentation.
224
225 Trademark acknowledgements are the statements that such-and-such is a
226 trademark of so-and-so.  The GNU Project has no objection to the basic
227 idea of trademarks, but these acknowledgements feel like kowtowing, 
228 and there is no legal requirement for them, so we don't use them.
229
230 What is legally required, as regards other people's trademarks, is to
231 avoid using them in ways which a reader might reasonably understand as
232 naming or labeling our own programs or activities.  For example, since
233 ``Objective C'' is (or at least was) a trademark, we made sure to say
234 that we provide a ``compiler for the Objective C language'' rather
235 than an ``Objective C compiler''.  The latter would have been meant as
236 a shorter way of saying the former, but it does not explicitly state
237 the relationship, so it could be misinterpreted as using ``Objective
238 C'' as a label for the compiler rather than for the language.
239
240 Please don't use ``win'' as an abbreviation for Microsoft Windows in
241 GNU software or documentation.  In hacker terminology, calling
242 something a "win" is a form of praise.  If you wish to praise
243 Microsoft Windows when speaking on your own, by all means do so, but
244 not in GNU software.  Usually we write the word ``windows'' in full,
245 but when brevity is very important (as in file names and sometimes
246 symbol names), we abbreviate it to ``w''.  For instance, the files and
247 functions in Emacs that deal with Windows start with @samp{w32}.
248
249 @node Design Advice
250 @chapter General Program Design
251 @cindex program design
252
253 This chapter discusses some of the issues you should take into
254 account when designing your program.
255
256 @c                         Standard or ANSI C
257 @c
258 @c In 1989 the American National Standards Institute (ANSI) standardized
259 @c C   as  standard  X3.159-1989.    In  December   of  that   year  the
260 @c International Standards Organization ISO  adopted the ANSI C standard
261 @c making  minor changes.   In 1990  ANSI then  re-adopted  ISO standard
262 @c C. This version of C is known as either ANSI C or Standard C.
263
264 @c A major revision of the C Standard appeared in 1999.
265
266 @menu
267 * Source Language::             Which languages to use.
268 * Compatibility::               Compatibility with other implementations
269 * Using Extensions::            Using non-standard features
270 * Standard C::                  Using Standard C features
271 * Conditional Compilation::     Compiling Code Only If A Conditional is True
272 @end menu
273
274 @node Source Language
275 @section Which Languages to Use
276 @cindex programming languages
277
278 When you want to use a language that gets compiled and runs at high
279 speed, the best language to use is C.  Using another language is like
280 using a non-standard feature: it will cause trouble for users.  Even if
281 GCC supports the other language, users may find it inconvenient to have
282 to install the compiler for that other language in order to build your
283 program.  For example, if you write your program in C++, people will
284 have to install the GNU C++ compiler in order to compile your program.
285
286 C has one other advantage over C++ and other compiled languages: more
287 people know C, so more people will find it easy to read and modify the
288 program if it is written in C.
289
290 So in general it is much better to use C, rather than the
291 comparable alternatives.
292
293 But there are two exceptions to that conclusion:
294
295 @itemize @bullet
296 @item
297 It is no problem to use another language to write a tool specifically
298 intended for use with that language.  That is because the only people
299 who want to build the tool will be those who have installed the other
300 language anyway.
301
302 @item
303 If an application is of interest only to a narrow part of the community,
304 then the question of which language it is written in has less effect on
305 other people, so you may as well please yourself.
306 @end itemize
307
308 Many programs are designed to be extensible: they include an interpreter
309 for a language that is higher level than C.  Often much of the program
310 is written in that language, too.  The Emacs editor pioneered this
311 technique.
312
313 @cindex GUILE
314 The standard extensibility interpreter for GNU software is GUILE, which
315 implements the language Scheme (an especially clean and simple dialect
316 of Lisp).  @uref{http://www.gnu.org/software/guile/}.  We don't reject
317 programs written in other ``scripting languages'' such as Perl and
318 Python, but using GUILE is very important for the overall consistency of
319 the GNU system.
320
321 @node Compatibility
322 @section Compatibility with Other Implementations
323 @cindex compatibility with C and @sc{posix} standards
324 @cindex @sc{posix} compatibility
325
326 With occasional exceptions, utility programs and libraries for GNU
327 should be upward compatible with those in Berkeley Unix, and upward
328 compatible with Standard C if Standard C specifies their
329 behavior, and upward compatible with @sc{posix} if @sc{posix} specifies
330 their behavior.
331
332 When these standards conflict, it is useful to offer compatibility
333 modes for each of them.
334
335 @cindex options for compatibility
336 Standard C and @sc{posix} prohibit many kinds of extensions.  Feel
337 free to make the extensions anyway, and include a @samp{--ansi},
338 @samp{--posix}, or @samp{--compatible} option to turn them off.
339 However, if the extension has a significant chance of breaking any real
340 programs or scripts, then it is not really upward compatible.  So you
341 should try to redesign its interface to make it upward compatible.
342
343 @cindex @code{POSIXLY_CORRECT}, environment variable
344 Many GNU programs suppress extensions that conflict with @sc{posix} if the
345 environment variable @code{POSIXLY_CORRECT} is defined (even if it is
346 defined with a null value).  Please make your program recognize this
347 variable if appropriate.
348
349 When a feature is used only by users (not by programs or command
350 files), and it is done poorly in Unix, feel free to replace it
351 completely with something totally different and better.  (For example,
352 @code{vi} is replaced with Emacs.)  But it is nice to offer a compatible
353 feature as well.  (There is a free @code{vi} clone, so we offer it.)
354
355 Additional useful features are welcome regardless of whether
356 there is any precedent for them.
357
358 @node Using Extensions
359 @section Using Non-standard Features
360 @cindex non-standard extensions
361
362 Many GNU facilities that already exist support a number of convenient
363 extensions over the comparable Unix facilities.  Whether to use these
364 extensions in implementing your program is a difficult question.
365
366 On the one hand, using the extensions can make a cleaner program.
367 On the other hand, people will not be able to build the program
368 unless the other GNU tools are available.  This might cause the
369 program to work on fewer kinds of machines.
370
371 With some extensions, it might be easy to provide both alternatives.
372 For example, you can define functions with a ``keyword'' @code{INLINE}
373 and define that as a macro to expand into either @code{inline} or
374 nothing, depending on the compiler.
375
376 In general, perhaps it is best not to use the extensions if you can
377 straightforwardly do without them, but to use the extensions if they
378 are a big improvement.
379
380 An exception to this rule are the large, established programs (such as
381 Emacs) which run on a great variety of systems.  Using GNU extensions in
382 such programs would make many users unhappy, so we don't do that.
383
384 Another exception is for programs that are used as part of compilation:
385 anything that must be compiled with other compilers in order to
386 bootstrap the GNU compilation facilities.  If these require the GNU
387 compiler, then no one can compile them without having them installed
388 already.  That would be extremely troublesome in certain cases.
389
390 @node Standard C
391 @section Standard C and Pre-Standard C
392 @cindex @sc{ansi} C standard
393
394 1989 Standard C is widespread enough now that it is ok to use its
395 features in new programs.  There is one exception: do not ever use the
396 ``trigraph'' feature of Standard C.
397
398 1999 Standard C is not widespread yet, so please do not require its
399 features in programs.  It is ok to use its features if they are present.
400
401 However, it is easy to support pre-standard compilers in most programs,
402 so if you know how to do that, feel free.  If a program you are
403 maintaining has such support, you should try to keep it working.
404
405 @cindex function prototypes
406 To support pre-standard C, instead of writing function definitions in
407 standard prototype form,
408
409 @example
410 int
411 foo (int x, int y)
412 @dots{}
413 @end example
414
415 @noindent
416 write the definition in pre-standard style like this,
417
418 @example
419 int
420 foo (x, y)
421      int x, y;
422 @dots{}
423 @end example
424
425 @noindent
426 and use a separate declaration to specify the argument prototype:
427
428 @example
429 int foo (int, int);
430 @end example
431
432 You need such a declaration anyway, in a header file, to get the benefit
433 of prototypes in all the files where the function is called.  And once
434 you have the declaration, you normally lose nothing by writing the
435 function definition in the pre-standard style.
436
437 This technique does not work for integer types narrower than @code{int}.
438 If you think of an argument as being of a type narrower than @code{int},
439 declare it as @code{int} instead.
440
441 There are a few special cases where this technique is hard to use.  For
442 example, if a function argument needs to hold the system type
443 @code{dev_t}, you run into trouble, because @code{dev_t} is shorter than
444 @code{int} on some machines; but you cannot use @code{int} instead,
445 because @code{dev_t} is wider than @code{int} on some machines.  There
446 is no type you can safely use on all machines in a non-standard
447 definition.  The only way to support non-standard C and pass such an
448 argument is to check the width of @code{dev_t} using Autoconf and choose
449 the argument type accordingly.  This may not be worth the trouble.
450
451 In order to support pre-standard compilers that do not recognize
452 prototypes, you may want to use a preprocessor macro like this:
453
454 @example
455 /* Declare the prototype for a general external function.  */
456 #if defined (__STDC__) || defined (WINDOWSNT)
457 #define P_(proto) proto
458 #else
459 #define P_(proto) ()
460 #endif
461 @end example
462
463 @node Conditional Compilation
464 @section Conditional Compilation
465
466 When supporting configuration options already known when building your
467 program we prefer using @code{if (... )} over conditional compilation,
468 as in the former case the compiler is able to perform more extensive
469 checking of all possible code paths.
470
471 For example, please write
472
473 @smallexample
474   if (HAS_FOO)
475     ...
476   else
477     ...
478 @end smallexample
479
480 @noindent
481 instead of:
482
483 @smallexample
484   #ifdef HAS_FOO
485     ...
486   #else
487     ...
488   #endif
489 @end smallexample
490
491 A modern compiler such as GCC will generate exactly the same code in
492 both cases, and we have been using similar techniques with good success
493 in several projects.  Of course, the former method assumes that
494 @code{HAS_FOO} is defined as either 0 or 1.
495
496 While this is not a silver bullet solving all portability problems,
497 and is not always appropriate, following this policy would have saved
498 GCC developers many hours, or even days, per year.
499
500 In the case of function-like macros like @code{REVERSIBLE_CC_MODE} in
501 GCC which cannot be simply used in @code{if( ...)} statements, there is
502 an easy workaround.  Simply introduce another macro
503 @code{HAS_REVERSIBLE_CC_MODE} as in the following example:
504
505 @smallexample
506   #ifdef REVERSIBLE_CC_MODE
507   #define HAS_REVERSIBLE_CC_MODE 1
508   #else
509   #define HAS_REVERSIBLE_CC_MODE 0
510   #endif
511 @end smallexample
512
513 @node Program Behavior
514 @chapter Program Behavior for All Programs
515
516 This chapter describes conventions for writing robust
517 software.  It also describes general standards for error messages, the
518 command line interface, and how libraries should behave.
519
520 @menu
521 * Semantics::                   Writing robust programs
522 * Libraries::                   Library behavior
523 * Errors::                      Formatting error messages
524 * User Interfaces::             Standards about interfaces generally
525 * Graphical Interfaces::        Standards for graphical interfaces
526 * Command-Line Interfaces::     Standards for command line interfaces
527 * Option Table::                Table of long options
528 * Memory Usage::                When and how to care about memory needs
529 * File Usage::                  Which files to use, and where
530 @end menu
531
532 @node Semantics
533 @section Writing Robust Programs
534
535 @cindex arbitrary limits on data
536 Avoid arbitrary limits on the length or number of @emph{any} data
537 structure, including file names, lines, files, and symbols, by allocating
538 all data structures dynamically.  In most Unix utilities, ``long lines
539 are silently truncated''.  This is not acceptable in a GNU utility.
540
541 @cindex @code{NUL} characters
542 Utilities reading files should not drop NUL characters, or any other
543 nonprinting characters @emph{including those with codes above 0177}.
544 The only sensible exceptions would be utilities specifically intended
545 for interface to certain types of terminals or printers
546 that can't handle those characters.
547 Whenever possible, try to make programs work properly with
548 sequences of bytes that represent multibyte characters, using encodings
549 such as UTF-8 and others.
550
551 @cindex error messages
552 Check every system call for an error return, unless you know you wish to
553 ignore errors.  Include the system error text (from @code{perror} or
554 equivalent) in @emph{every} error message resulting from a failing
555 system call, as well as the name of the file if any and the name of the
556 utility.  Just ``cannot open foo.c'' or ``stat failed'' is not
557 sufficient.
558
559 @cindex @code{malloc} return value
560 @cindex memory allocation failure
561 Check every call to @code{malloc} or @code{realloc} to see if it
562 returned zero.  Check @code{realloc} even if you are making the block
563 smaller; in a system that rounds block sizes to a power of 2,
564 @code{realloc} may get a different block if you ask for less space.
565
566 In Unix, @code{realloc} can destroy the storage block if it returns
567 zero.  GNU @code{realloc} does not have this bug: if it fails, the
568 original block is unchanged.  Feel free to assume the bug is fixed.  If
569 you wish to run your program on Unix, and wish to avoid lossage in this
570 case, you can use the GNU @code{malloc}.
571
572 You must expect @code{free} to alter the contents of the block that was
573 freed.  Anything you want to fetch from the block, you must fetch before
574 calling @code{free}.
575
576 If @code{malloc} fails in a noninteractive program, make that a fatal
577 error.  In an interactive program (one that reads commands from the
578 user), it is better to abort the command and return to the command
579 reader loop.  This allows the user to kill other processes to free up
580 virtual memory, and then try the command again.
581
582 @cindex command-line arguments, decoding
583 Use @code{getopt_long} to decode arguments, unless the argument syntax
584 makes this unreasonable.
585
586 When static storage is to be written in during program execution, use
587 explicit C code to initialize it.  Reserve C initialized declarations
588 for data that will not be changed.
589 @c ADR: why?
590
591 Try to avoid low-level interfaces to obscure Unix data structures (such
592 as file directories, utmp, or the layout of kernel memory), since these
593 are less likely to work compatibly.  If you need to find all the files
594 in a directory, use @code{readdir} or some other high-level interface.
595 These are supported compatibly by GNU.
596
597 @cindex signal handling
598 The preferred signal handling facilities are the BSD variant of
599 @code{signal}, and the @sc{posix} @code{sigaction} function; the
600 alternative USG @code{signal} interface is an inferior design.
601
602 Nowadays, using the @sc{posix} signal functions may be the easiest way
603 to make a program portable.  If you use @code{signal}, then on GNU/Linux
604 systems running GNU libc version 1, you should include
605 @file{bsd/signal.h} instead of @file{signal.h}, so as to get BSD
606 behavior.  It is up to you whether to support systems where
607 @code{signal} has only the USG behavior, or give up on them.
608
609 @cindex impossible conditions
610 In error checks that detect ``impossible'' conditions, just abort.
611 There is usually no point in printing any message.  These checks
612 indicate the existence of bugs.  Whoever wants to fix the bugs will have
613 to read the source code and run a debugger.  So explain the problem with
614 comments in the source.  The relevant data will be in variables, which
615 are easy to examine with the debugger, so there is no point moving them
616 elsewhere.
617
618 Do not use a count of errors as the exit status for a program.
619 @emph{That does not work}, because exit status values are limited to 8
620 bits (0 through 255).  A single run of the program might have 256
621 errors; if you try to return 256 as the exit status, the parent process
622 will see 0 as the status, and it will appear that the program succeeded.
623
624 @cindex temporary files
625 @cindex @code{TMPDIR} environment variable
626 If you make temporary files, check the @code{TMPDIR} environment
627 variable; if that variable is defined, use the specified directory
628 instead of @file{/tmp}.
629
630 In addition, be aware that there is a possible security problem when
631 creating temporary files in world-writable directories.  In C, you can
632 avoid this problem by creating temporary files in this manner:
633
634 @example
635 fd = open(filename, O_WRONLY | O_CREAT | O_EXCL, 0600);
636 @end example
637
638 @noindent
639 or by using the @code{mkstemps} function from libiberty.
640
641 In bash, use @code{set -C} to avoid this problem.
642
643 @node Libraries
644 @section Library Behavior
645 @cindex libraries
646
647 Try to make library functions reentrant.  If they need to do dynamic
648 storage allocation, at least try to avoid any nonreentrancy aside from
649 that of @code{malloc} itself.
650
651 Here are certain name conventions for libraries, to avoid name
652 conflicts.
653
654 Choose a name prefix for the library, more than two characters long.
655 All external function and variable names should start with this
656 prefix.  In addition, there should only be one of these in any given
657 library member.  This usually means putting each one in a separate
658 source file.
659
660 An exception can be made when two external symbols are always used
661 together, so that no reasonable program could use one without the
662 other; then they can both go in the same file.
663
664 External symbols that are not documented entry points for the user
665 should have names beginning with @samp{_}.  The @samp{_} should be
666 followed by the chosen name prefix for the library, to prevent
667 collisions with other libraries.  These can go in the same files with
668 user entry points if you like.
669
670 Static functions and variables can be used as you like and need not
671 fit any naming convention.
672
673 @node Errors
674 @section Formatting Error Messages
675 @cindex formatting error messages
676 @cindex error messages, formatting
677
678 Error messages from compilers should look like this:
679
680 @example
681 @var{source-file-name}:@var{lineno}: @var{message}
682 @end example
683
684 @noindent
685 If you want to mention the column number, use one of these formats:
686
687 @example
688 @var{source-file-name}:@var{lineno}:@var{column}: @var{message}
689 @var{source-file-name}:@var{lineno}.@var{column}: @var{message}   
690
691 @end example
692
693 @noindent
694 Line numbers should start from 1 at the beginning of the file, and
695 column numbers should start from 1 at the beginning of the line.  (Both
696 of these conventions are chosen for compatibility.)  Calculate column
697 numbers assuming that space and all ASCII printing characters have
698 equal width, and assuming tab stops every 8 columns.
699
700 The error message can also give both the starting and ending positions
701 of the erroneous text.  There are several formats so that you can
702 avoid redundant information such as a duplicate line number.
703 Here are the possible formats:
704
705 @example
706 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{lineno-2}.@var{column-2}: @var{message}
707 @var{source-file-name}:@var{lineno-1}.@var{column-1}-@var{column-2}: @var{message}
708 @var{source-file-name}:@var{lineno-1}-@var{lineno-2}: @var{message}
709 @end example
710
711 @noindent
712 When an error is spread over several files, you can use this format:
713
714 @example
715 @var{file-1}:@var{lineno-1}.@var{column-1}-@var{file-2}:@var{lineno-2}.@var{column-2}: @var{message}
716 @end example
717
718 Error messages from other noninteractive programs should look like this:
719
720 @example
721 @var{program}:@var{source-file-name}:@var{lineno}: @var{message}
722 @end example
723
724 @noindent
725 when there is an appropriate source file, or like this:
726
727 @example
728 @var{program}: @var{message}
729 @end example
730
731 @noindent
732 when there is no relevant source file.
733
734 If you want to mention the column number, use this format:
735
736 @example
737 @var{program}:@var{source-file-name}:@var{lineno}:@var{column}: @var{message}
738 @end example
739
740 In an interactive program (one that is reading commands from a
741 terminal), it is better not to include the program name in an error
742 message.  The place to indicate which program is running is in the
743 prompt or with the screen layout.  (When the same program runs with
744 input from a source other than a terminal, it is not interactive and
745 would do best to print error messages using the noninteractive style.)
746
747 The string @var{message} should not begin with a capital letter when
748 it follows a program name and/or file name, because that isn't the
749 beginning of a sentence.  (The sentence conceptually starts at the
750 beginning of the line.)  Also, it should not end with a period.
751
752 Error messages from interactive programs, and other messages such as
753 usage messages, should start with a capital letter.  But they should not
754 end with a period.
755
756 @node User Interfaces
757 @section Standards for Interfaces Generally
758
759 @cindex program name and its behavior
760 @cindex behavior, dependent on program's name
761 Please don't make the behavior of a utility depend on the name used
762 to invoke it.  It is useful sometimes to make a link to a utility
763 with a different name, and that should not change what it does.
764
765 Instead, use a run time option or a compilation switch or both
766 to select among the alternate behaviors.
767
768 @cindex output device and program's behavior
769 Likewise, please don't make the behavior of the program depend on the
770 type of output device it is used with.  Device independence is an
771 important principle of the system's design; do not compromise it merely
772 to save someone from typing an option now and then.  (Variation in error
773 message syntax when using a terminal is ok, because that is a side issue
774 that people do not depend on.)
775
776 If you think one behavior is most useful when the output is to a
777 terminal, and another is most useful when the output is a file or a
778 pipe, then it is usually best to make the default behavior the one that
779 is useful with output to a terminal, and have an option for the other
780 behavior.
781
782 Compatibility requires certain programs to depend on the type of output
783 device.  It would be disastrous if @code{ls} or @code{sh} did not do so
784 in the way all users expect.  In some of these cases, we supplement the
785 program with a preferred alternate version that does not depend on the
786 output device type.  For example, we provide a @code{dir} program much
787 like @code{ls} except that its default output format is always
788 multi-column format.
789
790 @node Graphical Interfaces
791 @section Standards for Graphical Interfaces
792 @cindex graphical user interface
793
794 @cindex gtk+
795 When you write a program that provides a graphical user interface,
796 please make it work with X Windows and the GTK+ toolkit unless the
797 functionality specifically requires some alternative (for example,
798 ``displaying jpeg images while in console mode'').
799
800 In addition, please provide a command-line interface to control the
801 functionality.  (In many cases, the graphical user interface can be a
802 separate program which invokes the command-line program.)  This is
803 so that the same jobs can be done from scripts.
804
805 @cindex corba
806 @cindex gnome
807 Please also consider providing a CORBA interface (for use from GNOME), a
808 library interface (for use from C), and perhaps a keyboard-driven
809 console interface (for use by users from console mode).  Once you are
810 doing the work to provide the functionality and the graphical interface,
811 these won't be much extra work.
812
813 @node Command-Line Interfaces
814 @section Standards for Command Line Interfaces
815 @cindex command-line interface
816
817 @findex getopt
818 It is a good idea to follow the @sc{posix} guidelines for the
819 command-line options of a program.  The easiest way to do this is to use
820 @code{getopt} to parse them.  Note that the GNU version of @code{getopt}
821 will normally permit options anywhere among the arguments unless the
822 special argument @samp{--} is used.  This is not what @sc{posix}
823 specifies; it is a GNU extension.
824
825 @cindex long-named options
826 Please define long-named options that are equivalent to the
827 single-letter Unix-style options.  We hope to make GNU more user
828 friendly this way.  This is easy to do with the GNU function
829 @code{getopt_long}.
830
831 One of the advantages of long-named options is that they can be
832 consistent from program to program.  For example, users should be able
833 to expect the ``verbose'' option of any GNU program which has one, to be
834 spelled precisely @samp{--verbose}.  To achieve this uniformity, look at
835 the table of common long-option names when you choose the option names
836 for your program (@pxref{Option Table}).
837
838 It is usually a good idea for file names given as ordinary arguments to
839 be input files only; any output files would be specified using options
840 (preferably @samp{-o} or @samp{--output}).  Even if you allow an output
841 file name as an ordinary argument for compatibility, try to provide an
842 option as another way to specify it.  This will lead to more consistency
843 among GNU utilities, and fewer idiosyncracies for users to remember.
844
845 @cindex standard command-line options
846 @cindex options, standard command-line
847 @cindex CGI programs, standard options for
848 @cindex PATH_INFO, specifying standard options as
849 All programs should support two standard options: @samp{--version}
850 and @samp{--help}.  CGI programs should accept these as command-line
851 options, and also if given as the @env{PATH_INFO}; for instance,
852 visiting @url{http://example.org/p.cgi/--help} in a browser should
853 output the same information as inokving @samp{p.cgi --help} from the
854 command line.
855
856 @table @code
857 @cindex @samp{--version} option
858 @item --version
859 This option should direct the program to print information about its name,
860 version, origin and legal status, all on standard output, and then exit
861 successfully.  Other options and arguments should be ignored once this
862 is seen, and the program should not perform its normal function.
863
864 @cindex canonical name of a program
865 @cindex program's canonical name
866 The first line is meant to be easy for a program to parse; the version
867 number proper starts after the last space.  In addition, it contains
868 the canonical name for this program, in this format:
869
870 @example
871 GNU Emacs 19.30
872 @end example
873
874 @noindent
875 The program's name should be a constant string; @emph{don't} compute it
876 from @code{argv[0]}.  The idea is to state the standard or canonical
877 name for the program, not its file name.  There are other ways to find
878 out the precise file name where a command is found in @code{PATH}.
879
880 If the program is a subsidiary part of a larger package, mention the
881 package name in parentheses, like this:
882
883 @example
884 emacsserver (GNU Emacs) 19.30
885 @end example
886
887 @noindent
888 If the package has a version number which is different from this
889 program's version number, you can mention the package version number
890 just before the close-parenthesis.
891
892 If you @strong{need} to mention the version numbers of libraries which
893 are distributed separately from the package which contains this program,
894 you can do so by printing an additional line of version info for each
895 library you want to mention.  Use the same format for these lines as for
896 the first line.
897
898 Please do not mention all of the libraries that the program uses ``just
899 for completeness''---that would produce a lot of unhelpful clutter.
900 Please mention library version numbers only if you find in practice that
901 they are very important to you in debugging.
902
903 The following line, after the version number line or lines, should be a
904 copyright notice.  If more than one copyright notice is called for, put
905 each on a separate line.
906
907 Next should follow a brief statement that the program is free software,
908 and that users are free to copy and change it on certain conditions.  If
909 the program is covered by the GNU GPL, say so here.  Also mention that
910 there is no warranty, to the extent permitted by law.
911
912 It is ok to finish the output with a list of the major authors of the
913 program, as a way of giving credit.
914
915 Here's an example of output that follows these rules:
916
917 @smallexample
918 GNU Emacs 19.34.5
919 Copyright (C) 1996 Free Software Foundation, Inc.
920 GNU Emacs comes with NO WARRANTY,
921 to the extent permitted by law.
922 You may redistribute copies of GNU Emacs
923 under the terms of the GNU General Public License.
924 For more information about these matters,
925 see the files named COPYING.
926 @end smallexample
927
928 You should adapt this to your program, of course, filling in the proper
929 year, copyright holder, name of program, and the references to
930 distribution terms, and changing the rest of the wording as necessary.
931
932 This copyright notice only needs to mention the most recent year in
933 which changes were made---there's no need to list the years for previous
934 versions' changes.  You don't have to mention the name of the program in
935 these notices, if that is inconvenient, since it appeared in the first
936 line.
937
938 Translations of the above lines must preserve the validity of the
939 copyright notices (@pxref{Internationalization}).  If the translation's
940 character set supports it, the @samp{(C)} should be replaced with the
941 copyright symbol, as follows:
942
943 @ifinfo 
944 (the official copyright symbol, which is the letter C in a circle); 
945 @end ifinfo 
946 @ifnotinfo 
947 @copyright{}
948 @end ifnotinfo 
949
950 Write the word ``Copyright'' exactly like that, in English.  Do not
951 translate it into another language.  International treaties recognize
952 the English word ``Copyright''; translations into other languages do not
953 have legal significance.
954
955
956 @cindex @samp{--help} option
957 @item --help
958 This option should output brief documentation for how to invoke the
959 program, on standard output, then exit successfully.  Other options and
960 arguments should be ignored once this is seen, and the program should
961 not perform its normal function.
962
963 @cindex address for bug reports
964 @cindex bug reports
965 Near the end of the @samp{--help} option's output there should be a line
966 that says where to mail bug reports.  It should have this format:
967
968 @example
969 Report bugs to @var{mailing-address}.
970 @end example
971 @end table
972
973 @node Option Table
974 @section Table of Long Options
975 @cindex long option names
976 @cindex table of long options
977
978 Here is a table of long options used by GNU programs.  It is surely
979 incomplete, but we aim to list all the options that a new program might
980 want to be compatible with.  If you use names not already in the table,
981 please send @email{bug-standards@@gnu.org} a list of them, with their
982 meanings, so we can update the table.
983
984 @c Please leave newlines between items in this table; it's much easier
985 @c to update when it isn't completely squashed together and unreadable.
986 @c When there is more than one short option for a long option name, put
987 @c a semicolon between the lists of the programs that use them, not a
988 @c period.   --friedman
989
990 @table @samp
991 @item after-date
992 @samp{-N} in @code{tar}.
993
994 @item all
995 @samp{-a} in @code{du}, @code{ls}, @code{nm}, @code{stty}, @code{uname},
996 and @code{unexpand}.
997
998 @item all-text
999 @samp{-a} in @code{diff}.
1000
1001 @item almost-all
1002 @samp{-A} in @code{ls}.
1003
1004 @item append
1005 @samp{-a} in @code{etags}, @code{tee}, @code{time};
1006 @samp{-r} in @code{tar}.
1007
1008 @item archive
1009 @samp{-a} in @code{cp}.
1010
1011 @item archive-name
1012 @samp{-n} in @code{shar}.
1013
1014 @item arglength
1015 @samp{-l} in @code{m4}.
1016
1017 @item ascii
1018 @samp{-a} in @code{diff}.
1019
1020 @item assign
1021 @samp{-v} in @code{gawk}.
1022
1023 @item assume-new
1024 @samp{-W} in Make.
1025
1026 @item assume-old
1027 @samp{-o} in Make.
1028
1029 @item auto-check
1030 @samp{-a} in @code{recode}.
1031
1032 @item auto-pager
1033 @samp{-a} in @code{wdiff}.
1034
1035 @item auto-reference
1036 @samp{-A} in @code{ptx}.
1037
1038 @item avoid-wraps
1039 @samp{-n} in @code{wdiff}.
1040
1041 @item background
1042 For server programs, run in the background.
1043
1044 @item backward-search
1045 @samp{-B} in @code{ctags}.
1046
1047 @item basename
1048 @samp{-f} in @code{shar}.
1049
1050 @item batch
1051 Used in GDB.
1052
1053 @item baud
1054 Used in GDB.
1055
1056 @item before
1057 @samp{-b} in @code{tac}.
1058
1059 @item binary
1060 @samp{-b} in @code{cpio} and @code{diff}.
1061
1062 @item bits-per-code
1063 @samp{-b} in @code{shar}.
1064
1065 @item block-size
1066 Used in @code{cpio} and @code{tar}.
1067
1068 @item blocks
1069 @samp{-b} in @code{head} and @code{tail}.
1070
1071 @item break-file
1072 @samp{-b} in @code{ptx}.
1073
1074 @item brief
1075 Used in various programs to make output shorter.
1076
1077 @item bytes
1078 @samp{-c} in @code{head}, @code{split}, and @code{tail}.
1079
1080 @item c@t{++}
1081 @samp{-C} in @code{etags}.
1082
1083 @item catenate
1084 @samp{-A} in @code{tar}.
1085
1086 @item cd
1087 Used in various programs to specify the directory to use.
1088
1089 @item changes
1090 @samp{-c} in @code{chgrp} and @code{chown}.
1091
1092 @item classify
1093 @samp{-F} in @code{ls}.
1094
1095 @item colons
1096 @samp{-c} in @code{recode}.
1097
1098 @item command
1099 @samp{-c} in @code{su};
1100 @samp{-x} in GDB.
1101
1102 @item compare
1103 @samp{-d} in @code{tar}.
1104
1105 @item compat
1106 Used in @code{gawk}.
1107
1108 @item compress
1109 @samp{-Z} in @code{tar} and @code{shar}.
1110
1111 @item concatenate
1112 @samp{-A} in @code{tar}.
1113
1114 @item confirmation
1115 @samp{-w} in @code{tar}.
1116
1117 @item context
1118 Used in @code{diff}.
1119
1120 @item copyleft
1121 @samp{-W copyleft} in @code{gawk}.
1122
1123 @item copyright
1124 @samp{-C} in @code{ptx}, @code{recode}, and @code{wdiff};
1125 @samp{-W copyright} in @code{gawk}.
1126
1127 @item core
1128 Used in GDB.
1129
1130 @item count
1131 @samp{-q} in @code{who}.
1132
1133 @item count-links
1134 @samp{-l} in @code{du}.
1135
1136 @item create
1137 Used in @code{tar} and @code{cpio}.
1138
1139 @item cut-mark
1140 @samp{-c} in @code{shar}.
1141
1142 @item cxref
1143 @samp{-x} in @code{ctags}.
1144
1145 @item date
1146 @samp{-d} in @code{touch}.
1147
1148 @item debug
1149 @samp{-d} in Make and @code{m4};
1150 @samp{-t} in Bison.
1151
1152 @item define
1153 @samp{-D} in @code{m4}.
1154
1155 @item defines
1156 @samp{-d} in Bison and @code{ctags}.
1157
1158 @item delete
1159 @samp{-D} in @code{tar}.
1160
1161 @item dereference
1162 @samp{-L} in @code{chgrp}, @code{chown}, @code{cpio}, @code{du},
1163 @code{ls}, and @code{tar}.
1164
1165 @item dereference-args
1166 @samp{-D} in @code{du}.
1167
1168 @item device
1169 Specify an I/O device (special file name).
1170
1171 @item diacritics
1172 @samp{-d} in @code{recode}.
1173
1174 @item dictionary-order
1175 @samp{-d} in @code{look}.
1176
1177 @item diff
1178 @samp{-d} in @code{tar}.
1179
1180 @item digits
1181 @samp{-n} in @code{csplit}.
1182
1183 @item directory
1184 Specify the directory to use, in various programs.  In @code{ls}, it
1185 means to show directories themselves rather than their contents.  In
1186 @code{rm} and @code{ln}, it means to not treat links to directories
1187 specially.
1188
1189 @item discard-all
1190 @samp{-x} in @code{strip}.
1191
1192 @item discard-locals
1193 @samp{-X} in @code{strip}.
1194
1195 @item dry-run
1196 @samp{-n} in Make.
1197
1198 @item ed
1199 @samp{-e} in @code{diff}.
1200
1201 @item elide-empty-files
1202 @samp{-z} in @code{csplit}.
1203
1204 @item end-delete
1205 @samp{-x} in @code{wdiff}.
1206
1207 @item end-insert
1208 @samp{-z} in @code{wdiff}.
1209
1210 @item entire-new-file
1211 @samp{-N} in @code{diff}.
1212
1213 @item environment-overrides
1214 @samp{-e} in Make.
1215
1216 @item eof
1217 @samp{-e} in @code{xargs}.
1218
1219 @item epoch
1220 Used in GDB.
1221
1222 @item error-limit
1223 Used in @code{makeinfo}.
1224
1225 @item error-output
1226 @samp{-o} in @code{m4}.
1227
1228 @item escape
1229 @samp{-b} in @code{ls}.
1230
1231 @item exclude-from
1232 @samp{-X} in @code{tar}.
1233
1234 @item exec
1235 Used in GDB.
1236
1237 @item exit
1238 @samp{-x} in @code{xargs}.
1239
1240 @item exit-0
1241 @samp{-e} in @code{unshar}.
1242
1243 @item expand-tabs
1244 @samp{-t} in @code{diff}.
1245
1246 @item expression
1247 @samp{-e} in @code{sed}.
1248
1249 @item extern-only
1250 @samp{-g} in @code{nm}.
1251
1252 @item extract
1253 @samp{-i} in @code{cpio};
1254 @samp{-x} in @code{tar}.
1255
1256 @item faces
1257 @samp{-f} in @code{finger}.
1258
1259 @item fast
1260 @samp{-f} in @code{su}.
1261
1262 @item fatal-warnings
1263 @samp{-E} in @code{m4}.
1264
1265 @item file
1266 @samp{-f} in @code{info}, @code{gawk}, Make, @code{mt}, and @code{tar};
1267 @samp{-n} in @code{sed};
1268 @samp{-r} in @code{touch}.
1269
1270 @item field-separator
1271 @samp{-F} in @code{gawk}.
1272
1273 @item file-prefix
1274 @samp{-b} in Bison.
1275
1276 @item file-type
1277 @samp{-F} in @code{ls}.
1278
1279 @item files-from
1280 @samp{-T} in @code{tar}.
1281
1282 @item fill-column
1283 Used in @code{makeinfo}.
1284
1285 @item flag-truncation
1286 @samp{-F} in @code{ptx}.
1287
1288 @item fixed-output-files
1289 @samp{-y} in Bison.
1290
1291 @item follow
1292 @samp{-f} in @code{tail}.
1293
1294 @item footnote-style
1295 Used in @code{makeinfo}.
1296
1297 @item force
1298 @samp{-f} in @code{cp}, @code{ln}, @code{mv}, and @code{rm}.
1299
1300 @item force-prefix
1301 @samp{-F} in @code{shar}.
1302
1303 @item foreground
1304 For server programs, run in the foreground;
1305 in other words, don't do anything special to run the server
1306 in the background.
1307
1308 @item format
1309 Used in @code{ls}, @code{time}, and @code{ptx}.
1310
1311 @item freeze-state
1312 @samp{-F} in @code{m4}.
1313
1314 @item fullname
1315 Used in GDB.
1316
1317 @item gap-size
1318 @samp{-g} in @code{ptx}.
1319
1320 @item get
1321 @samp{-x} in @code{tar}.
1322
1323 @item graphic
1324 @samp{-i} in @code{ul}.
1325
1326 @item graphics
1327 @samp{-g} in @code{recode}.
1328
1329 @item group
1330 @samp{-g} in @code{install}.
1331
1332 @item gzip
1333 @samp{-z} in @code{tar} and @code{shar}.
1334
1335 @item hashsize
1336 @samp{-H} in @code{m4}.
1337
1338 @item header
1339 @samp{-h} in @code{objdump} and @code{recode}
1340
1341 @item heading
1342 @samp{-H} in @code{who}.
1343
1344 @item help
1345 Used to ask for brief usage information.
1346
1347 @item here-delimiter
1348 @samp{-d} in @code{shar}.
1349
1350 @item hide-control-chars
1351 @samp{-q} in @code{ls}.
1352
1353 @item html
1354 In @code{makeinfo}, output HTML.
1355
1356 @item idle
1357 @samp{-u} in @code{who}.
1358
1359 @item ifdef
1360 @samp{-D} in @code{diff}.
1361
1362 @item ignore
1363 @samp{-I} in @code{ls};
1364 @samp{-x} in @code{recode}.
1365
1366 @item ignore-all-space
1367 @samp{-w} in @code{diff}.
1368
1369 @item ignore-backups
1370 @samp{-B} in @code{ls}.
1371
1372 @item ignore-blank-lines
1373 @samp{-B} in @code{diff}.
1374
1375 @item ignore-case
1376 @samp{-f} in @code{look} and @code{ptx};
1377 @samp{-i} in @code{diff} and @code{wdiff}.
1378
1379 @item ignore-errors
1380 @samp{-i} in Make.
1381
1382 @item ignore-file
1383 @samp{-i} in @code{ptx}.
1384
1385 @item ignore-indentation
1386 @samp{-I} in @code{etags}.
1387
1388 @item ignore-init-file
1389 @samp{-f} in Oleo.
1390
1391 @item ignore-interrupts
1392 @samp{-i} in @code{tee}.
1393
1394 @item ignore-matching-lines
1395 @samp{-I} in @code{diff}.
1396
1397 @item ignore-space-change
1398 @samp{-b} in @code{diff}.
1399
1400 @item ignore-zeros
1401 @samp{-i} in @code{tar}.
1402
1403 @item include
1404 @samp{-i} in @code{etags};
1405 @samp{-I} in @code{m4}.
1406
1407 @item include-dir
1408 @samp{-I} in Make.
1409
1410 @item incremental
1411 @samp{-G} in @code{tar}.
1412
1413 @item info
1414 @samp{-i}, @samp{-l}, and @samp{-m} in Finger.
1415
1416 @item init-file
1417 In some programs, specify the name of the file to read as the user's
1418 init file.
1419
1420 @item initial
1421 @samp{-i} in @code{expand}.
1422
1423 @item initial-tab
1424 @samp{-T} in @code{diff}.
1425
1426 @item inode
1427 @samp{-i} in @code{ls}.
1428
1429 @item interactive
1430 @samp{-i} in @code{cp}, @code{ln}, @code{mv}, @code{rm};
1431 @samp{-e} in @code{m4};
1432 @samp{-p} in @code{xargs};
1433 @samp{-w} in @code{tar}.
1434
1435 @item intermix-type
1436 @samp{-p} in @code{shar}.
1437
1438 @item iso-8601
1439 Used in @code{date}
1440
1441 @item jobs
1442 @samp{-j} in Make.
1443
1444 @item just-print
1445 @samp{-n} in Make.
1446
1447 @item keep-going
1448 @samp{-k} in Make.
1449
1450 @item keep-files
1451 @samp{-k} in @code{csplit}.
1452
1453 @item kilobytes
1454 @samp{-k} in @code{du} and @code{ls}.
1455
1456 @item language
1457 @samp{-l} in @code{etags}.
1458
1459 @item less-mode
1460 @samp{-l} in @code{wdiff}.
1461
1462 @item level-for-gzip
1463 @samp{-g} in @code{shar}.
1464
1465 @item line-bytes
1466 @samp{-C} in @code{split}.
1467
1468 @item lines
1469 Used in @code{split}, @code{head}, and @code{tail}.
1470
1471 @item link
1472 @samp{-l} in @code{cpio}.
1473
1474 @item lint
1475 @itemx lint-old
1476 Used in @code{gawk}.
1477
1478 @item list
1479 @samp{-t} in @code{cpio};
1480 @samp{-l} in @code{recode}.
1481
1482 @item list
1483 @samp{-t} in @code{tar}.
1484
1485 @item literal
1486 @samp{-N} in @code{ls}.
1487
1488 @item load-average
1489 @samp{-l} in Make.
1490
1491 @item login
1492 Used in @code{su}.
1493
1494 @item machine
1495 Used in @code{uname}.
1496
1497 @item macro-name
1498 @samp{-M} in @code{ptx}.
1499
1500 @item mail
1501 @samp{-m} in @code{hello} and @code{uname}.
1502
1503 @item make-directories
1504 @samp{-d} in @code{cpio}.
1505
1506 @item makefile
1507 @samp{-f} in Make.
1508
1509 @item mapped
1510 Used in GDB.
1511
1512 @item max-args
1513 @samp{-n} in @code{xargs}.
1514
1515 @item max-chars
1516 @samp{-n} in @code{xargs}.
1517
1518 @item max-lines
1519 @samp{-l} in @code{xargs}.
1520
1521 @item max-load
1522 @samp{-l} in Make.
1523
1524 @item max-procs
1525 @samp{-P} in @code{xargs}.
1526
1527 @item mesg
1528 @samp{-T} in @code{who}.
1529
1530 @item message
1531 @samp{-T} in @code{who}.
1532
1533 @item minimal
1534 @samp{-d} in @code{diff}.
1535
1536 @item mixed-uuencode
1537 @samp{-M} in @code{shar}.
1538
1539 @item mode
1540 @samp{-m} in @code{install}, @code{mkdir}, and @code{mkfifo}.
1541
1542 @item modification-time
1543 @samp{-m} in @code{tar}.
1544
1545 @item multi-volume
1546 @samp{-M} in @code{tar}.
1547
1548 @item name-prefix
1549 @samp{-a} in Bison.
1550
1551 @item nesting-limit
1552 @samp{-L} in @code{m4}.
1553
1554 @item net-headers
1555 @samp{-a} in @code{shar}.
1556
1557 @item new-file
1558 @samp{-W} in Make.
1559
1560 @item no-builtin-rules
1561 @samp{-r} in Make.
1562
1563 @item no-character-count
1564 @samp{-w} in @code{shar}.
1565
1566 @item no-check-existing
1567 @samp{-x} in @code{shar}.
1568
1569 @item no-common
1570 @samp{-3} in @code{wdiff}.
1571
1572 @item no-create
1573 @samp{-c} in @code{touch}.
1574
1575 @item no-defines
1576 @samp{-D} in @code{etags}.
1577
1578 @item no-deleted
1579 @samp{-1} in @code{wdiff}.
1580
1581 @item no-dereference
1582 @samp{-d} in @code{cp}.
1583
1584 @item no-inserted
1585 @samp{-2} in @code{wdiff}.
1586
1587 @item no-keep-going
1588 @samp{-S} in Make.
1589
1590 @item no-lines
1591 @samp{-l} in Bison.
1592
1593 @item no-piping
1594 @samp{-P} in @code{shar}.
1595
1596 @item no-prof
1597 @samp{-e} in @code{gprof}.
1598
1599 @item no-regex
1600 @samp{-R} in @code{etags}.
1601
1602 @item no-sort
1603 @samp{-p} in @code{nm}.
1604
1605 @item no-splash
1606 Don't print a startup splash screen.
1607
1608 @item no-split
1609 Used in @code{makeinfo}.
1610
1611 @item no-static
1612 @samp{-a} in @code{gprof}.
1613
1614 @item no-time
1615 @samp{-E} in @code{gprof}.
1616
1617 @item no-timestamp
1618 @samp{-m} in @code{shar}.
1619
1620 @item no-validate
1621 Used in @code{makeinfo}.
1622
1623 @item no-wait
1624 Used in @code{emacsclient}.
1625
1626 @item no-warn
1627 Used in various programs to inhibit warnings.
1628
1629 @item node
1630 @samp{-n} in @code{info}.
1631
1632 @item nodename
1633 @samp{-n} in @code{uname}.
1634
1635 @item nonmatching
1636 @samp{-f} in @code{cpio}.
1637
1638 @item nstuff
1639 @samp{-n} in @code{objdump}.
1640
1641 @item null
1642 @samp{-0} in @code{xargs}.
1643
1644 @item number
1645 @samp{-n} in @code{cat}.
1646
1647 @item number-nonblank
1648 @samp{-b} in @code{cat}.
1649
1650 @item numeric-sort
1651 @samp{-n} in @code{nm}.
1652
1653 @item numeric-uid-gid
1654 @samp{-n} in @code{cpio} and @code{ls}.
1655
1656 @item nx
1657 Used in GDB.
1658
1659 @item old-archive
1660 @samp{-o} in @code{tar}.
1661
1662 @item old-file
1663 @samp{-o} in Make.
1664
1665 @item one-file-system
1666 @samp{-l} in @code{tar}, @code{cp}, and @code{du}.
1667
1668 @item only-file
1669 @samp{-o} in @code{ptx}.
1670
1671 @item only-prof
1672 @samp{-f} in @code{gprof}.
1673
1674 @item only-time
1675 @samp{-F} in @code{gprof}.
1676
1677 @item options
1678 @samp{-o} in @code{getopt}, @code{fdlist}, @code{fdmount},
1679 @code{fdmountd}, and @code{fdumount}.
1680
1681 @item output
1682 In various programs, specify the output file name.
1683
1684 @item output-prefix
1685 @samp{-o} in @code{shar}.
1686
1687 @item override
1688 @samp{-o} in @code{rm}.
1689
1690 @item overwrite
1691 @samp{-c} in @code{unshar}.
1692
1693 @item owner
1694 @samp{-o} in @code{install}.
1695
1696 @item paginate
1697 @samp{-l} in @code{diff}.
1698
1699 @item paragraph-indent
1700 Used in @code{makeinfo}.
1701
1702 @item parents
1703 @samp{-p} in @code{mkdir} and @code{rmdir}.
1704
1705 @item pass-all
1706 @samp{-p} in @code{ul}.
1707
1708 @item pass-through
1709 @samp{-p} in @code{cpio}.
1710
1711 @item port
1712 @samp{-P} in @code{finger}.
1713
1714 @item portability
1715 @samp{-c} in @code{cpio} and @code{tar}.
1716
1717 @item posix
1718 Used in @code{gawk}.
1719
1720 @item prefix-builtins
1721 @samp{-P} in @code{m4}.
1722
1723 @item prefix
1724 @samp{-f} in @code{csplit}.
1725
1726 @item preserve
1727 Used in @code{tar} and @code{cp}.
1728
1729 @item preserve-environment
1730 @samp{-p} in @code{su}.
1731
1732 @item preserve-modification-time
1733 @samp{-m} in @code{cpio}.
1734
1735 @item preserve-order
1736 @samp{-s} in @code{tar}.
1737
1738 @item preserve-permissions
1739 @samp{-p} in @code{tar}.
1740
1741 @item print
1742 @samp{-l} in @code{diff}.
1743
1744 @item print-chars
1745 @samp{-L} in @code{cmp}.
1746
1747 @item print-data-base
1748 @samp{-p} in Make.
1749
1750 @item print-directory
1751 @samp{-w} in Make.
1752
1753 @item print-file-name
1754 @samp{-o} in @code{nm}.
1755
1756 @item print-symdefs
1757 @samp{-s} in @code{nm}.
1758
1759 @item printer
1760 @samp{-p} in @code{wdiff}.
1761
1762 @item prompt
1763 @samp{-p} in @code{ed}.
1764
1765 @item proxy
1766 Specify an HTTP proxy.
1767
1768 @item query-user
1769 @samp{-X} in @code{shar}.
1770
1771 @item question
1772 @samp{-q} in Make.
1773
1774 @item quiet
1775 Used in many programs to inhibit the usual output.  Every
1776 program accepting @samp{--quiet} should accept @samp{--silent} as a
1777 synonym.
1778
1779 @item quiet-unshar
1780 @samp{-Q} in @code{shar}
1781
1782 @item quote-name
1783 @samp{-Q} in @code{ls}.
1784
1785 @item rcs
1786 @samp{-n} in @code{diff}.
1787
1788 @item re-interval
1789 Used in @code{gawk}.
1790
1791 @item read-full-blocks
1792 @samp{-B} in @code{tar}.
1793
1794 @item readnow
1795 Used in GDB.
1796
1797 @item recon
1798 @samp{-n} in Make.
1799
1800 @item record-number
1801 @samp{-R} in @code{tar}.
1802
1803 @item recursive
1804 Used in @code{chgrp}, @code{chown}, @code{cp}, @code{ls}, @code{diff},
1805 and @code{rm}.
1806
1807 @item reference-limit
1808 Used in @code{makeinfo}.
1809
1810 @item references
1811 @samp{-r} in @code{ptx}.
1812
1813 @item regex
1814 @samp{-r} in @code{tac} and @code{etags}.
1815
1816 @item release
1817 @samp{-r} in @code{uname}.
1818
1819 @item reload-state
1820 @samp{-R} in @code{m4}.
1821
1822 @item relocation
1823 @samp{-r} in @code{objdump}.
1824
1825 @item rename
1826 @samp{-r} in @code{cpio}.
1827
1828 @item replace
1829 @samp{-i} in @code{xargs}.
1830
1831 @item report-identical-files
1832 @samp{-s} in @code{diff}.
1833
1834 @item reset-access-time
1835 @samp{-a} in @code{cpio}.
1836
1837 @item reverse
1838 @samp{-r} in @code{ls} and @code{nm}.
1839
1840 @item reversed-ed
1841 @samp{-f} in @code{diff}.
1842
1843 @item right-side-defs
1844 @samp{-R} in @code{ptx}.
1845
1846 @item same-order
1847 @samp{-s} in @code{tar}.
1848
1849 @item same-permissions
1850 @samp{-p} in @code{tar}.
1851
1852 @item save
1853 @samp{-g} in @code{stty}.
1854
1855 @item se
1856 Used in GDB.
1857
1858 @item sentence-regexp
1859 @samp{-S} in @code{ptx}.
1860
1861 @item separate-dirs
1862 @samp{-S} in @code{du}.
1863
1864 @item separator
1865 @samp{-s} in @code{tac}.
1866
1867 @item sequence
1868 Used by @code{recode} to chose files or pipes for sequencing passes.
1869
1870 @item shell
1871 @samp{-s} in @code{su}.
1872
1873 @item show-all
1874 @samp{-A} in @code{cat}.
1875
1876 @item show-c-function
1877 @samp{-p} in @code{diff}.
1878
1879 @item show-ends
1880 @samp{-E} in @code{cat}.
1881
1882 @item show-function-line
1883 @samp{-F} in @code{diff}.
1884
1885 @item show-tabs
1886 @samp{-T} in @code{cat}.
1887
1888 @item silent
1889 Used in many programs to inhibit the usual output.
1890 Every program accepting
1891 @samp{--silent} should accept @samp{--quiet} as a synonym.
1892
1893 @item size
1894 @samp{-s} in @code{ls}.
1895
1896 @item socket
1897 Specify a file descriptor for a network server to use for its socket,
1898 instead of opening and binding a new socket.  This provides a way to
1899 run, in a nonpriveledged process, a server that normally needs a
1900 reserved port number.
1901
1902 @item sort
1903 Used in @code{ls}.
1904
1905 @item source
1906 @samp{-W source} in @code{gawk}.
1907
1908 @item sparse
1909 @samp{-S} in @code{tar}.
1910
1911 @item speed-large-files
1912 @samp{-H} in @code{diff}.
1913
1914 @item split-at
1915 @samp{-E} in @code{unshar}.
1916
1917 @item split-size-limit
1918 @samp{-L} in @code{shar}.
1919
1920 @item squeeze-blank
1921 @samp{-s} in @code{cat}.
1922
1923 @item start-delete
1924 @samp{-w} in @code{wdiff}.
1925
1926 @item start-insert
1927 @samp{-y} in @code{wdiff}.
1928
1929 @item starting-file
1930 Used in @code{tar} and @code{diff} to specify which file within
1931 a directory to start processing with.
1932
1933 @item statistics
1934 @samp{-s} in @code{wdiff}.
1935
1936 @item stdin-file-list
1937 @samp{-S} in @code{shar}.
1938
1939 @item stop
1940 @samp{-S} in Make.
1941
1942 @item strict
1943 @samp{-s} in @code{recode}.
1944
1945 @item strip
1946 @samp{-s} in @code{install}.
1947
1948 @item strip-all
1949 @samp{-s} in @code{strip}.
1950
1951 @item strip-debug
1952 @samp{-S} in @code{strip}.
1953
1954 @item submitter
1955 @samp{-s} in @code{shar}.
1956
1957 @item suffix
1958 @samp{-S} in @code{cp}, @code{ln}, @code{mv}.
1959
1960 @item suffix-format
1961 @samp{-b} in @code{csplit}.
1962
1963 @item sum
1964 @samp{-s} in @code{gprof}.
1965
1966 @item summarize
1967 @samp{-s} in @code{du}.
1968
1969 @item symbolic
1970 @samp{-s} in @code{ln}.
1971
1972 @item symbols
1973 Used in GDB and @code{objdump}.
1974
1975 @item synclines
1976 @samp{-s} in @code{m4}.
1977
1978 @item sysname
1979 @samp{-s} in @code{uname}.
1980
1981 @item tabs
1982 @samp{-t} in @code{expand} and @code{unexpand}.
1983
1984 @item tabsize
1985 @samp{-T} in @code{ls}.
1986
1987 @item terminal
1988 @samp{-T} in @code{tput} and @code{ul}.
1989 @samp{-t} in @code{wdiff}.
1990
1991 @item text
1992 @samp{-a} in @code{diff}.
1993
1994 @item text-files
1995 @samp{-T} in @code{shar}.
1996
1997 @item time
1998 Used in @code{ls} and @code{touch}.
1999
2000 @item timeout
2001 Specify how long to wait before giving up on some operation.
2002
2003 @item to-stdout
2004 @samp{-O} in @code{tar}.
2005
2006 @item total
2007 @samp{-c} in @code{du}.
2008
2009 @item touch
2010 @samp{-t} in Make, @code{ranlib}, and @code{recode}.
2011
2012 @item trace
2013 @samp{-t} in @code{m4}.
2014
2015 @item traditional
2016 @samp{-t} in @code{hello};
2017 @samp{-W traditional} in @code{gawk};
2018 @samp{-G} in @code{ed}, @code{m4}, and @code{ptx}.
2019
2020 @item tty
2021 Used in GDB.
2022
2023 @item typedefs
2024 @samp{-t} in @code{ctags}.
2025
2026 @item typedefs-and-c++
2027 @samp{-T} in @code{ctags}.
2028
2029 @item typeset-mode
2030 @samp{-t} in @code{ptx}.
2031
2032 @item uncompress
2033 @samp{-z} in @code{tar}.
2034
2035 @item unconditional
2036 @samp{-u} in @code{cpio}.
2037
2038 @item undefine
2039 @samp{-U} in @code{m4}.
2040
2041 @item undefined-only
2042 @samp{-u} in @code{nm}.
2043
2044 @item update
2045 @samp{-u} in @code{cp}, @code{ctags}, @code{mv}, @code{tar}.
2046
2047 @item usage
2048 Used in @code{gawk}; same as @samp{--help}.
2049
2050 @item uuencode
2051 @samp{-B} in @code{shar}.
2052
2053 @item vanilla-operation
2054 @samp{-V} in @code{shar}.
2055
2056 @item verbose
2057 Print more information about progress.  Many programs support this.
2058
2059 @item verify
2060 @samp{-W} in @code{tar}.
2061
2062 @item version
2063 Print the version number.
2064
2065 @item version-control
2066 @samp{-V} in @code{cp}, @code{ln}, @code{mv}.
2067
2068 @item vgrind
2069 @samp{-v} in @code{ctags}.
2070
2071 @item volume
2072 @samp{-V} in @code{tar}.
2073
2074 @item what-if
2075 @samp{-W} in Make.
2076
2077 @item whole-size-limit
2078 @samp{-l} in @code{shar}.
2079
2080 @item width
2081 @samp{-w} in @code{ls} and @code{ptx}.
2082
2083 @item word-regexp
2084 @samp{-W} in @code{ptx}.
2085
2086 @item writable
2087 @samp{-T} in @code{who}.
2088
2089 @item zeros
2090 @samp{-z} in @code{gprof}.
2091 @end table
2092
2093 @node Memory Usage
2094 @section Memory Usage
2095 @cindex memory usage
2096
2097 If a program typically uses just a few meg of memory, don't bother making any
2098 effort to reduce memory usage.  For example, if it is impractical for
2099 other reasons to operate on files more than a few meg long, it is
2100 reasonable to read entire input files into core to operate on them.
2101
2102 However, for programs such as @code{cat} or @code{tail}, that can
2103 usefully operate on very large files, it is important to avoid using a
2104 technique that would artificially limit the size of files it can handle.
2105 If a program works by lines and could be applied to arbitrary
2106 user-supplied input files, it should keep only a line in memory, because
2107 this is not very hard and users will want to be able to operate on input
2108 files that are bigger than will fit in core all at once.
2109
2110 If your program creates complicated data structures, just make them in
2111 core and give a fatal error if @code{malloc} returns zero.
2112
2113 @node File Usage
2114 @section File Usage
2115 @cindex file usage
2116
2117 Programs should be prepared to operate when @file{/usr} and @file{/etc}
2118 are read-only file systems.  Thus, if the program manages log files,
2119 lock files, backup files, score files, or any other files which are
2120 modified for internal purposes, these files should not be stored in
2121 @file{/usr} or @file{/etc}.
2122
2123 There are two exceptions.  @file{/etc} is used to store system
2124 configuration information; it is reasonable for a program to modify
2125 files in @file{/etc} when its job is to update the system configuration.
2126 Also, if the user explicitly asks to modify one file in a directory, it
2127 is reasonable for the program to store other files in the same
2128 directory.
2129
2130 @node Writing C
2131 @chapter Making The Best Use of C
2132
2133 This chapter provides advice on how best to use the C language
2134 when writing GNU software.
2135
2136 @menu
2137 * Formatting::                  Formatting Your Source Code
2138 * Comments::                    Commenting Your Work
2139 * Syntactic Conventions::       Clean Use of C Constructs
2140 * Names::                       Naming Variables, Functions, and Files
2141 * System Portability::          Portability between different operating systems
2142 * CPU Portability::             Supporting the range of CPU types
2143 * System Functions::            Portability and ``standard'' library functions
2144 * Internationalization::        Techniques for internationalization
2145 * Mmap::                        How you can safely use @code{mmap}.
2146 @end menu
2147
2148 @node Formatting
2149 @section Formatting Your Source Code
2150 @cindex formatting source code
2151
2152 @cindex open brace
2153 @cindex braces, in C source
2154 It is important to put the open-brace that starts the body of a C
2155 function in column zero, and avoid putting any other open-brace or
2156 open-parenthesis or open-bracket in column zero.  Several tools look
2157 for open-braces in column zero to find the beginnings of C functions.
2158 These tools will not work on code not formatted that way.
2159
2160 It is also important for function definitions to start the name of the
2161 function in column zero.  This helps people to search for function
2162 definitions, and may also help certain tools recognize them.  Thus,
2163 the proper format is this:
2164
2165 @example
2166 static char *
2167 concat (s1, s2)        /* Name starts in column zero here */
2168      char *s1, *s2;
2169 @{                     /* Open brace in column zero here */
2170   @dots{}
2171 @}
2172 @end example
2173
2174 @noindent
2175 or, if you want to use Standard C syntax, format the definition like
2176 this:
2177
2178 @example
2179 static char *
2180 concat (char *s1, char *s2)
2181 @{
2182   @dots{}
2183 @}
2184 @end example
2185
2186 In Standard C, if the arguments don't fit nicely on one line,
2187 split it like this:
2188
2189 @example
2190 int
2191 lots_of_args (int an_integer, long a_long, short a_short,
2192               double a_double, float a_float)
2193 @dots{}
2194 @end example
2195
2196 The rest of this section gives our recommendations for other aspects of
2197 C formatting style, which is also the default style of the @code{indent}
2198 program in version 1.2 and newer.  It corresponds to the options
2199
2200 @smallexample
2201 -nbad -bap -nbc -bbo -bl -bli2 -bls -ncdb -nce -cp1 -cs -di2
2202 -ndj -nfc1 -nfca -hnl -i2 -ip5 -lp -pcs -psl -nsc -nsob
2203 @end smallexample
2204
2205 We don't think of these recommendations as requirements, because it
2206 causes no problems for users if two different programs have different
2207 formatting styles.
2208
2209 But whatever style you use, please use it consistently, since a mixture
2210 of styles within one program tends to look ugly.  If you are
2211 contributing changes to an existing program, please follow the style of
2212 that program.
2213
2214 For the body of the function, our recommended style looks like this:
2215
2216 @example
2217 if (x < foo (y, z))
2218   haha = bar[4] + 5;
2219 else
2220   @{
2221     while (z)
2222       @{
2223         haha += foo (z, z);
2224         z--;
2225       @}
2226     return ++x + bar ();
2227   @}
2228 @end example
2229
2230 @cindex spaces before open-paren
2231 We find it easier to read a program when it has spaces before the
2232 open-parentheses and after the commas.  Especially after the commas.
2233
2234 When you split an expression into multiple lines, split it
2235 before an operator, not after one.  Here is the right way:
2236
2237 @cindex expressions, splitting
2238 @example
2239 if (foo_this_is_long && bar > win (x, y, z)
2240     && remaining_condition)
2241 @end example
2242
2243 Try to avoid having two operators of different precedence at the same
2244 level of indentation.  For example, don't write this:
2245
2246 @example
2247 mode = (inmode[j] == VOIDmode
2248         || GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])
2249         ? outmode[j] : inmode[j]);
2250 @end example
2251
2252 Instead, use extra parentheses so that the indentation shows the nesting:
2253
2254 @example
2255 mode = ((inmode[j] == VOIDmode
2256          || (GET_MODE_SIZE (outmode[j]) > GET_MODE_SIZE (inmode[j])))
2257         ? outmode[j] : inmode[j]);
2258 @end example
2259
2260 Insert extra parentheses so that Emacs will indent the code properly.
2261 For example, the following indentation looks nice if you do it by hand,
2262
2263 @example
2264 v = rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2265     + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000;
2266 @end example
2267
2268 @noindent
2269 but Emacs would alter it.  Adding a set of parentheses produces
2270 something that looks equally nice, and which Emacs will preserve:
2271
2272 @example
2273 v = (rup->ru_utime.tv_sec*1000 + rup->ru_utime.tv_usec/1000
2274      + rup->ru_stime.tv_sec*1000 + rup->ru_stime.tv_usec/1000);
2275 @end example
2276
2277 Format do-while statements like this:
2278
2279 @example
2280 do
2281   @{
2282     a = foo (a);
2283   @}
2284 while (a > 0);
2285 @end example
2286
2287 @cindex formfeed
2288 @cindex control-L
2289 Please use formfeed characters (control-L) to divide the program into
2290 pages at logical places (but not within a function).  It does not matter
2291 just how long the pages are, since they do not have to fit on a printed
2292 page.  The formfeeds should appear alone on lines by themselves.
2293
2294 @node Comments
2295 @section Commenting Your Work
2296 @cindex commenting
2297
2298 Every program should start with a comment saying briefly what it is for.
2299 Example: @samp{fmt - filter for simple filling of text}.
2300
2301 Please write the comments in a GNU program in English, because English
2302 is the one language that nearly all programmers in all countries can
2303 read.  If you do not write English well, please write comments in
2304 English as well as you can, then ask other people to help rewrite them.
2305 If you can't write comments in English, please find someone to work with
2306 you and translate your comments into English.
2307
2308 Please put a comment on each function saying what the function does,
2309 what sorts of arguments it gets, and what the possible values of
2310 arguments mean and are used for.  It is not necessary to duplicate in
2311 words the meaning of the C argument declarations, if a C type is being
2312 used in its customary fashion.  If there is anything nonstandard about
2313 its use (such as an argument of type @code{char *} which is really the
2314 address of the second character of a string, not the first), or any
2315 possible values that would not work the way one would expect (such as,
2316 that strings containing newlines are not guaranteed to work), be sure
2317 to say so.
2318
2319 Also explain the significance of the return value, if there is one.
2320
2321 Please put two spaces after the end of a sentence in your comments, so
2322 that the Emacs sentence commands will work.  Also, please write
2323 complete sentences and capitalize the first word.  If a lower-case
2324 identifier comes at the beginning of a sentence, don't capitalize it!
2325 Changing the spelling makes it a different identifier.  If you don't
2326 like starting a sentence with a lower case letter, write the sentence
2327 differently (e.g., ``The identifier lower-case is @dots{}'').
2328
2329 The comment on a function is much clearer if you use the argument
2330 names to speak about the argument values.  The variable name itself
2331 should be lower case, but write it in upper case when you are speaking
2332 about the value rather than the variable itself.  Thus, ``the inode
2333 number NODE_NUM'' rather than ``an inode''.
2334
2335 There is usually no purpose in restating the name of the function in
2336 the comment before it, because the reader can see that for himself.
2337 There might be an exception when the comment is so long that the function
2338 itself would be off the bottom of the screen.
2339
2340 There should be a comment on each static variable as well, like this:
2341
2342 @example
2343 /* Nonzero means truncate lines in the display;
2344    zero means continue them.  */
2345 int truncate_lines;
2346 @end example
2347
2348 @cindex conditionals, comments for
2349 @cindex @code{#endif}, commenting
2350 Every @samp{#endif} should have a comment, except in the case of short
2351 conditionals (just a few lines) that are not nested.  The comment should
2352 state the condition of the conditional that is ending, @emph{including
2353 its sense}.  @samp{#else} should have a comment describing the condition
2354 @emph{and sense} of the code that follows.  For example:
2355
2356 @example
2357 @group
2358 #ifdef foo
2359   @dots{}
2360 #else /* not foo */
2361   @dots{}
2362 #endif /* not foo */
2363 @end group
2364 @group
2365 #ifdef foo
2366   @dots{}
2367 #endif /* foo */
2368 @end group
2369 @end example
2370
2371 @noindent
2372 but, by contrast, write the comments this way for a @samp{#ifndef}:
2373
2374 @example
2375 @group
2376 #ifndef foo
2377   @dots{}
2378 #else /* foo */
2379   @dots{}
2380 #endif /* foo */
2381 @end group
2382 @group
2383 #ifndef foo
2384   @dots{}
2385 #endif /* not foo */
2386 @end group
2387 @end example
2388
2389 @node Syntactic Conventions
2390 @section Clean Use of C Constructs
2391 @cindex syntactic conventions
2392
2393 @cindex implicit @code{int}
2394 @cindex function argument, declaring
2395 Please explicitly declare the types of all objects.  For example, you
2396 should explicitly declare all arguments to functions, and you should
2397 declare functions to return @code{int} rather than omitting the
2398 @code{int}.
2399
2400 @cindex compiler warnings
2401 @cindex @samp{-Wall} compiler option
2402 Some programmers like to use the GCC @samp{-Wall} option, and change the
2403 code whenever it issues a warning.  If you want to do this, then do.
2404 Other programmers prefer not to use @samp{-Wall}, because it gives
2405 warnings for valid and legitimate code which they do not want to change.
2406 If you want to do this, then do.  The compiler should be your servant,
2407 not your master.
2408
2409 Declarations of external functions and functions to appear later in the
2410 source file should all go in one place near the beginning of the file
2411 (somewhere before the first function definition in the file), or else
2412 should go in a header file.  Don't put @code{extern} declarations inside
2413 functions.
2414
2415 @cindex temporary variables
2416 It used to be common practice to use the same local variables (with
2417 names like @code{tem}) over and over for different values within one
2418 function.  Instead of doing this, it is better to declare a separate local
2419 variable for each distinct purpose, and give it a name which is
2420 meaningful.  This not only makes programs easier to understand, it also
2421 facilitates optimization by good compilers.  You can also move the
2422 declaration of each local variable into the smallest scope that includes
2423 all its uses.  This makes the program even cleaner.
2424
2425 Don't use local variables or parameters that shadow global identifiers.
2426
2427 @cindex multiple variables in a line
2428 Don't declare multiple variables in one declaration that spans lines.
2429 Start a new declaration on each line, instead.  For example, instead
2430 of this:
2431
2432 @example
2433 @group
2434 int    foo,
2435        bar;
2436 @end group
2437 @end example
2438
2439 @noindent
2440 write either this:
2441
2442 @example
2443 int foo, bar;
2444 @end example
2445
2446 @noindent
2447 or this:
2448
2449 @example
2450 int foo;
2451 int bar;
2452 @end example
2453
2454 @noindent
2455 (If they are global variables, each should have a comment preceding it
2456 anyway.)
2457
2458 When you have an @code{if}-@code{else} statement nested in another
2459 @code{if} statement, always put braces around the @code{if}-@code{else}.
2460 Thus, never write like this:
2461
2462 @example
2463 if (foo)
2464   if (bar)
2465     win ();
2466   else
2467     lose ();
2468 @end example
2469
2470 @noindent
2471 always like this:
2472
2473 @example
2474 if (foo)
2475   @{
2476     if (bar)
2477       win ();
2478     else
2479       lose ();
2480   @}
2481 @end example
2482
2483 If you have an @code{if} statement nested inside of an @code{else}
2484 statement, either write @code{else if} on one line, like this,
2485
2486 @example
2487 if (foo)
2488   @dots{}
2489 else if (bar)
2490   @dots{}
2491 @end example
2492
2493 @noindent
2494 with its @code{then}-part indented like the preceding @code{then}-part,
2495 or write the nested @code{if} within braces like this:
2496
2497 @example
2498 if (foo)
2499   @dots{}
2500 else
2501   @{
2502     if (bar)
2503       @dots{}
2504   @}
2505 @end example
2506
2507 Don't declare both a structure tag and variables or typedefs in the
2508 same declaration.  Instead, declare the structure tag separately
2509 and then use it to declare the variables or typedefs.
2510
2511 Try to avoid assignments inside @code{if}-conditions.  For example,
2512 don't write this:
2513
2514 @example
2515 if ((foo = (char *) malloc (sizeof *foo)) == 0)
2516   fatal ("virtual memory exhausted");
2517 @end example
2518
2519 @noindent
2520 instead, write this:
2521
2522 @example
2523 foo = (char *) malloc (sizeof *foo);
2524 if (foo == 0)
2525   fatal ("virtual memory exhausted");
2526 @end example
2527
2528 @pindex lint
2529 Don't make the program ugly to placate @code{lint}.  Please don't insert any
2530 casts to @code{void}.  Zero without a cast is perfectly fine as a null
2531 pointer constant, except when calling a varargs function.
2532
2533 @node Names
2534 @section Naming Variables, Functions, and Files
2535
2536 @cindex names of variables, functions, and files
2537 The names of global variables and functions in a program serve as
2538 comments of a sort.  So don't choose terse names---instead, look for
2539 names that give useful information about the meaning of the variable or
2540 function.  In a GNU program, names should be English, like other
2541 comments.
2542
2543 Local variable names can be shorter, because they are used only within
2544 one context, where (presumably) comments explain their purpose.
2545
2546 Try to limit your use of abbreviations in symbol names.  It is ok to
2547 make a few abbreviations, explain what they mean, and then use them
2548 frequently, but don't use lots of obscure abbreviations.
2549
2550 Please use underscores to separate words in a name, so that the Emacs
2551 word commands can be useful within them.  Stick to lower case; reserve
2552 upper case for macros and @code{enum} constants, and for name-prefixes
2553 that follow a uniform convention.
2554
2555 For example, you should use names like @code{ignore_space_change_flag};
2556 don't use names like @code{iCantReadThis}.
2557
2558 Variables that indicate whether command-line options have been
2559 specified should be named after the meaning of the option, not after
2560 the option-letter.  A comment should state both the exact meaning of
2561 the option and its letter.  For example,
2562
2563 @example
2564 @group
2565 /* Ignore changes in horizontal whitespace (-b).  */
2566 int ignore_space_change_flag;
2567 @end group
2568 @end example
2569
2570 When you want to define names with constant integer values, use
2571 @code{enum} rather than @samp{#define}.  GDB knows about enumeration
2572 constants.
2573
2574 @cindex file-name limitations
2575 @pindex doschk
2576 You might want to make sure that none of the file names would conflict
2577 the files were loaded onto an MS-DOS file system which shortens the
2578 names.  You can use the program @code{doschk} to test for this.
2579
2580 Some GNU programs were designed to limit themselves to file names of 14
2581 characters or less, to avoid file name conflicts if they are read into
2582 older System V systems.  Please preserve this feature in the existing
2583 GNU programs that have it, but there is no need to do this in new GNU
2584 programs.  @code{doschk} also reports file names longer than 14
2585 characters.
2586
2587 @node System Portability
2588 @section Portability between System Types
2589 @cindex portability, between system types
2590
2591 In the Unix world, ``portability'' refers to porting to different Unix
2592 versions.  For a GNU program, this kind of portability is desirable, but
2593 not paramount.
2594
2595 The primary purpose of GNU software is to run on top of the GNU kernel,
2596 compiled with the GNU C compiler, on various types of @sc{cpu}.  So the
2597 kinds of portability that are absolutely necessary are quite limited.
2598 But it is important to support Linux-based GNU systems, since they
2599 are the form of GNU that is popular.
2600
2601 Beyond that, it is good to support the other free operating systems
2602 (*BSD), and it is nice to support other Unix-like systems if you want
2603 to.  Supporting a variety of Unix-like systems is desirable, although
2604 not paramount.  It is usually not too hard, so you may as well do it.
2605 But you don't have to consider it an obligation, if it does turn out to
2606 be hard.
2607
2608 @pindex autoconf
2609 The easiest way to achieve portability to most Unix-like systems is to
2610 use Autoconf.  It's unlikely that your program needs to know more
2611 information about the host platform than Autoconf can provide, simply
2612 because most of the programs that need such knowledge have already been
2613 written.
2614
2615 Avoid using the format of semi-internal data bases (e.g., directories)
2616 when there is a higher-level alternative (@code{readdir}).
2617
2618 @cindex non-@sc{posix} systems, and portability
2619 As for systems that are not like Unix, such as MSDOS, Windows, the
2620 Macintosh, VMS, and MVS, supporting them is often a lot of work.  When
2621 that is the case, it is better to spend your time adding features that
2622 will be useful on GNU and GNU/Linux, rather than on supporting other
2623 incompatible systems.
2624
2625 If you do support Windows, please do not abbreviate it as ``win''.  In
2626 hacker terminology, calling something a ``win'' is a form of praise.
2627 You're free to praise Microsoft Windows on your own if you want, but
2628 please don't do this in GNU packages.  Instead of abbreviating
2629 ``Windows'' to ``un'', you can write it in full or abbreviate it to
2630 ``woe'' or ``w''.  In GNU Emacs, for instance, we use @samp{w32} in
2631 file names of Windows-specific files, but the macro for Windows
2632 conditionals is called @code{WINDOWSNT}.
2633
2634 It is a good idea to define the ``feature test macro''
2635 @code{_GNU_SOURCE} when compiling your C files.  When you compile on GNU
2636 or GNU/Linux, this will enable the declarations of GNU library extension
2637 functions, and that will usually give you a compiler error message if
2638 you define the same function names in some other way in your program.
2639 (You don't have to actually @emph{use} these functions, if you prefer
2640 to make the program more portable to other systems.)
2641
2642 But whether or not you use these GNU extensions, you should avoid
2643 using their names for any other meanings.  Doing so would make it hard
2644 to move your code into other GNU programs.
2645
2646 @node CPU Portability
2647 @section Portability between @sc{cpu}s
2648
2649 @cindex data types, and portability
2650 @cindex portability, and data types
2651 Even GNU systems will differ because of differences among @sc{cpu}
2652 types---for example, difference in byte ordering and alignment
2653 requirements.  It is absolutely essential to handle these differences.
2654 However, don't make any effort to cater to the possibility that an
2655 @code{int} will be less than 32 bits.  We don't support 16-bit machines
2656 in GNU.
2657
2658 Similarly, don't make any effort to cater to the possibility that
2659 @code{long} will be smaller than predefined types like @code{size_t}.
2660 For example, the following code is ok:
2661
2662 @example
2663 printf ("size = %lu\n", (unsigned long) sizeof array);
2664 printf ("diff = %ld\n", (long) (pointer2 - pointer1));
2665 @end example
2666
2667 1989 Standard C requires this to work, and we know of only one
2668 counterexample: 64-bit programs on Microsoft Windows IA-64.  We will
2669 leave it to those who want to port GNU programs to that environment
2670 to figure out how to do it.
2671
2672 Predefined file-size types like @code{off_t} are an exception: they are
2673 longer than @code{long} on many platforms, so code like the above won't
2674 work with them.  One way to print an @code{off_t} value portably is to
2675 print its digits yourself, one by one.
2676
2677 Don't assume that the address of an @code{int} object is also the
2678 address of its least-significant byte.  This is false on big-endian
2679 machines.  Thus, don't make the following mistake:
2680
2681 @example
2682 int c;
2683 @dots{}
2684 while ((c = getchar()) != EOF)
2685   write(file_descriptor, &c, 1);
2686 @end example
2687
2688 It used to be ok to not worry about the difference between pointers
2689 and integers when passing arguments to functions.  However, on most
2690 modern 64-bit machines pointers are wider than @code{int}.
2691 Conversely, integer types like @code{long long int} and @code{off_t}
2692 are wider than pointers on most modern 32-bit machines.  Hence it's
2693 often better nowadays to use prototypes to define functions whose
2694 argument types are not trivial.
2695
2696 In particular, if functions accept varying argument counts or types
2697 they should be declared using prototypes containing @samp{...} and
2698 defined using @file{stdarg.h}.  For an example of this, please see the
2699 @uref{http://www.gnu.org/software/gnulib/, Gnulib} error module, which
2700 declares and defines the following function:
2701
2702 @example
2703 /* Print a message with `fprintf (stderr, FORMAT, ...)';
2704    if ERRNUM is nonzero, follow it with ": " and strerror (ERRNUM).
2705    If STATUS is nonzero, terminate the program with `exit (STATUS)'.  */
2706
2707 void error (int status, int errnum, const char *format, ...);
2708 @end example
2709
2710 A simple way to use the Gnulib error module is to obtain the two
2711 source files @file{error.c} and @file{error.h} from the Gnulib library
2712 source code repository at
2713 @uref{http://savannah.gnu.org/cgi-bin/viewcvs/gnulib/gnulib/lib/}.
2714 Here's a sample use:
2715
2716 @example
2717 #include "error.h"
2718 #include <errno.h>
2719 #include <stdio.h>
2720
2721 char *program_name = "myprogram";
2722
2723 FILE *
2724 xfopen (char const *name)
2725 @{
2726   FILE *fp = fopen (name, "r");
2727   if (! fp)
2728     error (1, errno, "cannot read %s", name);
2729   return fp;
2730 @}
2731 @end example
2732
2733 @cindex casting pointers to integers
2734 Avoid casting pointers to integers if you can.  Such casts greatly
2735 reduce portability, and in most programs they are easy to avoid.  In the
2736 cases where casting pointers to integers is essential---such as, a Lisp
2737 interpreter which stores type information as well as an address in one
2738 word---you'll have to make explicit provisions to handle different word
2739 sizes.  You will also need to make provision for systems in which the
2740 normal range of addresses you can get from @code{malloc} starts far away
2741 from zero.
2742
2743 @node System Functions
2744 @section Calling System Functions
2745 @cindex library functions, and portability
2746 @cindex portability, and library functions
2747
2748 C implementations differ substantially.  Standard C reduces but does
2749 not eliminate the incompatibilities; meanwhile, many GNU packages still
2750 support pre-standard compilers because this is not hard to do.  This
2751 chapter gives recommendations for how to use the more-or-less standard C
2752 library functions to avoid unnecessary loss of portability.
2753
2754 @itemize @bullet
2755 @item
2756 Don't use the return value of @code{sprintf}.  It returns the number of
2757 characters written on some systems, but not on all systems.
2758
2759 @item
2760 Be aware that @code{vfprintf} is not always available.
2761
2762 @item
2763 @code{main} should be declared to return type @code{int}.  It should
2764 terminate either by calling @code{exit} or by returning the integer
2765 status code; make sure it cannot ever return an undefined value.
2766
2767 @cindex declaration for system functions
2768 @item
2769 Don't declare system functions explicitly.
2770
2771 Almost any declaration for a system function is wrong on some system.
2772 To minimize conflicts, leave it to the system header files to declare
2773 system functions.  If the headers don't declare a function, let it
2774 remain undeclared.
2775
2776 While it may seem unclean to use a function without declaring it, in
2777 practice this works fine for most system library functions on the
2778 systems where this really happens; thus, the disadvantage is only
2779 theoretical.  By contrast, actual declarations have frequently caused
2780 actual conflicts.
2781
2782 @item
2783 If you must declare a system function, don't specify the argument types.
2784 Use an old-style declaration, not a Standard C prototype.  The more you
2785 specify about the function, the more likely a conflict.
2786
2787 @item
2788 In particular, don't unconditionally declare @code{malloc} or
2789 @code{realloc}.
2790
2791 Most GNU programs use those functions just once, in functions
2792 conventionally named @code{xmalloc} and @code{xrealloc}.  These
2793 functions call @code{malloc} and @code{realloc}, respectively, and
2794 check the results.
2795
2796 Because @code{xmalloc} and @code{xrealloc} are defined in your program,
2797 you can declare them in other files without any risk of type conflict.
2798
2799 On most systems, @code{int} is the same length as a pointer; thus, the
2800 calls to @code{malloc} and @code{realloc} work fine.  For the few
2801 exceptional systems (mostly 64-bit machines), you can use
2802 @strong{conditionalized} declarations of @code{malloc} and
2803 @code{realloc}---or put these declarations in configuration files
2804 specific to those systems.
2805
2806 @cindex string library functions
2807 @item
2808 The string functions require special treatment.  Some Unix systems have
2809 a header file @file{string.h}; others have @file{strings.h}.  Neither
2810 file name is portable.  There are two things you can do: use Autoconf to
2811 figure out which file to include, or don't include either file.
2812
2813 @item
2814 If you don't include either strings file, you can't get declarations for
2815 the string functions from the header file in the usual way.
2816
2817 That causes less of a problem than you might think.  The newer standard
2818 string functions should be avoided anyway because many systems still
2819 don't support them.  The string functions you can use are these:
2820
2821 @example
2822 strcpy   strncpy   strcat   strncat
2823 strlen   strcmp    strncmp
2824 strchr   strrchr
2825 @end example
2826
2827 The copy and concatenate functions work fine without a declaration as
2828 long as you don't use their values.  Using their values without a
2829 declaration fails on systems where the width of a pointer differs from
2830 the width of @code{int}, and perhaps in other cases.  It is trivial to
2831 avoid using their values, so do that.
2832
2833 The compare functions and @code{strlen} work fine without a declaration
2834 on most systems, possibly all the ones that GNU software runs on.
2835 You may find it necessary to declare them @strong{conditionally} on a
2836 few systems.
2837
2838 The search functions must be declared to return @code{char *}.  Luckily,
2839 there is no variation in the data type they return.  But there is
2840 variation in their names.  Some systems give these functions the names
2841 @code{index} and @code{rindex}; other systems use the names
2842 @code{strchr} and @code{strrchr}.  Some systems support both pairs of
2843 names, but neither pair works on all systems.
2844
2845 You should pick a single pair of names and use it throughout your
2846 program.  (Nowadays, it is better to choose @code{strchr} and
2847 @code{strrchr} for new programs, since those are the standard
2848 names.)  Declare both of those names as functions returning @code{char
2849 *}.  On systems which don't support those names, define them as macros
2850 in terms of the other pair.  For example, here is what to put at the
2851 beginning of your file (or in a header) if you want to use the names
2852 @code{strchr} and @code{strrchr} throughout:
2853
2854 @example
2855 #ifndef HAVE_STRCHR
2856 #define strchr index
2857 #endif
2858 #ifndef HAVE_STRRCHR
2859 #define strrchr rindex
2860 #endif
2861
2862 char *strchr ();
2863 char *strrchr ();
2864 @end example
2865 @end itemize
2866
2867 Here we assume that @code{HAVE_STRCHR} and @code{HAVE_STRRCHR} are
2868 macros defined in systems where the corresponding functions exist.
2869 One way to get them properly defined is to use Autoconf.
2870
2871 @node Internationalization
2872 @section Internationalization
2873 @cindex internationalization
2874
2875 @pindex gettext
2876 GNU has a library called GNU gettext that makes it easy to translate the
2877 messages in a program into various languages.  You should use this
2878 library in every program.  Use English for the messages as they appear
2879 in the program, and let gettext provide the way to translate them into
2880 other languages.
2881
2882 Using GNU gettext involves putting a call to the @code{gettext} macro
2883 around each string that might need translation---like this:
2884
2885 @example
2886 printf (gettext ("Processing file `%s'..."));
2887 @end example
2888
2889 @noindent
2890 This permits GNU gettext to replace the string @code{"Processing file
2891 `%s'..."} with a translated version.
2892
2893 Once a program uses gettext, please make a point of writing calls to
2894 @code{gettext} when you add new strings that call for translation.
2895
2896 Using GNU gettext in a package involves specifying a @dfn{text domain
2897 name} for the package.  The text domain name is used to separate the
2898 translations for this package from the translations for other packages.
2899 Normally, the text domain name should be the same as the name of the
2900 package---for example, @samp{fileutils} for the GNU file utilities.
2901
2902 @cindex message text, and internationalization
2903 To enable gettext to work well, avoid writing code that makes
2904 assumptions about the structure of words or sentences.  When you want
2905 the precise text of a sentence to vary depending on the data, use two or
2906 more alternative string constants each containing a complete sentences,
2907 rather than inserting conditionalized words or phrases into a single
2908 sentence framework.
2909
2910 Here is an example of what not to do:
2911
2912 @example
2913 printf ("%d file%s processed", nfiles,
2914         nfiles != 1 ? "s" : "");
2915 @end example
2916
2917 @noindent
2918 The problem with that example is that it assumes that plurals are made
2919 by adding `s'.  If you apply gettext to the format string, like this,
2920
2921 @example
2922 printf (gettext ("%d file%s processed"), nfiles,
2923         nfiles != 1 ? "s" : "");
2924 @end example
2925
2926 @noindent
2927 the message can use different words, but it will still be forced to use
2928 `s' for the plural.  Here is a better way:
2929
2930 @example
2931 printf ((nfiles != 1 ? "%d files processed"
2932          : "%d file processed"),
2933         nfiles);
2934 @end example
2935
2936 @noindent
2937 This way, you can apply gettext to each of the two strings
2938 independently:
2939
2940 @example
2941 printf ((nfiles != 1 ? gettext ("%d files processed")
2942          : gettext ("%d file processed")),
2943         nfiles);
2944 @end example
2945
2946 @noindent
2947 This can be any method of forming the plural of the word for ``file'', and
2948 also handles languages that require agreement in the word for
2949 ``processed''.
2950
2951 A similar problem appears at the level of sentence structure with this
2952 code:
2953
2954 @example
2955 printf ("#  Implicit rule search has%s been done.\n",
2956         f->tried_implicit ? "" : " not");
2957 @end example
2958
2959 @noindent
2960 Adding @code{gettext} calls to this code cannot give correct results for
2961 all languages, because negation in some languages requires adding words
2962 at more than one place in the sentence.  By contrast, adding
2963 @code{gettext} calls does the job straightfowardly if the code starts
2964 out like this:
2965
2966 @example
2967 printf (f->tried_implicit
2968         ? "#  Implicit rule search has been done.\n",
2969         : "#  Implicit rule search has not been done.\n");
2970 @end example
2971
2972 @node Mmap
2973 @section Mmap
2974 @findex mmap
2975
2976 Don't assume that @code{mmap} either works on all files or fails
2977 for all files.  It may work on some files and fail on others.
2978
2979 The proper way to use @code{mmap} is to try it on the specific file for
2980 which you want to use it---and if @code{mmap} doesn't work, fall back on
2981 doing the job in another way using @code{read} and @code{write}.
2982
2983 The reason this precaution is needed is that the GNU kernel (the HURD)
2984 provides a user-extensible file system, in which there can be many
2985 different kinds of ``ordinary files.''  Many of them support
2986 @code{mmap}, but some do not.  It is important to make programs handle
2987 all these kinds of files.
2988
2989 @node Documentation
2990 @chapter Documenting Programs
2991 @cindex documentation
2992
2993 A GNU program should ideally come with full free documentation, adequate
2994 for both reference and tutorial purposes.  If the package can be
2995 programmed or extended, the documentation should cover programming or
2996 extending it, as well as just using it.
2997
2998 @menu
2999 * GNU Manuals::                 Writing proper manuals.
3000 * Doc Strings and Manuals::     Compiling doc strings doesn't make a manual.
3001 * Manual Structure Details::    Specific structure conventions.
3002 * License for Manuals::         Writing the distribution terms for a manual.
3003 * Manual Credits::              Giving credit to documentation contributors.
3004 * Printed Manuals::             Mentioning the printed manual.
3005 * NEWS File::                   NEWS files supplement manuals.
3006 * Change Logs::                 Recording Changes
3007 * Man Pages::                   Man pages are secondary.
3008 * Reading other Manuals::       How far you can go in learning
3009                                 from other manuals.
3010 @end menu
3011
3012 @node GNU Manuals
3013 @section GNU Manuals
3014
3015 The preferred document format for the GNU system is the Texinfo
3016 formatting language.  Every GNU package should (ideally) have
3017 documentation in Texinfo both for reference and for learners.  Texinfo
3018 makes it possible to produce a good quality formatted book, using
3019 @TeX{}, and to generate an Info file.  It is also possible to generate
3020 HTML output from Texinfo source.  See the Texinfo manual, either the
3021 hardcopy, or the on-line version available through @code{info} or the
3022 Emacs Info subsystem (@kbd{C-h i}).
3023
3024 Nowadays some other formats such as Docbook and Sgmltexi can be
3025 converted automatically into Texinfo.  It is ok to produce the Texinfo
3026 documentation by conversion this way, as long as it gives good results.
3027
3028 Programmers often find it most natural to structure the documentation
3029 following the structure of the implementation, which they know.  But
3030 this structure is not necessarily good for explaining how to use the
3031 program; it may be irrelevant and confusing for a user.
3032
3033 At every level, from the sentences in a paragraph to the grouping of
3034 topics into separate manuals, the right way to structure documentation
3035 is according to the concepts and questions that a user will have in mind
3036 when reading it.  Sometimes this structure of ideas matches the
3037 structure of the implementation of the software being documented---but
3038 often they are different.  Often the most important part of learning to
3039 write good documentation is learning to notice when you are structuring
3040 the documentation like the implementation, and think about better
3041 alternatives.
3042
3043 For example, each program in the GNU system probably ought to be
3044 documented in one manual; but this does not mean each program should
3045 have its own manual.  That would be following the structure of the
3046 implementation, rather than the structure that helps the user
3047 understand.
3048
3049 Instead, each manual should cover a coherent @emph{topic}.  For example,
3050 instead of a manual for @code{diff} and a manual for @code{diff3}, we
3051 have one manual for ``comparison of files'' which covers both of those
3052 programs, as well as @code{cmp}.  By documenting these programs
3053 together, we can make the whole subject clearer.
3054
3055 The manual which discusses a program should certainly document all of
3056 the program's command-line options and all of its commands.  It should
3057 give examples of their use.  But don't organize the manual as a list
3058 of features.  Instead, organize it logically, by subtopics.  Address
3059 the questions that a user will ask when thinking about the job that
3060 the program does.  Don't just tell the reader what each feature can
3061 do---say what jobs it is good for, and show how to use it for those
3062 jobs.  Explain what is recommended usage, and what kinds of usage
3063 users should avoid.
3064
3065 In general, a GNU manual should serve both as tutorial and reference.
3066 It should be set up for convenient access to each topic through Info,
3067 and for reading straight through (appendixes aside).  A GNU manual
3068 should give a good introduction to a beginner reading through from the
3069 start, and should also provide all the details that hackers want.
3070 The Bison manual is a good example of this---please take a look at it
3071 to see what we mean.
3072
3073 That is not as hard as it first sounds.  Arrange each chapter as a
3074 logical breakdown of its topic, but order the sections, and write their
3075 text, so that reading the chapter straight through makes sense.  Do
3076 likewise when structuring the book into chapters, and when structuring a
3077 section into paragraphs.  The watchword is, @emph{at each point, address
3078 the most fundamental and important issue raised by the preceding text.}
3079
3080 If necessary, add extra chapters at the beginning of the manual which
3081 are purely tutorial and cover the basics of the subject.  These provide
3082 the framework for a beginner to understand the rest of the manual.  The
3083 Bison manual provides a good example of how to do this.
3084
3085 To serve as a reference, a manual should have an Index that list all the
3086 functions, variables, options, and important concepts that are part of
3087 the program.  One combined Index should do for a short manual, but
3088 sometimes for a complex package it is better to use multiple indices.
3089 The Texinfo manual includes advice on preparing good index entries, see
3090 @ref{Index Entries, , Making Index Entries, texinfo, The GNU Texinfo
3091 Manual}, and see @ref{Indexing Commands, , Defining the Entries of an
3092 Index, texinfo, The GNU Texinfo manual}.
3093
3094 Don't use Unix man pages as a model for how to write GNU documentation;
3095 most of them are terse, badly structured, and give inadequate
3096 explanation of the underlying concepts.  (There are, of course, some
3097 exceptions.)  Also, Unix man pages use a particular format which is
3098 different from what we use in GNU manuals.
3099
3100 Please include an email address in the manual for where to report
3101 bugs @emph{in the text of the manual}.
3102
3103 Please do not use the term ``pathname'' that is used in Unix
3104 documentation; use ``file name'' (two words) instead.  We use the term
3105 ``path'' only for search paths, which are lists of directory names.
3106
3107 Please do not use the term ``illegal'' to refer to erroneous input to
3108 a computer program.  Please use ``invalid'' for this, and reserve the
3109 term ``illegal'' for activities prohibited by law.
3110
3111 @node Doc Strings and Manuals
3112 @section Doc Strings and Manuals
3113
3114 Some programming systems, such as Emacs, provide a documentation string
3115 for each function, command or variable.  You may be tempted to write a
3116 reference manual by compiling the documentation strings and writing a
3117 little additional text to go around them---but you must not do it.  That
3118 approach is a fundamental mistake.  The text of well-written
3119 documentation strings will be entirely wrong for a manual.
3120
3121 A documentation string needs to stand alone---when it appears on the
3122 screen, there will be no other text to introduce or explain it.
3123 Meanwhile, it can be rather informal in style.
3124
3125 The text describing a function or variable in a manual must not stand
3126 alone; it appears in the context of a section or subsection.  Other text
3127 at the beginning of the section should explain some of the concepts, and
3128 should often make some general points that apply to several functions or
3129 variables.  The previous descriptions of functions and variables in the
3130 section will also have given information about the topic.  A description
3131 written to stand alone would repeat some of that information; this
3132 redundance looks bad.  Meanwhile, the informality that is acceptable in
3133 a documentation string is totally unacceptable in a manual.
3134
3135 The only good way to use documentation strings in writing a good manual
3136 is to use them as a source of information for writing good text.
3137
3138 @node Manual Structure Details
3139 @section Manual Structure Details
3140 @cindex manual structure
3141
3142 The title page of the manual should state the version of the programs or
3143 packages documented in the manual.  The Top node of the manual should
3144 also contain this information.  If the manual is changing more
3145 frequently than or independent of the program, also state a version
3146 number for the manual in both of these places.
3147
3148 Each program documented in the manual should have a node named
3149 @samp{@var{program} Invocation} or @samp{Invoking @var{program}}.  This
3150 node (together with its subnodes, if any) should describe the program's
3151 command line arguments and how to run it (the sort of information people
3152 would look for in a man page).  Start with an @samp{@@example}
3153 containing a template for all the options and arguments that the program
3154 uses.
3155
3156 Alternatively, put a menu item in some menu whose item name fits one of
3157 the above patterns.  This identifies the node which that item points to
3158 as the node for this purpose, regardless of the node's actual name.
3159
3160 The @samp{--usage} feature of the Info reader looks for such a node
3161 or menu item in order to find the relevant text, so it is essential
3162 for every Texinfo file to have one.
3163
3164 If one manual describes several programs, it should have such a node for
3165 each program described in the manual.
3166
3167 @node License for Manuals
3168 @section License for Manuals
3169 @cindex license for manuals
3170
3171 Please use the GNU Free Documentation License for all GNU manuals that
3172 are more than a few pages long.  Likewise for a collection of short
3173 documents---you only need one copy of the GNU FDL for the whole
3174 collection.  For a single short document, you can use a very permissive
3175 non-copyleft license, to avoid taking up space with a long license.
3176
3177 See @uref{http://www.gnu.org/copyleft/fdl-howto.html} for more explanation
3178 of how to employ the GFDL.
3179
3180 Note that it is not obligatory to include a copy of the GNU GPL or GNU
3181 LGPL in a manual whose license is neither the GPL nor the LGPL.  It can
3182 be a good idea to include the program's license in a large manual; in a
3183 short manual, whose size would be increased considerably by including
3184 the program's license, it is probably better not to include it.
3185
3186 @node Manual Credits
3187 @section Manual Credits
3188 @cindex credits for manuals
3189
3190 Please credit the principal human writers of the manual as the authors,
3191 on the title page of the manual.  If a company sponsored the work, thank
3192 the company in a suitable place in the manual, but do not cite the
3193 company as an author.
3194
3195 @node Printed Manuals
3196 @section Printed Manuals
3197
3198 The FSF publishes some GNU manuals in printed form.  To encourage sales
3199 of these manuals, the on-line versions of the manual should mention at
3200 the very start that the printed manual is available and should point at
3201 information for getting it---for instance, with a link to the page
3202 @url{http://www.gnu.org/order/order.html}.  This should not be included
3203 in the printed manual, though, because there it is redundant.
3204
3205 It is also useful to explain in the on-line forms of the manual how the
3206 user can print out the manual from the sources.
3207
3208 @node NEWS File
3209 @section The NEWS File
3210 @cindex @file{NEWS} file
3211
3212 In addition to its manual, the package should have a file named
3213 @file{NEWS} which contains a list of user-visible changes worth
3214 mentioning.  In each new release, add items to the front of the file and
3215 identify the version they pertain to.  Don't discard old items; leave
3216 them in the file after the newer items.  This way, a user upgrading from
3217 any previous version can see what is new.
3218
3219 If the @file{NEWS} file gets very long, move some of the older items
3220 into a file named @file{ONEWS} and put a note at the end referring the
3221 user to that file.
3222
3223 @node Change Logs
3224 @section Change Logs
3225 @cindex change logs
3226
3227 Keep a change log to describe all the changes made to program source
3228 files.  The purpose of this is so that people investigating bugs in the
3229 future will know about the changes that might have introduced the bug.
3230 Often a new bug can be found by looking at what was recently changed.
3231 More importantly, change logs can help you eliminate conceptual
3232 inconsistencies between different parts of a program, by giving you a
3233 history of how the conflicting concepts arose and who they came from.
3234
3235 @menu
3236 * Change Log Concepts::         
3237 * Style of Change Logs::        
3238 * Simple Changes::              
3239 * Conditional Changes::         
3240 * Indicating the Part Changed::
3241 @end menu
3242
3243 @node Change Log Concepts
3244 @subsection Change Log Concepts
3245
3246 You can think of the change log as a conceptual ``undo list'' which
3247 explains how earlier versions were different from the current version.
3248 People can see the current version; they don't need the change log
3249 to tell them what is in it.  What they want from a change log is a
3250 clear explanation of how the earlier version differed.
3251
3252 The change log file is normally called @file{ChangeLog} and covers an
3253 entire directory.  Each directory can have its own change log, or a
3254 directory can use the change log of its parent directory--it's up to
3255 you.
3256
3257 Another alternative is to record change log information with a version
3258 control system such as RCS or CVS.  This can be converted automatically
3259 to a @file{ChangeLog} file using @code{rcs2log}; in Emacs, the command
3260 @kbd{C-x v a} (@code{vc-update-change-log}) does the job.
3261
3262 There's no need to describe the full purpose of the changes or how they
3263 work together.  If you think that a change calls for explanation, you're
3264 probably right.  Please do explain it---but please put the explanation
3265 in comments in the code, where people will see it whenever they see the
3266 code.  For example, ``New function'' is enough for the change log when
3267 you add a function, because there should be a comment before the
3268 function definition to explain what it does.
3269
3270 In the past, we recommended not mentioning changes in non-software
3271 files (manuals, help files, etc.) in change logs.  However, we've been
3272 advised that it is a good idea to include them, for the sake of
3273 copyright records.
3274
3275 However, sometimes it is useful to write one line to describe the
3276 overall purpose of a batch of changes.
3277
3278 The easiest way to add an entry to @file{ChangeLog} is with the Emacs
3279 command @kbd{M-x add-change-log-entry}.  An entry should have an
3280 asterisk, the name of the changed file, and then in parentheses the name
3281 of the changed functions, variables or whatever, followed by a colon.
3282 Then describe the changes you made to that function or variable.
3283
3284 @node Style of Change Logs
3285 @subsection Style of Change Logs
3286 @cindex change logs, style
3287
3288 Here are some simple examples of change log entries, starting with the
3289 header line that says who made the change and when it was installed,
3290 followed by descriptions of specific changes.  (These examples are
3291 drawn from Emacs and GCC.)
3292
3293 @example
3294 1998-08-17  Richard Stallman  <rms@@gnu.org>
3295
3296 * register.el (insert-register): Return nil.
3297 (jump-to-register): Likewise.
3298
3299 * sort.el (sort-subr): Return nil.
3300
3301 * tex-mode.el (tex-bibtex-file, tex-file, tex-region):
3302 Restart the tex shell if process is gone or stopped.
3303 (tex-shell-running): New function.
3304
3305 * expr.c (store_one_arg): Round size up for move_block_to_reg.
3306 (expand_call): Round up when emitting USE insns.
3307 * stmt.c (assign_parms): Round size up for move_block_from_reg.
3308 @end example
3309
3310 It's important to name the changed function or variable in full.  Don't
3311 abbreviate function or variable names, and don't combine them.
3312 Subsequent maintainers will often search for a function name to find all
3313 the change log entries that pertain to it; if you abbreviate the name,
3314 they won't find it when they search.
3315
3316 For example, some people are tempted to abbreviate groups of function
3317 names by writing @samp{* register.el (@{insert,jump-to@}-register)};
3318 this is not a good idea, since searching for @code{jump-to-register} or
3319 @code{insert-register} would not find that entry.
3320
3321 Separate unrelated change log entries with blank lines.  When two
3322 entries represent parts of the same change, so that they work together,
3323 then don't put blank lines between them.  Then you can omit the file
3324 name and the asterisk when successive entries are in the same file.
3325
3326 Break long lists of function names by closing continued lines with
3327 @samp{)}, rather than @samp{,}, and opening the continuation with
3328 @samp{(} as in this example:
3329
3330 @example
3331 * keyboard.c (menu_bar_items, tool_bar_items)
3332 (Fexecute_extended_command): Deal with `keymap' property.
3333 @end example
3334
3335 When you install someone else's changes, put the contributor's name in
3336 the change log entry rather than in the text of the entry.  In other
3337 words, write this:
3338
3339 @example
3340 2002-07-14  John Doe  <jdoe@@gnu.org>
3341
3342         * sewing.c: Make it sew.
3343 @end example
3344
3345 @noindent
3346 rather than this:
3347
3348 @example
3349 2002-07-14  Usual Maintainer  <usual@@gnu.org>
3350
3351         * sewing.c: Make it sew.  Patch by jdoe@@gnu.org.
3352 @end example
3353
3354 As for the date, that should be the date you applied the change.
3355
3356 @node Simple Changes
3357 @subsection Simple Changes
3358
3359 Certain simple kinds of changes don't need much detail in the change
3360 log.
3361
3362 When you change the calling sequence of a function in a simple fashion,
3363 and you change all the callers of the function to use the new calling
3364 sequence, there is no need to make individual entries for all the
3365 callers that you changed.  Just write in the entry for the function
3366 being called, ``All callers changed''---like this:
3367
3368 @example
3369 * keyboard.c (Fcommand_execute): New arg SPECIAL.
3370 All callers changed.
3371 @end example
3372
3373 When you change just comments or doc strings, it is enough to write an
3374 entry for the file, without mentioning the functions.  Just ``Doc
3375 fixes'' is enough for the change log.
3376
3377 There's no technical need to make change log entries for documentation
3378 files.  This is because documentation is not susceptible to bugs that
3379 are hard to fix.  Documentation does not consist of parts that must
3380 interact in a precisely engineered fashion.  To correct an error, you
3381 need not know the history of the erroneous passage; it is enough to
3382 compare what the documentation says with the way the program actually
3383 works.
3384
3385 However, you should keep change logs for documentation files when the
3386 project gets copyright assignments from its contributors, so as to
3387 make the records of authorship more accurate.
3388
3389 @node Conditional Changes
3390 @subsection Conditional Changes
3391 @cindex conditional changes, and change logs
3392 @cindex change logs, conditional changes
3393
3394 C programs often contain compile-time @code{#if} conditionals.  Many
3395 changes are conditional; sometimes you add a new definition which is
3396 entirely contained in a conditional.  It is very useful to indicate in
3397 the change log the conditions for which the change applies.
3398
3399 Our convention for indicating conditional changes is to use square
3400 brackets around the name of the condition.
3401
3402 Here is a simple example, describing a change which is conditional but
3403 does not have a function or entity name associated with it:
3404
3405 @example
3406 * xterm.c [SOLARIS2]: Include string.h.
3407 @end example
3408
3409 Here is an entry describing a new definition which is entirely
3410 conditional.  This new definition for the macro @code{FRAME_WINDOW_P} is
3411 used only when @code{HAVE_X_WINDOWS} is defined:
3412
3413 @example
3414 * frame.h [HAVE_X_WINDOWS] (FRAME_WINDOW_P): Macro defined.
3415 @end example
3416
3417 Here is an entry for a change within the function @code{init_display},
3418 whose definition as a whole is unconditional, but the changes themselves
3419 are contained in a @samp{#ifdef HAVE_LIBNCURSES} conditional:
3420
3421 @example
3422 * dispnew.c (init_display) [HAVE_LIBNCURSES]: If X, call tgetent.
3423 @end example
3424
3425 Here is an entry for a change that takes affect only when
3426 a certain macro is @emph{not} defined:
3427
3428 @example
3429 (gethostname) [!HAVE_SOCKETS]: Replace with winsock version.
3430 @end example
3431
3432 @node Indicating the Part Changed
3433 @subsection Indicating the Part Changed
3434
3435 Indicate the part of a function which changed by using angle brackets
3436 enclosing an indication of what the changed part does.  Here is an entry
3437 for a change in the part of the function @code{sh-while-getopts} that
3438 deals with @code{sh} commands:
3439
3440 @example
3441 * progmodes/sh-script.el (sh-while-getopts) <sh>: Handle case that
3442 user-specified option string is empty.
3443 @end example
3444
3445
3446 @node Man Pages
3447 @section Man Pages
3448 @cindex man pages
3449
3450 In the GNU project, man pages are secondary.  It is not necessary or
3451 expected for every GNU program to have a man page, but some of them do.
3452 It's your choice whether to include a man page in your program.
3453
3454 When you make this decision, consider that supporting a man page
3455 requires continual effort each time the program is changed.  The time
3456 you spend on the man page is time taken away from more useful work.
3457
3458 For a simple program which changes little, updating the man page may be
3459 a small job.  Then there is little reason not to include a man page, if
3460 you have one.
3461
3462 For a large program that changes a great deal, updating a man page may
3463 be a substantial burden.  If a user offers to donate a man page, you may
3464 find this gift costly to accept.  It may be better to refuse the man
3465 page unless the same person agrees to take full responsibility for
3466 maintaining it---so that you can wash your hands of it entirely.  If
3467 this volunteer later ceases to do the job, then don't feel obliged to
3468 pick it up yourself; it may be better to withdraw the man page from the
3469 distribution until someone else agrees to update it.
3470
3471 When a program changes only a little, you may feel that the
3472 discrepancies are small enough that the man page remains useful without
3473 updating.  If so, put a prominent note near the beginning of the man
3474 page explaining that you don't maintain it and that the Texinfo manual
3475 is more authoritative.  The note should say how to access the Texinfo
3476 documentation.
3477
3478 Be sure that man pages include a copyright statement and free
3479 license.  The simple all-permissive license is appropriate for simple
3480 man pages:
3481
3482 @example
3483 Copying and distribution of this file, with or without modification,
3484 are permitted in any medium without royalty provided the copyright
3485 notice and this notice are preserved.
3486 @end example
3487
3488 For long man pages, with enough explanation and documentation that
3489 they can be considered true manuals, use the GFDL (@pxref{License for
3490 Manuals}).
3491
3492 Finally, the GNU help2man program
3493 (@uref{http://www.gnu.org/software/help2man/}) is one way to automate
3494 generation of a man page, in this case from @option{--help} output.
3495 This is sufficient in many cases.
3496
3497 @node Reading other Manuals
3498 @section Reading other Manuals
3499
3500 There may be non-free books or documentation files that describe the
3501 program you are documenting.
3502
3503 It is ok to use these documents for reference, just as the author of a
3504 new algebra textbook can read other books on algebra.  A large portion
3505 of any non-fiction book consists of facts, in this case facts about how
3506 a certain program works, and these facts are necessarily the same for
3507 everyone who writes about the subject.  But be careful not to copy your
3508 outline structure, wording, tables or examples from preexisting non-free
3509 documentation.  Copying from free documentation may be ok; please check
3510 with the FSF about the individual case.
3511
3512 @node Managing Releases
3513 @chapter The Release Process
3514 @cindex releasing
3515
3516 Making a release is more than just bundling up your source files in a
3517 tar file and putting it up for FTP.  You should set up your software so
3518 that it can be configured to run on a variety of systems.  Your Makefile
3519 should conform to the GNU standards described below, and your directory
3520 layout should also conform to the standards discussed below.  Doing so
3521 makes it easy to include your package into the larger framework of
3522 all GNU software.
3523
3524 @menu
3525 * Configuration::               How Configuration Should Work
3526 * Makefile Conventions::        Makefile Conventions
3527 * Releases::                    Making Releases
3528 @end menu
3529
3530 @node Configuration
3531 @section How Configuration Should Work
3532 @cindex program configuration
3533
3534 @pindex configure
3535 Each GNU distribution should come with a shell script named
3536 @code{configure}.  This script is given arguments which describe the
3537 kind of machine and system you want to compile the program for.
3538
3539 The @code{configure} script must record the configuration options so
3540 that they affect compilation.
3541
3542 One way to do this is to make a link from a standard name such as
3543 @file{config.h} to the proper configuration file for the chosen system.
3544 If you use this technique, the distribution should @emph{not} contain a
3545 file named @file{config.h}.  This is so that people won't be able to
3546 build the program without configuring it first.
3547
3548 Another thing that @code{configure} can do is to edit the Makefile.  If
3549 you do this, the distribution should @emph{not} contain a file named
3550 @file{Makefile}.  Instead, it should include a file @file{Makefile.in} which
3551 contains the input used for editing.  Once again, this is so that people
3552 won't be able to build the program without configuring it first.
3553
3554 If @code{configure} does write the @file{Makefile}, then @file{Makefile}
3555 should have a target named @file{Makefile} which causes @code{configure}
3556 to be rerun, setting up the same configuration that was set up last
3557 time.  The files that @code{configure} reads should be listed as
3558 dependencies of @file{Makefile}.
3559
3560 All the files which are output from the @code{configure} script should
3561 have comments at the beginning explaining that they were generated
3562 automatically using @code{configure}.  This is so that users won't think
3563 of trying to edit them by hand.
3564
3565 The @code{configure} script should write a file named @file{config.status}
3566 which describes which configuration options were specified when the
3567 program was last configured.  This file should be a shell script which,
3568 if run, will recreate the same configuration.
3569
3570 The @code{configure} script should accept an option of the form
3571 @samp{--srcdir=@var{dirname}} to specify the directory where sources are found
3572 (if it is not the current directory).  This makes it possible to build
3573 the program in a separate directory, so that the actual source directory
3574 is not modified.
3575
3576 If the user does not specify @samp{--srcdir}, then @code{configure} should
3577 check both @file{.} and @file{..} to see if it can find the sources.  If
3578 it finds the sources in one of these places, it should use them from
3579 there.  Otherwise, it should report that it cannot find the sources, and
3580 should exit with nonzero status.
3581
3582 Usually the easy way to support @samp{--srcdir} is by editing a
3583 definition of @code{VPATH} into the Makefile.  Some rules may need to
3584 refer explicitly to the specified source directory.  To make this
3585 possible, @code{configure} can add to the Makefile a variable named
3586 @code{srcdir} whose value is precisely the specified directory.
3587
3588 The @code{configure} script should also take an argument which specifies the
3589 type of system to build the program for.  This argument should look like
3590 this:
3591
3592 @example
3593 @var{cpu}-@var{company}-@var{system}
3594 @end example
3595
3596 For example, an Athlon-based GNU/Linux system might be
3597 @samp{i686-pc-linux-gnu}.
3598
3599 The @code{configure} script needs to be able to decode all plausible
3600 alternatives for how to describe a machine.  Thus,
3601 @samp{athlon-pc-gnu/linux} would be a valid alias.
3602 There is a shell script called
3603 @uref{ftp://ftp.gnu.org/gnu/config/config.sub, @file{config.sub}}
3604 that you can use
3605 as a subroutine to validate system types and canonicalize aliases.
3606
3607 The @code{configure} script should also take the option
3608 @option{--build=@var{buildtype}}, which should be equivalent to a
3609 plain @var{buildtype} argument.  For example, @samp{configure
3610 --build=i686-pc-linux-gnu} is equivalent to @samp{configure
3611 i686-pc-linux-gnu}.  When the build type is not specified by an option
3612 or argument, the @code{configure} script should normally guess it
3613 using the shell script
3614 @uref{ftp://ftp.gnu.org/gnu/config/config.guess, @file{config.guess}}.
3615
3616 @cindex optional features, configure-time
3617 Other options are permitted to specify in more detail the software
3618 or hardware present on the machine, and include or exclude optional
3619 parts of the package:
3620
3621 @table @samp
3622 @item --enable-@var{feature}@r{[}=@var{parameter}@r{]}
3623 Configure the package to build and install an optional user-level
3624 facility called @var{feature}.  This allows users to choose which
3625 optional features to include.  Giving an optional @var{parameter} of
3626 @samp{no} should omit @var{feature}, if it is built by default.
3627
3628 No @samp{--enable} option should @strong{ever} cause one feature to
3629 replace another.  No @samp{--enable} option should ever substitute one
3630 useful behavior for another useful behavior.  The only proper use for
3631 @samp{--enable} is for questions of whether to build part of the program
3632 or exclude it.
3633
3634 @item --with-@var{package}
3635 @c @r{[}=@var{parameter}@r{]}
3636 The package @var{package} will be installed, so configure this package
3637 to work with @var{package}.
3638
3639 @c  Giving an optional @var{parameter} of
3640 @c @samp{no} should omit @var{package}, if it is used by default.
3641
3642 Possible values of @var{package} include
3643 @samp{gnu-as} (or @samp{gas}), @samp{gnu-ld}, @samp{gnu-libc},
3644 @samp{gdb},
3645 @samp{x},
3646 and
3647 @samp{x-toolkit}.
3648
3649 Do not use a @samp{--with} option to specify the file name to use to
3650 find certain files.  That is outside the scope of what @samp{--with}
3651 options are for.
3652 @end table
3653
3654 All @code{configure} scripts should accept all of these ``detail''
3655 options, whether or not they make any difference to the particular
3656 package at hand.  In particular, they should accept any option that
3657 starts with @samp{--with-} or @samp{--enable-}.  This is so users will
3658 be able to configure an entire GNU source tree at once with a single set
3659 of options.
3660
3661 You will note that the categories @samp{--with-} and @samp{--enable-}
3662 are narrow: they @strong{do not} provide a place for any sort of option
3663 you might think of.  That is deliberate.  We want to limit the possible
3664 configuration options in GNU software.  We do not want GNU programs to
3665 have idiosyncratic configuration options.
3666
3667 Packages that perform part of the compilation process may support
3668 cross-compilation.  In such a case, the host and target machines for the
3669 program may be different.
3670
3671 The @code{configure} script should normally treat the specified type of
3672 system as both the host and the target, thus producing a program which
3673 works for the same type of machine that it runs on.
3674
3675 To compile a program to run on a host type that differs from the build
3676 type, use the configure option @option{--host=@var{hosttype}}, where
3677 @var{hosttype} uses the same syntax as @var{buildtype}.  The host type
3678 normally defaults to the build type.
3679
3680 To configure a cross-compiler, cross-assembler, or what have you, you
3681 should specify a target different from the host, using the configure
3682 option @samp{--target=@var{targettype}}.  The syntax for
3683 @var{targettype} is the same as for the host type.  So the command would
3684 look like this:
3685
3686 @example
3687 ./configure --host=@var{hosttype} --target=@var{targettype}
3688 @end example
3689
3690 The target type normally defaults to the host type.
3691 Programs for which cross-operation is not meaningful need not accept the
3692 @samp{--target} option, because configuring an entire operating system for
3693 cross-operation is not a meaningful operation.
3694
3695 Some programs have ways of configuring themselves automatically.  If
3696 your program is set up to do this, your @code{configure} script can simply
3697 ignore most of its arguments.
3698
3699 @comment The makefile standards are in a separate file that is also
3700 @comment included by make.texinfo.  Done by roland@gnu.ai.mit.edu on 1/6/93.
3701 @comment For this document, turn chapters into sections, etc.
3702 @lowersections
3703 @include make-stds.texi
3704 @raisesections
3705
3706 @node Releases
3707 @section Making Releases
3708 @cindex packaging
3709
3710 You should identify each release with a pair of version numbers, a
3711 major version and a minor.  We have no objection to using more than
3712 two numbers, but it is very unlikely that you really need them.
3713
3714 Package the distribution of @code{Foo version 69.96} up in a gzipped tar
3715 file with the name @file{foo-69.96.tar.gz}.  It should unpack into a
3716 subdirectory named @file{foo-69.96}.
3717
3718 Building and installing the program should never modify any of the files
3719 contained in the distribution.  This means that all the files that form
3720 part of the program in any way must be classified into @dfn{source
3721 files} and @dfn{non-source files}.  Source files are written by humans
3722 and never changed automatically; non-source files are produced from
3723 source files by programs under the control of the Makefile.
3724
3725 @cindex @file{README} file
3726 The distribution should contain a file named @file{README} which gives
3727 the name of the package, and a general description of what it does.  It
3728 is also good to explain the purpose of each of the first-level
3729 subdirectories in the package, if there are any.  The @file{README} file
3730 should either state the version number of the package, or refer to where
3731 in the package it can be found.
3732
3733 The @file{README} file should refer to the file @file{INSTALL}, which
3734 should contain an explanation of the installation procedure.
3735
3736 The @file{README} file should also refer to the file which contains the
3737 copying conditions.  The GNU GPL, if used, should be in a file called
3738 @file{COPYING}.  If the GNU LGPL is used, it should be in a file called
3739 @file{COPYING.LIB}.
3740
3741 Naturally, all the source files must be in the distribution.  It is okay
3742 to include non-source files in the distribution, provided they are
3743 up-to-date and machine-independent, so that building the distribution
3744 normally will never modify them.  We commonly include non-source files
3745 produced by Bison, @code{lex}, @TeX{}, and @code{makeinfo}; this helps avoid
3746 unnecessary dependencies between our distributions, so that users can
3747 install whichever packages they want to install.
3748
3749 Non-source files that might actually be modified by building and
3750 installing the program should @strong{never} be included in the
3751 distribution.  So if you do distribute non-source files, always make
3752 sure they are up to date when you make a new distribution.
3753
3754 Make sure that the directory into which the distribution unpacks (as
3755 well as any subdirectories) are all world-writable (octal mode 777).
3756 This is so that old versions of @code{tar} which preserve the
3757 ownership and permissions of the files from the tar archive will be
3758 able to extract all the files even if the user is unprivileged.
3759
3760 Make sure that all the files in the distribution are world-readable.
3761
3762 Don't include any symbolic links in the distribution itself.  If the tar
3763 file contains symbolic links, then people cannot even unpack it on
3764 systems that don't support symbolic links.  Also, don't use multiple
3765 names for one file in different directories, because certain file
3766 systems cannot handle this and that prevents unpacking the
3767 distribution.
3768
3769 Try to make sure that all the file names will be unique on MS-DOS.  A
3770 name on MS-DOS consists of up to 8 characters, optionally followed by a
3771 period and up to three characters.  MS-DOS will truncate extra
3772 characters both before and after the period.  Thus,
3773 @file{foobarhacker.c} and @file{foobarhacker.o} are not ambiguous; they
3774 are truncated to @file{foobarha.c} and @file{foobarha.o}, which are
3775 distinct.
3776
3777 @cindex @file{texinfo.tex}, in a distribution
3778 Include in your distribution a copy of the @file{texinfo.tex} you used
3779 to test print any @file{*.texinfo} or @file{*.texi} files.
3780
3781 Likewise, if your program uses small GNU software packages like regex,
3782 getopt, obstack, or termcap, include them in the distribution file.
3783 Leaving them out would make the distribution file a little smaller at
3784 the expense of possible inconvenience to a user who doesn't know what
3785 other files to get.
3786
3787 @node References
3788 @chapter References to Non-Free Software and Documentation
3789 @cindex references to non-free material
3790
3791 A GNU program should not recommend use of any non-free program.  We
3792 can't stop some people from writing proprietary programs, or stop
3793 other people from using them, but we can and should refuse to
3794 advertise them to new potential customers.  Proprietary software is a
3795 social and ethical problem, and the point of GNU is to solve that
3796 problem.
3797
3798 The GNU definition of free software is found on the GNU web site at
3799 @url{http://www.gnu.org/philosophy/free-sw.html}.  A list of
3800 important licenses and whether they qualify as free is in
3801 @url{http://www.gnu.org/licenses/license-list.html}.  The terms
3802 ``free'' and ``non-free'', used in this document, refer to that
3803 definition.  If it is not clear whether a license qualifies as free
3804 under this definition, please ask the GNU Project by writing to
3805 @email{licensing@@gnu.org}.  We will answer, and if the license is an
3806 important one, we will add it to the list.
3807
3808 When a non-free program or system is well known, you can mention it in
3809 passing---that is harmless, since users who might want to use it
3810 probably already know about it.  For instance, it is fine to explain
3811 how to build your package on top of some widely used non-free
3812 operating system, or how to use it together with some widely used
3813 non-free program.
3814
3815 However, you should give only the necessary information to help those
3816 who already use the non-free program to use your program with
3817 it---don't give, or refer to, any further information about the
3818 proprietary program, and don't imply that the proprietary program
3819 enhances your program, or that its existence is in any way a good
3820 thing.  The goal should be that people already using the proprietary
3821 program will get the advice they need about how to use your free
3822 program with it, while people who don't already use the proprietary
3823 program will not see anything to lead them to take an interest in it.
3824
3825 If a non-free program or system is obscure in your program's domain,
3826 your program should not mention or support it at all, since doing so
3827 would tend to popularize the non-free program more than it popularizes
3828 your program.  (You cannot hope to find many additional users among
3829 the users of Foobar if the users of Foobar are few.)
3830
3831 Sometimes a program is free software in itself but depends on a
3832 non-free platform in order to run.  For instance, many Java programs
3833 depend on Sun's Java implementation, and won't run on the GNU Java
3834 Compiler (which does not yet have all the features) or won't run with
3835 the GNU Java libraries.  To recommend that program is inherently to
3836 recommend the non-free platform as well; if you should not do the
3837 latter, then don't do the former.
3838
3839 A GNU package should not refer the user to any non-free documentation
3840 for free software.  Free documentation that can be included in free
3841 operating systems is essential for completing the GNU system, or any
3842 free operating system, so it is a major focus of the GNU Project; to
3843 recommend use of documentation that we are not allowed to use in GNU
3844 would weaken the impetus for the community to produce documentation
3845 that we can include.  So GNU packages should never recommend non-free
3846 documentation.
3847
3848 By contrast, it is ok to refer to journal articles and textbooks in
3849 the comments of a program for explanation of how it functions, even
3850 though they be non-free.  This is because we don't include such things
3851 in the GNU system even if we are allowed to--they are outside the
3852 scope of an operating system project.
3853
3854 Referring to a web site that describes or recommends a non-free
3855 program is in effect promoting that software, so please do not make
3856 links (or mention by name) web sites that contain such material.  This
3857 policy is relevant particulary for the web pages for a GNU package.
3858
3859 Following links from nearly any web site can lead to non-free
3860 software; this is an inescapable aspect of the nature of the web, and
3861 in itself is no objection to linking to a site.  As long as the site
3862 does not itself recommend a non-free program, there is no need be
3863 concerned about the sites it links to for other reasons.
3864
3865 Thus, for example, you should not make a link to AT&T's web site,
3866 because that recommends AT&T's non-free software packages; you should
3867 not make a link to a site that links to AT&T's site saying it is a
3868 place to get a non-free program; but if a site you want to link to
3869 refers to AT&T's web site in some other context (such as long-distance
3870 telephone service), that is not a problem.
3871
3872 @node Copying This Manual
3873 @appendix Copying This Manual
3874
3875 @menu
3876 * GNU Free Documentation License::  License for copying this manual
3877 @end menu
3878
3879 @include fdl.texi
3880
3881 @node Index
3882 @unnumbered Index
3883 @printindex cp
3884
3885 @bye
3886
3887 Local variables:
3888 eval: (add-hook 'write-file-hooks 'time-stamp)
3889 time-stamp-start: "@set lastupdate "
3890 time-stamp-end: "$"
3891 time-stamp-format: "%:b %:d, %:y"
3892 compile-command: "make just-standards"
3893 End: