merged with 1.1
[mir.git] / source / mir / misc / StringUtil.java
index bb26ae7..5588286 100755 (executable)
-/*
- * Copyright (C) 2001, 2002 The Mir-coders group
- *
- * This file is part of Mir.
- *
- * Mir is free software; you can redistribute it and/or modify
- * it under the terms of the GNU General Public License as published by
- * the Free Software Foundation; either version 2 of the License, or
- * (at your option) any later version.
- *
- * Mir is distributed in the hope that it will be useful,
- * but WITHOUT ANY WARRANTY; without even the implied warranty of
- * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the
- * GNU General Public License for more details.
- *
- * You should have received a copy of the GNU General Public License
- * along with Mir; if not, write to the Free Software
- * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA
- *
- * In addition, as a special exception, The Mir-coders gives permission to link
- * the code of this program with  any library licensed under the Apache Software License, 
- * The Sun (tm) Java Advanced Imaging library (JAI), The Sun JIMI library 
- * (or with modified versions of the above that use the same license as the above), 
- * and distribute linked combinations including the two.  You must obey the 
- * GNU General Public License in all respects for all of the code used other than 
- * the above mentioned libraries.  If you modify this file, you may extend this 
- * exception to your version of the file, but you are not obligated to do so.  
- * If you do not wish to do so, delete this exception statement from your version.
- */
-package  mir.misc;
-
-import gnu.regexp.RE;
-import gnu.regexp.REException;
-
-import java.io.File;
-import java.text.NumberFormat;
-import java.util.Calendar;
-import java.util.GregorianCalendar;
-import java.util.StringTokenizer;
-
-/**
- * Statische Hilfsmethoden zur Stringbehandlung
- *
- * @version $Id: StringUtil.java,v 1.33 2003/04/21 12:42:52 idfx Exp $
- * @author mir-coders group
- *
- */
-public final class StringUtil {
-
-  private static RE   re_newline2br, re_brbr2p, re_mail, re_url, re_tags,
-                      re_tables, re_forbiddenTags;
-
-  private StringUtil() { }  // this avoids contruction
-
-  static {
-    try {
-      //precompile regex
-      re_newline2br = new RE("(\r?\n){1}");
-      re_brbr2p     = new RE("(<br>\r?\n<br>){1,}");
-      re_mail       = new RE("([a-zA-Z0-9_.-]+)@([a-zA-Z0-9_-]+)\\.([a-zA-Z0-9_.-]+)");
-      re_url        = new RE("((https://)|(http://)|(ftp://)){1}([a-zA-Z0-9_-]+).([a-zA-Z0-9_.:-]+)/?([^ \t\r\n<>\\)\\]]+[^ \t\r\n.,<>\\)\\]])");
-      re_tags       = new RE("<[^>]*>",RE.REG_ICASE);
-                       re_tables = new RE("<[ \t\r\n/]*(table|td|tr)[ \t\r\n]*>",RE.REG_ICASE);
-                       re_forbiddenTags = new RE("<[ \t\r\n/]*(body|head|script)[ \t\r\n]*>",RE.REG_ICASE);
-    }
-    catch (REException e){
-      System.err.println("FATAL: StringUtil: could not precompile REGEX: "+e.toString());
-    }
-  }
-
-  /**
-   * Formats a number with the specified minimum and maximum number of digits.
-   **/
-  public static synchronized String zeroPaddingNumber(long value, int minDigits,
-      int maxDigits)
-  {
-    NumberFormat numberFormat = NumberFormat.getInstance();
-    numberFormat.setMinimumIntegerDigits(minDigits);
-    numberFormat.setMaximumIntegerDigits(maxDigits);
-    return numberFormat.format(value);
-  }
-
-  /**
-   * Wandelt Datum in einen 8-ziffrigen String um (yyyymmdd)
-   * @param theDate
-   * @return 8-ziffriger String (yyyymmdd)
-   */
-
-  public static final String date2webdbDate (GregorianCalendar theDate) {
-    StringBuffer webdbDate = new StringBuffer();
-    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));
-    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));
-    webdbDate.append(pad2(theDate.get(Calendar.DATE)));
-    return  webdbDate.toString();
-  }
-
-  /**
-   * Wandelt Calendar in einen 12-ziffrigen String um (yyyymmddhhmm)
-   * @param theDate
-   * @return 12-ziffriger String (yyyymmdd)
-   */
-
-  public static final String date2webdbDateTime (GregorianCalendar theDate) {
-    StringBuffer webdbDate = new StringBuffer();
-    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));
-    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));
-    webdbDate.append(pad2(theDate.get(Calendar.DATE)));
-    webdbDate.append(pad2(theDate.get(Calendar.HOUR)));
-    webdbDate.append(pad2(theDate.get(Calendar.MINUTE)));
-    return  webdbDate.toString();
-  }
-
-  /**
-   * Return a http://www.w3.org/TR/NOTE-datetime formatted date (yyyy-mm-ddThh:mm:ssTZ)
-   * @param theDate
-   * @return w3approved datetime
-   */
-
-  public static final String date2w3DateTime (GregorianCalendar theDate) {
-    StringBuffer webdbDate = new StringBuffer();
-    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));
-    webdbDate.append("-");
-    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));
-    webdbDate.append("-");
-    webdbDate.append(pad2(theDate.get(Calendar.DATE)));
-    webdbDate.append("T");
-    webdbDate.append(pad2(theDate.get(Calendar.HOUR)));
-    webdbDate.append(":");
-    webdbDate.append(pad2(theDate.get(Calendar.MINUTE)));
-    webdbDate.append(":");
-    webdbDate.append(pad2(theDate.get(Calendar.SECOND)));
-    //assumes you are an hour-multiple away from UTC....
-    int offset=(theDate.get(Calendar.ZONE_OFFSET)/(60*60*1000));
-    if (offset < 0){
-      webdbDate.append("-");
-    }
-    else{
-      webdbDate.append("+");
-    }
-    webdbDate.append(pad2(Math.abs(offset)));
-    webdbDate.append(":00");
-    return  webdbDate.toString();
-  }
-
-  /**
-   * wandelt Calendar in dd.mm.yyyy / hh.mm um
-   * @param theDate
-   * @return String mit (dd.mm.yyyy / hh.mm um)
-   */
-  public static String date2readableDateTime (GregorianCalendar theDate) {
-    String readable = "";
-    int hour;
-    readable += pad2(theDate.get(Calendar.DATE));
-    readable += "." + pad2(theDate.get(Calendar.MONTH) + 1);
-    readable += "." + String.valueOf(theDate.get(Calendar.YEAR));
-    hour = theDate.get(Calendar.HOUR);
-    if (theDate.get(Calendar.AM_PM) == Calendar.PM)
-      hour += 12;
-    readable += " / " + pad2(hour);
-    readable += ":" + pad2(theDate.get(Calendar.MINUTE));
-    return  readable;
-  }
-
-  /**
-  *  deleteForbiddenTags
-  *  this method deletes all <script>, <body> and <head>-tags
-  */
-  public static final String deleteForbiddenTags(String haystack) {
-    return re_forbiddenTags.substituteAll(haystack,"");
-  }
-
-       /**
-        *  deleteHTMLTableTags
-        *  this method deletes all <table>, <tr> and <td>-tags
-        */
-  public static final String deleteHTMLTableTags(String haystack) {
-    return re_tables.substituteAll(haystack,"");
-  }
-
-  /**
-   * wandelt eine Datum in einen 8-buchstabigen String, der durch <code>/</code>
-   * getrennt ist.
-   *
-   * @param webdbDate
-   * @return String mit <code>/yyyy/mm/dd</code>
-   */
-  public static final String webdbDate2path (String webdbDate) {
-    StringBuffer path = new StringBuffer();
-    path.append("/").append(webdbDate.substring(0, 4));
-    path.append("/").append(webdbDate.substring(4, 6));
-    path.append("/");
-    //who did this?
-    //path.append("/").append(webdbDate.substring(6, 8));
-    return  path.toString();
-  }
-
-  /**
-   * converts string from format: yyyy-mm-dd__hh:mm:ss.d
-   * to dd.mm.yyyy hh:mm
-   */
-  public static String dateToReadableDate(String date) {
-    StringBuffer returnDate = new StringBuffer();
-    if (date!=null) {
-
-      returnDate.append(date.substring(8,10)).append('.');
-      returnDate.append(date.substring(5,7)).append('.');
-      returnDate.append(date.substring(0,4)).append(' ');
-      returnDate.append(date.substring(11,16));
-    }
-    return returnDate.toString();
-  }
-
-  /**
-   * converts string from format: yyyy-mm-dd__hh:mm:ss.d
-   * to yyyy
-   */
-  public static String dateToYear (String date) {
-    StringBuffer returnDate = new StringBuffer();
-    if (date!=null) {
-
-      returnDate.append(date.substring(0,4));
-    }
-    return returnDate.toString();
-  }
-
-  /**
-   * converts string from format: yyyy-mm-dd__hh:mm:ss.d
-   * to [m]m
-   */
-  public static String dateToMonth (String date) {
-    StringBuffer returnDate = new StringBuffer();
-    if (date!=null) {
-      if (!date.substring(5,6).equalsIgnoreCase("0")) returnDate.append(date.substring(5,7));
-      else returnDate.append(date.substring(6,7));
-    }
-    return returnDate.toString();
-  }
-
-  /**
-   * converts string from format: yyyy-mm-dd__hh:mm:ss.d
-   * to [d]d
-   */
-  public static String dateToDayOfMonth (String date) {
-    StringBuffer returnDate = new StringBuffer();
-    if (date!=null) {
-      if (!date.substring(8,9).equalsIgnoreCase("0")) returnDate.append(date.substring(8,10));
-      else returnDate.append(date.substring(9,10));
-    }
-    return returnDate.toString();
-  }
-
-  /**
-   * converts string from format: yyyy-mm-dd__hh:mm:ss.d
-   * to hh:mm
-   */
-  public static String dateToTime (String date) {
-    StringBuffer returnDate = new StringBuffer();
-    if (date!=null) {
-      returnDate.append(date.substring(11,16));
-    }
-    return returnDate.toString();
-  }
-
-  /**
-   * Splits the provided CSV text into a list. stolen wholesale from
-   * from Jakarta Turbine StrinUtils.java -mh
-   *
-   * @param text      The CSV list of values to split apart.
-   * @param separator The separator character.
-   * @return          The list of values.
-   */
-  public static String[] split(String text, String separator)
-  {
-    StringTokenizer st = new StringTokenizer(text, separator);
-    String[] values = new String[st.countTokens()];
-    int pos = 0;
-    while (st.hasMoreTokens())
-    {
-      values[pos++] = st.nextToken();
-    }
-    return values;
-  }
-
-  /**
-   * Joins the elements of the provided array into a single string
-   * containing a list of CSV elements. Stolen wholesale from Jakarta
-   * Turbine StringUtils.java. -mh
-   *
-   * @param list      The list of values to join together.
-   * @param separator The separator character.
-   * @return          The CSV text.
-   */
-  public static String join(String[] list, String separator)
-  {
-    StringBuffer csv = new StringBuffer();
-    for (int i = 0; i < list.length; i++)
-    {
-      if (i > 0)
-      {
-      csv.append(separator);
-    }
-    csv.append(list[i]);
-    }
-    return csv.toString();
-  }
-
-  /**
-   * Wandelet String in byte[] um.
-   * @param s
-   * @return byte[] des String
-   */
-
-  public static byte[] stringToBytes(String s) {
-    String crlf = System.getProperty("line.separator");
-    if (!crlf.equals("\n"))
-      s = replace(s, "\n", crlf);
-    // byte[] buf = new byte[s.length()];
-    byte[] buf = s.getBytes();
-    return buf;
-  }
-
-  /**
-   * Ersetzt in String <code>s</code> das <code>pattern</code> durch <code>substitute</code>
-   * @param s
-   * @param pattern
-   * @param substitute
-   * @return String mit den Ersetzungen
-   */
-  public static String replace(String s, String pattern, String substitute) {
-    int i = 0, pLen = pattern.length(), sLen = substitute.length();
-    StringBuffer buf = new StringBuffer(s.length());
-    while (true) {
-      int j = s.indexOf(pattern, i);
-      if (j < 0) {
-        buf.append(s.substring(i));
-        break;
-      } else {
-        buf.append(s.substring(i, j));
-        buf.append(substitute);
-        i = j+pLen;
-      }
-    }
-    return buf.toString();
-  }
-
-  /**
-   * Ersetzt in String <code>s</code> das Regexp <code>pattern</code> durch <code>substitute</code>
-   * @param s
-   * @param pattern
-   * @param substitute
-   * @return String mit den Ersetzungen
-   */
-  public static String regexpReplace(String haystack, String pattern, String substitute) {
-    try {
-      RE regex = new RE(pattern);
-      return regex.substituteAll(haystack,substitute);
-    } catch(REException ex){
-      return null;
-    }
-  }
-
-
-
-
-  /**
-   * F?gt einen Separator an den Pfad an
-   * @param path
-   * @return Pfad mit Separator am Ende
-   */
-  public static final String addSeparator (String path) {
-    return  path.length() == 0 || path.endsWith(File.separator) ? path : path
-                          + File.separatorChar;
-  }
-
-  /**
-   * F?gt ein <code>/</code> ans ende des Strings and
-   * @param path
-   * @return Pfad mit <code>/</code> am Ende
-   */
-  public static final String addSlash (String path) {
-    return  path.length() == 0 || path.endsWith("/") ? path : path + '/';
-  }
-
-  /**
-   * L?scht <code>/</code> am Ende des Strings, falls vorhanden
-   * @param path
-   * @return String ohne <code>/</code> am Ende
-   */
-  public static final String removeSlash (String path) {
-    return  path.length() > 1 && path.endsWith("/") ? path.substring(0, path.length()
-        - 1) : path;
-  }
-
-  /**
-   * Checks to see if the path is absolute by looking for a leading file
-   * separater
-   * @param path
-   * @return
-   */
-  public static boolean isAbsolutePath (String path) {
-    return  path.startsWith(File.separator);
-  }
-
-  /**
-   * L?scht Slash am Anfang des Strings
-   * @param path
-   * @return
-   */
-  public static String removeFirstSlash (String path) {
-    return  path.startsWith("/") ? path.substring(1) : path;
-  }
-
-  /**
-   * formatiert eine Zahl (0-99) zweistellig (z.B. 5 -> 05)
-   * @return zwistellige Zahl
-   */
-  public static String pad2 (int number) {
-    return  number < 10 ? "0" + number : String.valueOf(number);
-  }
-
-  /**
-   * formatiert eine Zahl (0-999) dreistellig (z.B. 7 -> 007)
-   *
-   * @return 3-stellige Zahl
-   */
-  public static String pad3 (int number) {
-    return  number < 10 ? "00" + number : number < 100 ? "0" + number : String.valueOf(number);
-  }
-
-  /**
-   * Konvertiert Unix-Linefeeds in Win-Linefeeds
-   * @param s
-   * @return Konvertierter String
-   */
-  public static String unixLineFeedsToWin(String s) {
-    int i = -1;
-    while (true) {
-      i = s.indexOf('\n', i+1);
-      if (i < 0) break;
-      if ((i == 0 || s.charAt(i-1) != '\r') &&
-          (i == s.length()-1 || s.charAt(i+1) != '\r')) {
-        s = s.substring(0, i)+'\r'+s.substring(i);
-        i++;
-      }
-    }
-    return s;
-  }
-
- /**
-  * schnellere Variante der String.toLowerCase()-Routine
-  *
-  * @return String in Kleinbuchsten
-  */
-  public static String toLowerCase(String s) {
-    int l = s.length();
-    char[] a = new char[l];
-    for (int i = 0; i < l; i++)
-      a[i] = Character.toLowerCase(s.charAt(i));
-    return new String(a);
-  }
-
-  /**
-   * Findet <code>element</code> im String-Array <code>array</code>
-   * @param array
-   * @param element
-   * @return Fundstelle als int oder -1
-   */
-  public static int indexOf(String[] array, String element) {
-    if (array != null)
-      for (int i = 0; i < array.length; i++)
-        if (array[i].equals(element))
-          return i;
-    return -1;
-  }
-
-  /**
-   * Testet auf Vorkommen von <code>element</code> in <code>array</code>
-   * @param array String-Array
-   * @param element
-   * @return true wenn <code>element</code> vorkommt, sonst false
-   */
-  public static boolean contains(String[] array, String element) {
-    return indexOf(array, element) >= 0;
-  }
-
-  /**
-   * Ermittelt CRC-Pr?fsumme von String <code>s</code>
-   * @param s
-   * @return CRC-Pr?fsumme
-   */
-  public static int getCRC(String s) {
-    int h = 0;
-    char val[] = s.toCharArray();
-    int len = val.length;
-
-    for (int i = 0 ; i < len; i++) {
-      h &= 0x7fffffff;
-      h = (((h >> 30) | (h << 1)) ^ (val[i]+i));
-    }
-
-    return (h << 8) | (len & 0xff);
-  }
-
-  /**
-   * Liefert Default-Wert def zur?ck, wenn String <code>s</code>
-   * kein Integer ist.
-   *
-   * @param s
-   * @param def
-   * @return geparster int aus s oder def
-   */
-  public static int parseInt(String s, int def) {
-    if (s == null) return def;
-    try {
-      return Integer.parseInt(s);
-    } catch (NumberFormatException e) {
-      return def;
-    }
-  }
-
-  /**
-   * Liefert Defaultwert def zur?ck, wenn s nicht zu einem float geparsed werden kann.
-   * @param s
-   * @param def
-   * @return geparster float oder def
-   */
-  public static float parseFloat(String s, float def) {
-    if (s == null) return def;
-    try {
-      return new Float(s).floatValue();
-    } catch (NumberFormatException e) {
-      return def;
-    }
-  }
-
-  /**
-   * Findet Ende eines Satzes in String <code>text</code>
-   * @param text
-   * @param startIndex
-   * @return index des Satzendes, oder -1
-   */
-  public static int findEndOfSentence(String text, int startIndex) {
-    while (true) {
-      int i = text.indexOf('.', startIndex);
-      if (i < 0) return -1;
-      if (i > 0 && !Character.isDigit(text.charAt(i-1)) &&
-          (i+1 >= text.length()
-          || text.charAt(i+1) == ' '
-          || text.charAt(i+1) == '\n'
-          || text.charAt(i+1) == '\t'))
-        return i+1;
-      startIndex = i+1;
-    }
-  }
-
-  /**
-   * Findet Wortende in String <code>text</code> ab <code>startIndex</code>
-   * @param text
-   * @param startIndex
-   * @return Index des Wortendes, oder -1
-   */
-  public static int findEndOfWord(String text, int startIndex) {
-    int i = text.indexOf(' ', startIndex),
-    j = text.indexOf('\n', startIndex);
-    if (i < 0) i = text.length();
-    if (j < 0) j = text.length();
-    return Math.min(i, j);
-  }
-
-
-  /**
-   *  convertNewline2P ist eine regex-routine zum umwandeln von 2 oder mehr newlines (\n)
-   *  in den html-tag <p>
-   *  nur sinnvoll, wenn text nicht im html-format eingegeben
-   */
-  public static String convertNewline2P(String haystack) {
-    return re_brbr2p.substituteAll(haystack,"\n</p><p>");
-  }
-
-  /**
-   *  convertNewline2Break ist eine regex-routine zum umwandeln von 1 newline (\n)
-   *  in den html-tag <br>
-   *  nur sinnvoll, wenn text nicht im html-format eingegeben
-   */
-  public static String convertNewline2Break(String haystack) {
-    return re_newline2br.substituteAll(haystack,"$0<br />");
-  }
-
-  /**
-   *  createMailLinks wandelt text im email-adressenformat
-   *  in einen klickbaren link um
-   *  nur sinnvoll, wenn text nicht im html-format eingegeben
-   */
-  public static String createMailLinks(String haystack) {
-    return re_mail.substituteAll(haystack,"<a href=\"mailto:$0\">$0</a>");
-  }
-
-
-  /**
-   *  createMailLinks wandelt text im email-adressenformat
-   *  in einen klickbaren link um
-   *  nur sinnvoll, wenn text nicht im html-format eingegeben
-   */
-  public static String createMailLinks(String haystack, String imageRoot, String mailImage) {
-    return re_mail.substituteAll(haystack,"<img src=\""+imageRoot+"/"+mailImage+"\" border=\"0\"/>&#160;<a href=\"mailto:$0\">$0</a>");
-  }
-
-
-  /**
-   *  createURLLinks wandelt text im url-format
-   *  in einen klickbaren link um
-   *  nur sinnvoll, wenn text nicht im html-format eingegeben
-   */
-  public static String createURLLinks(String haystack) {
-    return re_url.substituteAll(haystack,"<a href=\"$0\">$0</a>");
-  }
-
-  /**
-   * this routine takes text in url format and makes
-   * a clickaeble "<href>" link removing any "illegal" html tags
-   * @param haystack, the url
-   * @param title, the href link text
-   * @param imagRoot, the place to find icons
-   * @param extImage, the url of the icon to show next to the link
-   * @return a String containing the url
-   */
-  public static String createURLLinks(String haystack, String title, String imageRoot,String extImage) {
-    if (title == null) {
-      return re_url.substituteAll(haystack,"<img src=\""+imageRoot+"/"+extImage+"\" border=\"0\"/>&#160;<a href=\"$0\">$0</a>");
-    } else {
-      title = removeHTMLTags(title);
-      return re_url.substituteAll(haystack,"<img src=\""+imageRoot+"/"+extImage+"\" border=\"0\"/>&#160;<a href=\"$0\">"+title+"</a>");
-    }
-  }
-
-  /**
-   * this routine takes text in url format and makes
-   * a clickaeble "<href>" link removing any "illegal" html tags
-   * @param haystack, the url
-   * @param imageRoot, the place to find icons
-   * @param extImage, the url of the icon to show next to the link
-   * @param intImage, unused
-   * @return a String containing the url
-   */
-  public static String createURLLinks(String haystack, String title, String imageRoot,String extImage,String intImage) {
-    return createURLLinks(haystack, title, imageRoot, extImage);
-  }
-
-  /**
-   * this method deletes all html tags
-   */
-  public static final String removeHTMLTags(String haystack){
-    return re_tags.substituteAll(haystack,"");
-  }
-
-  /**
-   * this method deletes all but the approved tags html tags
-   * it also deletes approved tags which contain malicious-looking attributes and doesn't work at all
-   */
-  public static String approveHTMLTags(String haystack){
-    try {
-      String approvedTags="a|img|h1|h2|h3|h4|h5|h6|br|b|i|strong|p";
-      String badAttributes="onAbort|onBlur|onChange|onClick|onDblClick|onDragDrop|onError|onFocus|onKeyDown|onKeyPress|onKeyUp|onLoad|onMouseDown|onMouseMove|onMouseOut|onMouseOver|onMouseUp|onMove|onReset|onResize|onSelect|onSubmit|onUnload";
-      String approvedProtocols="rtsp|http|ftp|https|freenet|mailto";
-
-      // kill all the bad tags that have attributes
-      String s = "<\\s*/?\\s*(?!(("+approvedTags+")\\s))\\w+\\s[^>]*>";
-      RE regex = new RE(s,RE.REG_ICASE);
-      haystack = regex.substituteAll(haystack,"");
-
-      // kill all the bad tags that are attributeless
-      regex = new RE("<\\s*/?\\s*(?!(("+approvedTags+")\\s*>))\\w+\\s*>",RE.REG_ICASE);
-      haystack = regex.substituteAll(haystack,"");
-
-      // kill all the tags which have a javascript attribute like onLoad
-      regex = new RE("<[^>]*("+badAttributes+")[^>]*>",RE.REG_ICASE);
-      haystack = regex.substituteAll(haystack,"");
-
-      // kill all the tags which include a url to an unacceptable protocol
-      regex = new RE("<\\s*a\\s+[^>]*href=(?!(\'|\")?("+approvedProtocols+"))[^>]*>",RE.REG_ICASE);
-      haystack = regex.substituteAll(haystack,"");
-
-      return haystack;
-    } catch(REException ex){
-      ex.printStackTrace();
-      return null;
-    }
-  }
-
-
-  /**
-   *  createHTML ruft alle regex-methoden zum unwandeln eines nicht
-   *  htmlcodierten string auf und returnt einen htmlcodierten String
-   */
-  public static String createHTML(String content){
-    content=convertNewline2Break(content);
-    content=convertNewline2P(content);
-    content=createMailLinks(content);
-    content=createURLLinks(content);
-    return content;
-  }
-
-
-  /**
-   *  createHTML ruft alle regex-methoden zum unwandeln eines nicht
-   *  htmlcodierten string auf und returnt einen htmlcodierten String
-   */
-  public static String createHTML(String content,String producerDocRoot,String mailImage,String extImage,String intImage){
-    content=convertNewline2Break(content);
-    content=convertNewline2P(content);
-    content=createMailLinks(content,producerDocRoot,mailImage);
-    content=createURLLinks(content,null,producerDocRoot,extImage,intImage);
-    return content;
-  }
-
-}
-
+/*\r
+ * Copyright (C) 2001, 2002 The Mir-coders group\r
+ *\r
+ * This file is part of Mir.\r
+ *\r
+ * Mir is free software; you can redistribute it and/or modify\r
+ * it under the terms of the GNU General Public License as published by\r
+ * the Free Software Foundation; either version 2 of the License, or\r
+ * (at your option) any later version.\r
+ *\r
+ * Mir is distributed in the hope that it will be useful,\r
+ * but WITHOUT ANY WARRANTY; without even the implied warranty of\r
+ * MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE.  See the\r
+ * GNU General Public License for more details.\r
+ *\r
+ * You should have received a copy of the GNU General Public License\r
+ * along with Mir; if not, write to the Free Software\r
+ * Foundation, Inc., 59 Temple Place, Suite 330, Boston, MA  02111-1307  USA\r
+ *\r
+ * In addition, as a special exception, The Mir-coders gives permission to link\r
+ * the code of this program with  any library licensed under the Apache Software License,\r
+ * The Sun (tm) Java Advanced Imaging library (JAI), The Sun JIMI library\r
+ * (or with modified versions of the above that use the same license as the above),\r
+ * and distribute linked combinations including the two.  You must obey the\r
+ * GNU General Public License in all respects for all of the code used other than\r
+ * the above mentioned libraries.  If you modify this file, you may extend this\r
+ * exception to your version of the file, but you are not obligated to do so.\r
+ * If you do not wish to do so, delete this exception statement from your version.\r
+ */\r
+package  mir.misc;\r
+\r
+import java.text.NumberFormat;\r
+import java.util.Calendar;\r
+import java.util.Date;\r
+import java.util.GregorianCalendar;\r
+import java.util.TimeZone;\r
+\r
+import gnu.regexp.RE;\r
+import gnu.regexp.REException;\r
+\r
+/**\r
+ * Statische Hilfsmethoden zur Stringbehandlung\r
+ *\r
+ * @version $Id: StringUtil.java,v 1.34 2003/09/03 18:29:02 zapata Exp $\r
+ * @author mir-coders group\r
+ *\r
+ */\r
+public final class StringUtil {\r
+\r
+  private static RE   re_newline2br, re_brbr2p, re_mail, re_url, re_tags,\r
+                      re_tables, re_forbiddenTags;\r
+\r
+  private StringUtil() { }  // this avoids contruction\r
+\r
+  static {\r
+    try {\r
+      //precompile regex\r
+      re_newline2br = new RE("(\r?\n){1}");\r
+      re_brbr2p     = new RE("(<br>\r?\n<br>){1,}");\r
+      re_mail       = new RE("\\b([a-zA-Z0-9_.-]+)@([a-zA-Z0-9_-]+)\\.([a-zA-Z0-9_.-]+)\\b");\r
+      re_url        = new RE("((https://)|(http://)|(ftp://)){1}([a-zA-Z0-9_-]+).([a-zA-Z0-9_.:-]+)/?([^ \t\r\n<>\\)\\]]+[^ \t\r\n.,<>\\)\\]])");\r
+      re_tags       = new RE("<[^>]*>",RE.REG_ICASE);\r
+      re_tables = new RE("<[ \t\r\n/]*(table|td|tr)[ \t\r\n]*>",RE.REG_ICASE);\r
+      re_forbiddenTags = new RE("<[ \t\r\n/]*(html|meta|body|head|script)[ \t\r\n]*>",RE.REG_ICASE);\r
+    }\r
+    catch (REException e){\r
+      System.err.println("FATAL: StringUtil: could not precompile REGEX: "+e.toString());\r
+    }\r
+  }\r
+\r
+  /**\r
+   * Formats a number with the specified minimum and maximum number of digits.\r
+   **/\r
+  public static synchronized String zeroPaddingNumber(long value, int minDigits,\r
+      int maxDigits)\r
+  {\r
+    NumberFormat numberFormat = NumberFormat.getInstance();\r
+    numberFormat.setMinimumIntegerDigits(minDigits);\r
+    numberFormat.setMaximumIntegerDigits(maxDigits);\r
+    return numberFormat.format(value);\r
+  }\r
+\r
+  /**\r
+   * Wandelt Datum in einen 8-ziffrigen String um (yyyymmdd)\r
+   * @param theDate\r
+   * @return 8-ziffriger String (yyyymmdd)\r
+   */\r
+\r
+  public static final String date2webdbDate (GregorianCalendar theDate) {\r
+    StringBuffer webdbDate = new StringBuffer();\r
+    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));\r
+    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));\r
+    webdbDate.append(pad2(theDate.get(Calendar.DATE)));\r
+    return  webdbDate.toString();\r
+  }\r
+\r
+  /**\r
+   * Wandelt Calendar in einen 12-ziffrigen String um (yyyymmddhhmm)\r
+   * @param theDate\r
+   * @return 12-ziffriger String (yyyymmdd)\r
+   */\r
+\r
+  public static final String date2webdbDateTime (GregorianCalendar theDate) {\r
+    StringBuffer webdbDate = new StringBuffer();\r
+    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));\r
+    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));\r
+    webdbDate.append(pad2(theDate.get(Calendar.DATE)));\r
+    webdbDate.append(pad2(theDate.get(Calendar.HOUR)));\r
+    webdbDate.append(pad2(theDate.get(Calendar.MINUTE)));\r
+    return  webdbDate.toString();\r
+  }\r
+\r
+  /**\r
+   * Return a http://www.w3.org/TR/NOTE-datetime formatted date (yyyy-mm-ddThh:mm:ssTZ)\r
+   * @param theDate\r
+   * @return w3approved datetime\r
+   */\r
+\r
+  public static final String date2w3DateTime (GregorianCalendar theDate) {\r
+    StringBuffer webdbDate = new StringBuffer();\r
+    webdbDate.append(String.valueOf(theDate.get(Calendar.YEAR)));\r
+    webdbDate.append("-");\r
+    webdbDate.append(pad2(theDate.get(Calendar.MONTH) + 1));\r
+    webdbDate.append("-");\r
+    webdbDate.append(pad2(theDate.get(Calendar.DATE)));\r
+    webdbDate.append("T");\r
+    webdbDate.append(pad2(theDate.get(Calendar.HOUR_OF_DAY)));\r
+    webdbDate.append(":");\r
+    webdbDate.append(pad2(theDate.get(Calendar.MINUTE)));\r
+    webdbDate.append(":");\r
+    webdbDate.append(pad2(theDate.get(Calendar.SECOND)));\r
+    //assumes you are an hour-multiple away from UTC....\r
+    int offset=(theDate.get(Calendar.ZONE_OFFSET)/(60*60*1000));\r
+    if (offset < 0){\r
+      webdbDate.append("-");\r
+    }\r
+    else{\r
+      webdbDate.append("+");\r
+    }\r
+    webdbDate.append(pad2(Math.abs(offset)));\r
+    webdbDate.append(":00");\r
+    return  webdbDate.toString();\r
+  }\r
+\r
+  /**\r
+   * wandelt Calendar in dd.mm.yyyy / hh.mm um\r
+   * @param theDate\r
+   * @return String mit (dd.mm.yyyy / hh.mm um)\r
+   */\r
+  public static String date2readableDateTime (GregorianCalendar theDate) {\r
+    String readable = "";\r
+    int hour;\r
+    readable += pad2(theDate.get(Calendar.DATE));\r
+    readable += "." + pad2(theDate.get(Calendar.MONTH) + 1);\r
+    readable += "." + String.valueOf(theDate.get(Calendar.YEAR));\r
+    hour = theDate.get(Calendar.HOUR);\r
+    if (theDate.get(Calendar.AM_PM) == Calendar.PM)\r
+      hour += 12;\r
+    readable += " / " + pad2(hour);\r
+    readable += ":" + pad2(theDate.get(Calendar.MINUTE));\r
+    return  readable;\r
+  }\r
+\r
+  /**\r
+  *  deleteForbiddenTags\r
+  *  this method deletes all <script>, <body> and <head>-tags\r
+  */\r
+  public static final String deleteForbiddenTags(String haystack) {\r
+    return re_forbiddenTags.substituteAll(haystack,"");\r
+  }\r
+\r
+  /**\r
+   *  deleteHTMLTableTags\r
+   *  this method deletes all <table>, <tr> and <td>-tags\r
+   */\r
+  public static final String deleteHTMLTableTags(String haystack) {\r
+    return re_tables.substituteAll(haystack,"");\r
+  }\r
+\r
+  /**\r
+   * wandelt eine Datum in einen 8-buchstabigen String, der durch <code>/</code>\r
+   * getrennt ist.\r
+   *\r
+   * @param webdbDate\r
+   * @return String mit <code>/yyyy/mm/dd</code>\r
+   */\r
+  public static final String webdbDate2path (String webdbDate) {\r
+    StringBuffer path = new StringBuffer();\r
+    path.append("/").append(webdbDate.substring(0, 4));\r
+    path.append("/").append(webdbDate.substring(4, 6));\r
+    path.append("/");\r
+    //who did this?\r
+    //path.append("/").append(webdbDate.substring(6, 8));\r
+    return  path.toString();\r
+  }\r
+\r
+  /**\r
+   * Ersetzt in String <code>s</code> das Regexp <code>pattern</code> durch <code>substitute</code>\r
+   * @param s\r
+   * @param pattern\r
+   * @param substitute\r
+   * @return String mit den Ersetzungen\r
+   */\r
+  public static String regexpReplace(String haystack, String pattern, String substitute) {\r
+    try {\r
+      RE regex = new RE(pattern);\r
+      return regex.substituteAll(haystack,substitute);\r
+    } catch(REException ex){\r
+      return null;\r
+    }\r
+  }\r
+\r
+  /**\r
+   * L?scht <code>/</code> am Ende des Strings, falls vorhanden\r
+   * @param path\r
+   * @return String ohne <code>/</code> am Ende\r
+   */\r
+  public static final String removeSlash (String path) {\r
+    return  path.length() > 1 && path.endsWith("/") ? path.substring(0, path.length()\r
+        - 1) : path;\r
+  }\r
+\r
+  /**\r
+   * formatiert eine Zahl (0-99) zweistellig (z.B. 5 -> 05)\r
+   * @return zwistellige Zahl\r
+   */\r
+  public static String pad2 (int number) {\r
+    return  number < 10 ? "0" + number : String.valueOf(number);\r
+  }\r
+\r
+  /**\r
+   * formatiert eine Zahl (0-999) dreistellig (z.B. 7 -> 007)\r
+   *\r
+   * @return 3-stellige Zahl\r
+   */\r
+  public static String pad3 (int number) {\r
+    return  number < 10 ? "00" + number : number < 100 ? "0" + number : String.valueOf(number);\r
+  }\r
+\r
+  /**\r
+   * Liefert Default-Wert def zur?ck, wenn String <code>s</code>\r
+   * kein Integer ist.\r
+   *\r
+   * @param s\r
+   * @param def\r
+   * @return geparster int aus s oder def\r
+   */\r
+  public static int parseInt(String s, int def) {\r
+    if (s == null) return def;\r
+    try {\r
+      return Integer.parseInt(s);\r
+    } catch (NumberFormatException e) {\r
+      return def;\r
+    }\r
+  }\r
+\r
+\r
+  /**\r
+   *  convertNewline2P ist eine regex-routine zum umwandeln von 2 oder mehr newlines (\n)\r
+   *  in den html-tag <p>\r
+   *  nur sinnvoll, wenn text nicht im html-format eingegeben\r
+   */\r
+  public static String convertNewline2P(String haystack) {\r
+    return re_brbr2p.substituteAll(haystack,"\n</p><p>");\r
+  }\r
+\r
+  /**\r
+   *  convertNewline2Break ist eine regex-routine zum umwandeln von 1 newline (\n)\r
+   *  in den html-tag <br>\r
+   *  nur sinnvoll, wenn text nicht im html-format eingegeben\r
+   */\r
+  public static String convertNewline2Break(String haystack) {\r
+    return re_newline2br.substituteAll(haystack,"$0<br />");\r
+  }\r
+\r
+  /**\r
+   *  createMailLinks wandelt text im email-adressenformat\r
+   *  in einen klickbaren link um\r
+   *  nur sinnvoll, wenn text nicht im html-format eingegeben\r
+   */\r
+  public static String createMailLinks(String haystack) {\r
+    return re_mail.substituteAll(haystack,"<a href=\"mailto:$0\">$0</a>");\r
+  }\r
+\r
+\r
+  /**\r
+   *  createMailLinks wandelt text im email-adressenformat\r
+   *  in einen klickbaren link um\r
+   *  nur sinnvoll, wenn text nicht im html-format eingegeben\r
+   */\r
+  public static String createMailLinks(String haystack, String imageRoot, String mailImage) {\r
+    return re_mail.substituteAll(haystack,"<img src=\""+imageRoot+"/"+mailImage+"\" border=\"0\"/>&#160;<a href=\"mailto:$0\">$0</a>");\r
+  }\r
+\r
+\r
+  /**\r
+   *  createURLLinks wandelt text im url-format\r
+   *  in einen klickbaren link um\r
+   *  nur sinnvoll, wenn text nicht im html-format eingegeben\r
+   */\r
+  public static String createURLLinks(String haystack) {\r
+    return re_url.substituteAll(haystack,"<a href=\"$0\">$0</a>");\r
+  }\r
+\r
+  /**\r
+   * this routine takes text in url format and makes\r
+   * a clickaeble "<href>" link removing any "illegal" html tags\r
+   * @param haystack, the url\r
+   * @param title, the href link text\r
+   * @param imagRoot, the place to find icons\r
+   * @param extImage, the url of the icon to show next to the link\r
+   * @return a String containing the url\r
+   */\r
+  public static String createURLLinks(String haystack, String title, String imageRoot,String extImage) {\r
+    if (title == null) {\r
+      return re_url.substituteAll(haystack,"<img src=\""+imageRoot+"/"+extImage+"\" border=\"0\"/>&#160;<a href=\"$0\">$0</a>");\r
+    } else {\r
+      title = removeHTMLTags(title);\r
+      return re_url.substituteAll(haystack,"<img src=\""+imageRoot+"/"+extImage+"\" border=\"0\"/>&#160;<a href=\"$0\">"+title+"</a>");\r
+    }\r
+  }\r
+\r
+  /**\r
+   * this routine takes text in url format and makes\r
+   * a clickaeble "<href>" link removing any "illegal" html tags\r
+   * @param haystack, the url\r
+   * @param imageRoot, the place to find icons\r
+   * @param extImage, the url of the icon to show next to the link\r
+   * @param intImage, unused\r
+   * @return a String containing the url\r
+   */\r
+  public static String createURLLinks(String haystack, String title, String imageRoot,String extImage,String intImage) {\r
+    return createURLLinks(haystack, title, imageRoot, extImage);\r
+  }\r
+\r
+  /**\r
+   * this method deletes all html tags\r
+   */\r
+  public static final String removeHTMLTags(String haystack){\r
+    return re_tags.substituteAll(haystack,"");\r
+  }\r
+\r
+  /**\r
+   * this method deletes all but the approved tags html tags\r
+   * it also deletes approved tags which contain malicious-looking attributes and doesn't work at all\r
+   */\r
+  public static String approveHTMLTags(String haystack){\r
+    try {\r
+      String approvedTags="a|img|h1|h2|h3|h4|h5|h6|br|b|i|strong|p";\r
+      String badAttributes="onAbort|onBlur|onChange|onClick|onDblClick|onDragDrop|onError|onFocus|onKeyDown|onKeyPress|onKeyUp|onLoad|onMouseDown|onMouseMove|onMouseOut|onMouseOver|onMouseUp|onMove|onReset|onResize|onSelect|onSubmit|onUnload";\r
+      String approvedProtocols="rtsp|http|ftp|https|freenet|mailto";\r
+\r
+      // kill all the bad tags that have attributes\r
+      String s = "<\\s*/?\\s*(?!(("+approvedTags+")\\s))\\w+\\s[^>]*>";\r
+      RE regex = new RE(s,RE.REG_ICASE);\r
+      haystack = regex.substituteAll(haystack,"");\r
+\r
+      // kill all the bad tags that are attributeless\r
+      regex = new RE("<\\s*/?\\s*(?!(("+approvedTags+")\\s*>))\\w+\\s*>",RE.REG_ICASE);\r
+      haystack = regex.substituteAll(haystack,"");\r
+\r
+      // kill all the tags which have a javascript attribute like onLoad\r
+      regex = new RE("<[^>]*("+badAttributes+")[^>]*>",RE.REG_ICASE);\r
+      haystack = regex.substituteAll(haystack,"");\r
+\r
+      // kill all the tags which include a url to an unacceptable protocol\r
+      regex = new RE("<\\s*a\\s+[^>]*href=(?!(\'|\")?("+approvedProtocols+"))[^>]*>",RE.REG_ICASE);\r
+      haystack = regex.substituteAll(haystack,"");\r
+\r
+      return haystack;\r
+    } catch(REException ex){\r
+      ex.printStackTrace();\r
+      return null;\r
+    }\r
+  }\r
+\r
+\r
+  /**\r
+   *  createHTML ruft alle regex-methoden zum unwandeln eines nicht\r
+   *  htmlcodierten string auf und returnt einen htmlcodierten String\r
+   */\r
+  public static String createHTML(String content){\r
+    content=convertNewline2Break(content);\r
+    content=convertNewline2P(content);\r
+    content=createMailLinks(content);\r
+    content=createURLLinks(content);\r
+    return content;\r
+  }\r
+\r
+\r
+  /**\r
+   *  createHTML ruft alle regex-methoden zum unwandeln eines nicht\r
+   *  htmlcodierten string auf und returnt einen htmlcodierten String\r
+   */\r
+  public static String createHTML(String content,String producerDocRoot,String mailImage,String extImage,String intImage){\r
+    content=convertNewline2Break(content);\r
+    content=convertNewline2P(content);\r
+    content=createMailLinks(content,producerDocRoot,mailImage);\r
+    content=createURLLinks(content,null,producerDocRoot,extImage,intImage);\r
+    return content;\r
+  }\r
+\r
+  /**\r
+   * Converts mir's horrible internal date format (yyyy-MM-dd HH:mm:ss+zz) into a java Date\r
+   *\r
+   * @param anInternalDate\r
+   * @return\r
+   */\r
+  public static Date convertMirInternalDateToDate(String anInternalDate) {\r
+    Calendar calendar = new GregorianCalendar();\r
+\r
+    int year;\r
+    int month;\r
+    int day;\r
+    int hours;\r
+    int minutes;\r
+    int seconds;\r
+    int timezoneOffset;\r
+\r
+    year = Integer.parseInt(anInternalDate.substring(0,4));\r
+    month = Integer.parseInt(anInternalDate.substring(5,7));\r
+    day = Integer.parseInt(anInternalDate.substring(8,10));\r
+    hours = Integer.parseInt(anInternalDate.substring(11,13));\r
+    minutes = Integer.parseInt(anInternalDate.substring(14,16));\r
+    seconds = Integer.parseInt(anInternalDate.substring(17,19));\r
+\r
+    timezoneOffset = Integer.parseInt(anInternalDate.substring(20,22));\r
+    if (anInternalDate.charAt(19) == '-')\r
+      timezoneOffset = -timezoneOffset;\r
+\r
+    calendar.setTimeZone(TimeZone.getTimeZone("UTC"));\r
+    calendar.set(year, month-1, day, hours, minutes, seconds);\r
+    calendar.add(Calendar.HOUR, -timezoneOffset);\r
+\r
+    return calendar.getTime();\r
+  }\r
+\r
+}\r
+\r