Start > Algorithmik > txt2htm

txt2htm: Text-zu-HTML-Konverter

Das Programm txt2htm konvertiert Text- zu HTML-Dateien. Im Gegensatz zu vielen Konvertern wird jede Zeile als Absatz gewertet.

  1. Funktionsumfang
  2. Systemvoraussetzungen
  3. Download
  4. Installation und Deinstallation
  5. Nutzung

Funktionsumfang

Formate

Unterstützt werden Überschriften (<h1>-<h6>), Listen (<ol>, <ul>), Blockzitate (<blockquote>), Absätze (<p>), Zeilenumbrüche (<br>) und Hervorhebungen (<em>). Listen (auch unterschiedlichen Typs) können verschachtelt werden. Der Grad der Einrückung bei Listen wird nur durch den Einzug bestimmt (zwei führende Leerzeichen entsprechen je einem Grad).

Leerraum

Viele HTML-Generatoren behandeln mehrere Zeilen, die durch eine Leerzeile beendet werden, als Absatz. txt2htm hingegen behandelt jede Zeile (sofern sie nicht anderweitigen Formaten entspricht) als Absatz, Leerzeilen werden ignoriert. Mehrfach vorhandener Leerraum wird außerdem gnadenlos auf einen Leerraum komprimiert, führender und nachgestellter Leerraum normalerweise entfernt; wird jedoch die Option /b angegeben, werden Absatz­einrückungen (ab zwei Leerzeichen) als Blockzitat formatiert (und somit eingerückt formatiert), ohne daß sie mit '> ' gekennzeichnet werden müssen.

Formatschablonen

Existiert die optionale Datei txt2htm.inc, wird deren Inhalt als HTML-Kopf verwendet (z. B. für CSS-Formatierungen); alternativ kann auch der Name einer anderen Kopfdatei dem Programm übergeben werden.

Weitere Funktionen können bei Bedarf schnell eingebaut werden. Der nachstehende Hilfetext des Programmes erklärt Einzelheiten der Formatierung:

txt2htm: Text-zu-HTML-Konverter V1.0.1.1.

Syntax: txt2htm [/Option] <Textdatei> [HTML-Kopfdatei]

Optionen:
/?              Diese Hilfe
/b              Formatiere Einzuege auch ohne '> ' als <BLOCKQUOTE>

Formate:
<H1-6>          '# ', '## ' etc.
<OL>            '2. ', '    3.1. ' etc. Listentiefe = Einzugbreite x 2.
<UL>            '- ', '  - ', '* ' etc. Listentiefe = Einzugbreite x 2.
<BLOCKQUOTE>    '> '
<P>             Jeder andere, unformatierte Absatz
<BR>            2 Leerzeichen am Zeilenende innerhalb P oder BLOCKQUOTE
<EM>            '_Hervorgehoben_'

Text wird im Zeichensatz 1252 erwartet und nach ISO 8859-1 konvertiert.
Der Name der Ausgabedatei entspricht der Eingabedatei, vermehrt um .html.
NBSP (0xA0) und SHY (0xAD) sind direkt nutzbar. Die nicht in ISO 8859-1
enthaltenen Zeichen 0x80-0x9F werden zu HTML-Entitaeten konvertiert.
Ist keine HTML-Kopfdatei angegeben, wird txt2htm.inc verwendet.

Die Konvertierung sei beispielhaft anhand des nachfolgenden Textes demonstriert, der alle deutschen und französischen und viele spanische und italienische Umlaute sowie bedingte Trennstriche (0xAD), geschützte Leerzeichen (0xA0), Anführungszeichen, Auslassungen und Gedankenstriche enthält:

# Briefe eines Unbekannten¶
¶
## Tag 92¶
Österlich schöne Stimmung stellte sich ein, als er immer öfter Lerchen am Himmel erblickte. Übermüdet übersah er das Schlagloch. Sein Ärger hätte ärger nicht sein können: Daß ihm so ein Mißgeschick gerade im Sommer­kinder­ferien­lager­leiter­vorbereitungs­lehr­gang zustieß! Egal — sein Œvre war mit dem Buch über Ægosthènes fast beendet; der Schlußsatz geschrieben: « Dès Noël où un zéphyr haï me vêt de glaçons würmiens je dîne d’exquis rôtis de bœuf au kir à l’aÿ d’âge mûr & cætera … »¶
Ihm fiel wieder der alte Storm-Spruch ein:¶
> »Gleich so wie Rauch und Staub verschwindt,  ¶
> Also sind auch die Menschenkind.Ǧ
Er rappelte sich auf und zog widerwillig seine „Fronliste“, wie er sie spöttisch nannte, aus der Tasche:¶
* Schlußkapitel überdenken¶
Überdenken? Das schien zu wenig und er erweiterte sie:¶
1. Schlußkapitel _neu_ denken!¶
  1.1. Gutes Ende finden¶
  1.2. Ein Schlußwort für die Leser¶
2. Vergangenheitsform setzen¶
Ja, so mußte sein Schlußwerk enden. Aber nicht heute. ¿Mañana? ¡Mañana!¶

und im HTML-Format sich so darstellt:

Systemvoraussetzungen

Benötigt wird das Betriebs­system Windows oder Linux , unter denen auch getestet wurde. Dies schließt nicht aus, daß das Programm unter anderen Systemen kompilierbar und lauffähig ist, wurde aber nicht überprüft.

Download

Quellen

Wer txt2htm selbst kompilieren will, kann den Quelltext im Browser als Text­datei mit der Datei­erweiterung .c lokal speichern:

text2htm.c

Der Quelltext sollte von jedem C-Compiler problemlos übersetzt werden. Wer noch keinen Compiler sein eigen nennt, kann einen solchen im Netz frei und kostenlos herunterladen, z. die Kommando­zeilen­version BCC32 von Borlands Entwicklungs­umgebung oder die Expreß-Edition von Visual C. Getestet wurde der Quelltext unter BCC32 V5.5.1, LCC-WIN32 V3.8, MSC V15.0 (Visual C 2008), Pelles C für Windows V7.00.25, GCC 4.8.1. und 4.0.2.

Anm.: Die Zeichensatz-Unterstützung differiert von Compiler zu Compiler, s. a. Compiler-Test.

Ausführbare Kompilate

Wer txt2htm nicht selbst kompilieren will, lädt die Kompilate für Windows oder Linux:

Windows: txt2htm.zip [11 KB, 32+64 bit, MD5]
Linux: txt2htm.gz [7 KB, 32 bit, MD5]

Empfehlenswert ist anschließend die Prüfung auf Virusfreiheit und Authentizität.

Installation und Deinstallation

Weder Installation noch Deinstallation sind notwendig. Das Programm kann in ein Verzeichnis der Wahl kopiert werden.

Nutzung

Hinweise zur Nutzung.

© 2015, 2018 asdala.de: Kon­takt & Daten­obhut