DIHYPH

 hyphenation

 Silbentrennung

DITECT 

spelling-check 

Rechtschreibprüfung 















































































































































































































































































































































































































































































































DIHYPH - Silbentrennungen

Division ou coupure des mots, division (silabica), divisione delle parole (in sillabe)



stehen für z.Zt. 52 verschiedene natürliche Sprachen zur Verfügung.

Sie sind z.T. seit mehr als 40 Jahren Bestandteil bekannter Text- und Publishing-Systeme.

Die Trennqualität der Programme ist weltweit anerkannt und wurde immer wieder durch - von unseren
Kunden durchgeführte - Vergleichstests mit anderen Trennprogrammen bestätigt.

Alle DIHYPH-Programme bestehen aus einer Kombination von Programm-Logik und -Tabellen.
Die Logik basiert auf den grammatischen Trennregeln der jeweiligen Sprache, ergänzt durch weitere
Algorithmen.
Wo die Trennregeln nicht ausreichen (zusammengesetzte Wörter, Spezialbegriffe, Fremdwörter),
korrigieren die Programmtabellen, die keine vollständigen Wörter, sondern Buchstabenkombinationen,
Fugenverbindungen usw. enthalten und Bestandteil der Programme sind.

Hierdurch wird die bekannt hohe Trenngenauigkeit und Schnelligkeit der DIHYPH-Programme - auch bei
neuen Wortschöpfungen und Fremdwörtern - erreicht.

DIHYPH-Programme trennen nicht nur Wörter mit höchster Genauigkeit, sondern auch alle denkbaren Namen,
Koppel- und Spezialbegriffe, die in Wörterbuchdateien gar nicht gespeichert werden könnten, da ihre
Kombinationsmöglichkeiten in die Millionen gehen:
M.-Laibach, Hohl-(Decken-)Ziegel, CAD-/CAM-Schule, MRX-4303, ISSN//ABO1, 10-fach, K+-Werte,
Abb.1/5D, 35-Std.-Woche
etc.

DIHYPH-Programme enthalten für jede Sprache Steuerparameter, die vom Anwender nach seinen Wünschen
angepasst werden können:
Minimale Wortlänge, minimale Vor- und Nachsilbenlänge, verbotene Trennstellen usw.

DIHYPH-Programme sind lernfähig,
da ganze oder verkürzte Begriffe in editierbare Ausnahmenlexika gespeichert werden können.
Für jede Sprache sind mehrere Ausnahmendateien definierbar !
Der verwendete Zeichencode kann - selbst noch beim Endanwender - durch editierbare Code-Dateien
angepasst werden.


Ästhetische Trennqualität

Trennungen wie "Autoren-nen", Anal-phabeten" oder "Urin-stinkt" sind nicht falsch, aber ästhetisch sehr
unschön und sinnentfremdend. Es ist daher gut, wenn die Silbentrennung zwischen guten und unschönen
Trennstellen unterscheiden kann.

DIHYPH meldet darum für jede Trennstelle eine Qualitätsnote zwischen 1 (beste) und 5 (schlechteste) an
das Publishing-System.
Die Qualitätsnoten werden in der DIHYPH-Logik bestimmt oder durch Eintragungen in den Ausnahmendateien.
Es liegt aber nicht an DIHYPH, wenn das Publishing-System diese Noten nicht ausreichend berücksichtigt.
DIHYPH gibt z.B. folgende Trennwerte zurück: Ur-2in-5stink-4te.
Wenn die Trennmöglichkeit "Urin-5" in die Zeilen-Randzone fällt, liegt es allein am Publishing-System, ob es
dort mit der sehr schlechten Trennung 5 umbricht, oder zwei Buchstaben zuvor an der guten Trennstelle "Ur-2" !

Andererseits sind nicht alle 5-er Trennungen so schlecht oder sinnentfremdend, dass man sie einfach
ignorieren sollte (z.B. "Bier-1de-5ckel"), speziell nicht bei schmalen Textspalten.

Der Effekt von Trennqualitätsstufen

Qualitätsstufe 1 Qualitätsstufe 5
 
Fahr-erlaubnis Fahrer-laubnis
Bade-insel Badein-sel
wohl-ergehen wohler-gehen
Acht-ender Achten-der


Häufige Trennfehler

Einige Silbentrennungsprogramme trennen folgende Stellen falsch
 Abt-reibung  Hau-saufgabe  Talg-rund  Alpeno-strand
 Heimatsch-lager  Tang-ente  Alter-steilzeit  Host-essen
 Tee-nager  Anal-phabeten  Kau-fladen  Urin-stinkt
 Anschlag-sorte  Kir-schwein  Verand-abrüstung  Autoren-nen
 Musi-knoten  Wachs-tube  Billi-greise  Nach-truhe
 Wasserschi-eber  Dudel-ei  Nachteil-zug  Zuck-erguss
 Eid-otter  Pan-amazone  Zwergel-stern  Eil-eiter
 Paten-trichter  abt-rennen  Einkauf-stempel  Punk-trichter
 anzug-leichen  Er-dachse  Schweinigel-ei  erd-rückend
 Fank-reise  Sieb-ente  erst-unken  Gas-traum
 Staat-sex-amen  verb-eulen  Gaul-eiter  Staub-ecken
 vers-ehen  Gel-ächter  Tal-entförderung  vers-unken

oder finden zu wenige oder gar keine Trennstellen, z.B.:
 Me-gaschul-den  Neu-austrieb  Not-fallspray  Nu-klearschlag
 Topleicht-ath-let  Vier-rohraus-puff  ab-pflücken  al-lerärgs-tes
 Ali-bier-ör-te-rung  Am-pe-restun-de  An-la-gei-dee  An-sichtsexem-plar
 an-zue-keln  Au-toak-tien  Auf-bauära  Bau-ernauf-stand
 Baui-dee  Baulücke  bezwe-cken  Brücken
 Dau-erängs-te  Dickicht  Dienstei-fer  Dop-pelblind-stu-die
 Ehean-bah-nung  Ein-kaufsta-sche  Eisstock  engstir-nig
 Etatauf-stel-lung  Exis-tenzangst  Fallobs-tes  Farban-strich
 Fe-derstiel  Fest-stoffra-ke-te  frohlo-cken  Geis-terer-schei-nung
 Handrücken  Heidschnu-cke  höchstrich-ter-lich  In-dus-triero-bo-ter
 In-krusta-tion  Jus-tizirr-tum  kaufstar-ke  Kro-ko-dilsträ-ne
 Kuckucksei  Lackstie-fel  Lostrom-mel  Mahl-zeitres-te
 Min-destab-stand  nahöst-lich  nichtstun  Non-stopflug
 Parklücke  Piz-zabä-cker  Por-zel-langlo-cken  Post-scheckamt
 Ranglis-te  raustre-ten  Re-formpäps-te  Rehrücken
 Ringstruk-tur  Sau-er-stofftank  scheelbli-ckend  Schulstress

Und viele mehr ...
Oft sind diese fehlenden Trennstellen die Fugen zwischen zusammengesetzten Wörtern und damit gerade
die wichtigsten Trennungen (Qualität 1).
Fehlende Trennstellen führen zu Sinnentstellung und großen Lücken in den Textzeilen !

DIHYPH-Silbentrennung kann das viel besser !



Mehrfache Trennmöglichkeiten

In einigen deutschen Lexika werden bei bestimmten Konsonantengruppen unterschiedliche Trennstellen
gleichrangig zugelassen. Z.Bsp. darf man trennen:
Fe-b-ruar   /   Kon-s-t-ruktion   /   Ex-t-rakt   /  u.a.,
was zur Folge hat, dass abhängig vom Zeilenfall ein solches Wort am Zeilenende auf jeweils andere Art
getrennt werden könnte. Bsp.:

	.... die im Brückenbau übliche Kon-
	     struktion ist  nicht für Kons- 
	     trukteure geeignet, die Konst-
	     ruieren als Form der ...
		 
Solch unterschiedliche Trennungen sind für den Leser sinnverzerrend und sollten unterbleiben.
DIHYPH-Silbentrennung wendet daher in Fällen dieser Art nur eine der möglichen Trennungen an und
zwar diejenige, die dem gewohnten Sprachgefühl entspricht:
Fe-bruar   /   Kon-str...   /   Ex-tra...



Erwünschte Trennstellen-Änderung

Bei Zusammensetzungen von deutschen mit Fremdwörtern kommt es z.T. zu Fehltrennungen, z.Bsp:   Ak-tien-de-al,  Me-tro-shutt-le,  Mo-bil-ho-me,  etc.
Solche Trennungen sind nach den deutschen Regeln zwar erlaubt und DIHYPH trennt sie mit hoher Wahrscheinlichkeit korrekt, aber unschöne oder falsche Trennungen sind dabei nicht auszuschließen.
Andererseits gibt es korrekte Trennstellen, die einige Anwender gern verhindern würden, z.Bsp:  i-on,  i-an,  i-um  u.a.
Solche Trennungen sollten für schmalen Spaltensatz verfügbar sein, bei breiten Spalten aber nicht verwendet werden.
Für diese Aufgaben wurde daher ein Algorithmus entwickelt, für den einmalig die Wortteile mit der kritischen Trennung (Regel-Strings) - auch direkt durch den Anwender - in eine Datei *) gespeichert werden können, wenn das Publishing-System das ermöglicht.
Durch diese Strings werden falsche oder unerwünschte Trennungen in allen derartigen Wortteilen entsprechend geändert oder gelöscht.
Nachstehend ist die Schreibweise solcher Strings beschrieben, aber Vorsicht:
die Anwendung ist mit großer Umsicht vorzunehmen, da undurchdachte Einträge Fehler im Trennergebnis bewirken können.

 String-Sonderzeichen  Erklärung
 "string  " in der 1. Spalte ist das Kennzeichen für Regel-Strings.

  :

 Doppelpunkt ist String-Begrenzer vor oder nach dem String.
 ":String  : vor dem String gilt nur am Anfang eines Wortes.
 "String:  : nach dem String gilt nur am Ende eines Wortes.

 Ohne String-Begrenzer gilt die Regel im ganzen Wort.

  -  a-z  A-Z  sind Suchbegriffszeichen und müssen gefunden werden,
 um die Regel anzuwenden.
  1  2  3  4  5  gewollte Trennstellen der Qualität  1=beste,  5=schlecht.
       z.Bsp:  Air2port1ho5tel1di5rek4tor
 - ist hierfür keine gewollte Trennstelle sondern ein Suchbegriff.
  #  Trennung an dieser Stelle löschen.


 String-Beispiel  Erklärung  Ergebnis-Beispiel
 "er1exper


 "5er1ex5per
 bei einer 1 oder 2 Qualitätstrennung werden
 vorhandene Trennungen zwei Buchstaben davor
 oder danach automatisch auf Qualität 5 abgeändert.
 Diese Schreibweise ist daher nicht nötig !
 Steu5er1ex5perte
 "i#on  Trennung  i-on  unerwünscht?  Auf # löschen.  Auk-tions-ort
 "i5um  Trennung  i-um  schlecht?  Auf 5 setzen.  Me-di5um
 "-li#che


 "li#che

 Trennung  -li-che  unerwünscht?  Auf # löschen,
 aber keine Änderung bei z.B.
 Aber Achtung, der folgende String (ohne -)  würde immer Löschung der Trennstelle bewirken !

 erb-liche
 ge-schli-chen

 ge-schlichen
 be-glichen
 "-ho#me  Trennung  -ho-me  unerwünscht?  Auf # löschen,
 aber keine Änderung bei z.B.
 mo-bil-home
 Ta-cho-me-ter
 "1fjord

 "1f#jord
 Seef-jord wird korrigiert. Trennstellen direkt  davor und danach werden automatisch gelöscht.
 Diese Schreibweise ist daher nicht nötig !
 see1fjord
 "de#al:  Nur am Wortende,
 daher keine Änderung bei z.B.
 Ban-ken-deal
 Ba-de-alarm
 ":als1ob:  nur als Einzelwort,
 daher keine Änderung bei z.B.
 als1ob
 al-so-bald
 ":as#sad  Nur am Wortanfang,
 daher keine Änderung bei z.B.
 Assad-re-gime
 Fas-sa-de
 ":as#sad1  am Wortanfang bewirkt z.B.  Assad1re5gime

*) Datei:   DHRL??.TXT  (?? = Sprachnr.).   Groß- / Kleinschreibung ist irrelevant.