Style - Texte formell auf Verständlichkeit prüfen
Hier erfuhr ich, dass es Methoden gibt, um die Lesbarkeit von Texten formal zu bestimmen - verschiedene Lesbarkeitsindexe ermöglichen es, die Lesbarkeit von Texten formal zu bestimmen. Mit style und diction stehen zwei Open- Source- Programme zur Verfügung, die es unter anderem ermöglichen, Lesbarkeitsindexe auf Texte anzuwenden, Passivformen und Nominalisierungen aufzuzeigen sowie abgedroschene Floskeln zu entlarven. Es existiert auch eine Windows-Version, welche die Nutzung der Programme über die Kommandozeile (Eingabeaufforderung) ermöglicht.
Anwendung
Lesbarkeitsindexe
Als Beispieltext soll hier der der Anfang meines Lieblingsbuches dienen. Um style auf diesen Text (gespeichert in der Datei "anhalter.txt") anzuwenden, rufe ich
es über die Kommandozeile auf:
style -L de anhalter.txt
Mit den Parametern -L de sage ich style, daß es sich hier um einen Text deutscher
Sprache handelt. Die Ausgabe sieht wie folgt aus:
Lesbarkeits-Stufen:Nachdem ich den Text etwas gekürzt und vereinfacht habe (anhalter_ueberarbeitet.txt),Kincaid: 20,2
ARI: 22,2
Coleman-Liau: 17,9
Flesch Index: 9,9
Fog Index: 23,5
Lix: 64,8 = höher als das 11. Schuljahr
SMOG-Grading: 14,0
Satz-Information:
383 Zeichen
67 Worte, durschnittliche Länge 5,72 Zeichen = 1,93 Silben
2 Sätze, durchschnittliche Länge 33,5 Worte
50% (1) kurze Sätze (hoechstens 29 Worte)
0% (0) lange Sätze (mindestens 44 Worte)
1 Absätze, durschnittliche Länge 2,0 Sätze
0% (0) Fragen
50% (1) passive Sätze
Längster Satz (40) enthält 2 Wort
Kürzester Satz (27) enthält 1 Worte
Satzanfang:
Pronomen (0) Fragepronomen (0) Artikel (0)
sieht die Ausgabe nun folgendermaßen aus:
Lesbarkeits-Stufen:(Mhh, ich sehe gerade, daß die Nummerierung der Sätze bei der Auflistung des längstenKincaid: 9,9
ARI: 9,4
Coleman-Liau: 15,1
Flesch Index: 45,7
Fog Index: 11,4
Lix: 39,4 = 6. Schuljahr
SMOG-Grading: 5,7
Satz-Information:
194 Zeichen
37 Worte, durchschnittliche Länge 5,24 Zeichen = 1,76 Silben
3 Sätze, durchschnittliche Länge 12,3 Worte
33% (1) kurze Sätze (hoechstens 7 Worte)
0% (0) lange Sätze (mindestens 22 Worte)
1 Absätze, durschnittliche Länge 3,0 Sätze
0% (0) Fragen
0% (0) passive Sätze
Längster Satz (17) enthält 3 Wort
Kürzester Satz ( 8) enthält 2 Worte
Satzanfang:
Pronomen (0) Fragepronomen (0) Artikel (0)
und kürzesten Satzes mit deren Wortanzahl vertauscht ist - da werde ich wohl mal dem Entwickler schreiben.)
Passivkonstruktionen
Um style alle Passivkonstruktionen in meinem Text aufzeigen zu lassen, rufe ich es wie folgt auf:
style -L de -p anhalter.txtUnd die Ausgabe:
anhalter.txt:3: Um sie kreist in einiger Entfernung von ungefähr achtundneunzigDer in Zeile 3 beginnende Satz ist also im Passiv geschrieben.
Millionen Meilen ein absolut unbedeutender, kleiner blaugrüner Planet,
dessen vom Affen stammende Bioformen so erstaunlich primitiv sind, daß
sie Digitaluhren noch immer für eine unwahrscheinlich tolle Erfindung
halten.Lesbarkeits-Stufen:
Kincaid: 20,2
ARI: 22,2
Coleman-Liau: 17,9
Flesch Index: 9,9
Fog Index: 23,5
Lix: 64,8 = höher als das 11. Schuljahr
SMOG-Grading: 14,0
Satz-Information:
383 Zeichen
67 Worte, durschnittliche Länge 5,72 Zeichen = 1,93 Silben
2 Sätze, durchschnittliche Länge 33,5 Worte
50% (1) kurze Sätze (hoechstens 29 Worte)
0% (0) lange Sätze (mindestens 44 Worte)
1 Absätze, durschnittliche Länge 2,0 Sätze
0% (0) Fragen
50% (1) passive Sätze
Längster Satz (40) enthält 2 Wort
Kürzester Satz (27) enthält 1 Worte
Satzanfang:
Pronomen (0) Fragepronomen (0) Artikel (0)
Nominalisierungen
Um Nominalisierungen anzeigen zu lassen, wird style mit dem Parameter -N aufgerufen:
style -L de -N anhalter.txt
Die Ausgabe entspricht in diesem Fall der oben stehenden, mit dem Unterschied, daß style nicht das Passivkonstrukt, sondern die Nominalisierung "Entfernung" anmahnt.
Fazit
Was die Funktion und die Sinnhaftigkeit von Verständlichkeitsformeln angeht bleibe ich weiter skeptisch - ein bloßes Auszählen des Textinhaltes sagt meiner Meinung nach noch nicht genügend über dessen Inhalt aus (vielleicht lehrt mich die Erfahrung in Zukunft besseres - ich werds ausprobieren).
Das Aufzeigen von Passivkonstruktionen und Nominalisierungen ist auf jeden Fall eine tolle Funktionalität - gerade für Strategen wie mich, die gerne mal die eine oder andere Nominalisierung in ihre Texte einbauen, die in die Kategorie »Überflüssigkeit« fällt ;)