Duden Korrekturserver: Release Notes¶
Duden Korrekturserver Version 1.9.0.380¶
Version 1.9.0 des Duden Korrekturservers basiert nun auf PHP 8.3. Die Basis des Docker-Images ist weiterhin Debian 11.
Ein Fehler im internen Session Cache wurde behoben, der bei der gleichzeitigen mehrfachen Verwendung externer Spellchecker und Silbentrennbibliotheken (hunspell bzw. hyphen) für mehr als eine Sprache (außer Deutsch, Englisch, Französisch und Spanisch) zu scheinbar zufälligem Verhalten geführt hat.
Für die Dokumentation wurde nun die deutsche Version der Benutzeroberfläche zugrunde gelegt.
Linguistische Verbesserungen¶
Die größten Änderungen in dieser Version betreffen die Silbentrennung für das Deutsche. Das Silbentrennwörterbuch wurde gründlich überarbeitet und Dudenempfehlungen für Silbentrennungen wurden eingefügt. Dem entspricht der neue Trennmodus „Dudenempfehlungen“.
Die vier aus der Duden-Silbentrennung in Adobe InDesign/InCopy bekannten Trennmodi wurden übernommen, um es Integratoren zu erleichtern, in ihren Anwendungen die gleichen Ergebnisse bei der Silbentrennung zu erreichen.
Der neue Fehlercode 77 korrigiert die Kommasetzung bei näheren Erläuterungen mit „wie“:
- „Ihre Auslagen, wie Fahrtkosten, Porto, oder
Kontoführungsgebühren erstatten wir Ihnen gern.“
Sie werden entweder ohne Komma angeschlossen oder in zwei Kommas eingeschlossen. Falsch ist hingegen ein einzelnes Komma vor dem „wie“, so wie hier im Beispiel.
Der neue Fehlercode 89 korrigiert fehlerhafte Relativpronomen. Wenn das Bezugswort eines Relativsatzes „dem“ ist, ist das richtige Relativpronomen nicht „das“, sondern „was“.
Der neue Fehlercode 279 schließlich kümmert sich um die Kongruenz zwischen Prädikativ und Verb, so wie hier:
„Größte Anbieter ist eine Firma in Frankfurt.“
Viele andere Fehlercodes wurden ausgebaut und verbessert, insbesondere die häufigen Codes 101 (falsche Getrenntschreibung von zusammengehörigen Nomen) und 140 (fehlerhafte Kongruenz in Nominalausdrücken).
Wie immer wurde das Lexikon ausgebaut und aktualisiert.
Duden Korrekturserver Version 1.8.2.374¶
Linguistische Verbesserungen¶
Eine Änderung beim Silbentrennalgorithmus erlaubt es nun, Wörter zu trennen, die länger sind als 78 Zeichen.
Der neue Fehlercode 278 steht bereits bei einer einfachen Rechtschreibprüfung zur Verfügung. Er korrigiert falsche Zusammensetzungen aus Verb + Verb wie „arbeitengehen“.
Fehlercode 80 ist neu in der Grammatikprüfung. Er korrigiert falsche Kommas zwischen Zahl und Einheit, wie z. B. hier: „Das sind 12, cm.“
Die Codes 257, 259, 260 und 263 zu Valenzfehlern wurden überarbeitet. Hier geht es darum, dass ein Wort eine Ergänzung in einem bestimmten Fall fordert, die Ergänzung aber in einem anderen Fall steht: Nominativ statt Dativ, Dativ statt Akkusativ, Dativ statt Genitiv usw. Zum Beispiel werden nun diese Fehler gefunden:
- „Der Grundstein dafür haben wir im letzten Jahr gelegt.“
„Ich gebe es die neue Kollegin.“ „Wen gehört das Fahrrad?“ „Der Sachverständige konnte keinem Fehler finden.“
Neu ist weiterhin, dass neben der Verbvalenz nun auch die Adjektivvalenz betrachtet wird: „Der Mitarbeiter versicherte den Kundinnen und Kunden, er sei sich dem Problem bewusst.“
Code 226, Spezialist für Wortverwechslungen, korrigiert nun auch falsches „zurecht“ wie in „Sie wird ganz zurecht eine der einfühlsamsten Mozartinterpretinnen genannt.“
Die Korrektur der Kommasetzung wurde verbessert, insbesondere im Bereich der fehlenden Kommas bei Nebensätzen (Codes 150 und 151).
Für viele andere Fehlercodes gab es Detailverbesserungen.
Das Silbentrennwörterbuch wurde aktualisiert, einige falsche Trennungen wurden korrigiert.
Duden Korrekturserver Version 1.8.1.373¶
Die Stilprüfung wurde in Version 1.8.1 des Duden Korrekturservers um eine Prüfung auf komplexen Satzbau erweitert. Die API-Parameter berücksichtigen nun die zusätzliche Option style-complexity. Die serverseitigen Korrekturprofile wurden entsprechend erweitert.
Linguistische Verbesserungen¶
In der Rechtschreibprüfung wurden die Korrekturvorschläge für unbekannte Wörter (Fehlercode 21) verbessert. Insgesamt steht jetzt deutlich häufiger der beste Vorschlag an erster Stelle.
Die Satzerkennung kann nun besser mit Klammereinschüben umgehen, die auf Satzzeichen enden, wie z. B. „(sic!)“. Dadurch kommt es zu weniger falschen Alarmen, den vermeintlichen Folgesatz doch bitte mit einem Großbuchstaben zu beginnen.
Verbesserte Korrektur fehlender Kommas vor und nach Einschüben und Zusätzen wie zum Beispiel in
„Wir liefern Getriebe aller Bauarten insbesondere Schaltgetriebe.“
„Die Maschine sie ist schon recht alt funktioniert immer noch tadellos.“
Verbesserte Behandlung fehlender Kommas zwischen Teilsätzen, wie zum Beispiel in:
„Das nächste Highlight war ein Trampolin das war ein Spaß.“
„Unsere Jüngste geht in die Kita die Älteste ist schon in der dritten Klasse.“
Fragesätze ohne Fragezeichen werden korrigiert:
„Darf ich dich gelegentlich um Rat bitten.“
„Und wer hat an der Uhr gedreht.“
Weitere Verbesserungen bei der Kommasetzung, z. B. für das fehlende schließende Komma nach einem Infinitivsatz oder für überflüssige Kommas vor Elementen wie „etc.“ am Ende von Aufzählungen
Verbesserte Behandlung falscher Getrenntschreibung von „daraufhin“ und „gegenüber“:
„Darauf hin lobte die befragte Schülerin die Diplomatie ihrer Klassenlehrerin gegen über ihr und der ganzen Klasse.“
Erweiterung und Aktualisierung des Lexikons und der Informationen zur Silbentrennung.
Duden Korrekturserver Version 1.8.0.372¶
Version 1.8.0 enthält in erster Linie technische Anpassungen.
Wechsel zu PHP 8.2¶
Version 1.8.0 des Duden Korrekturservers basiert nun auf PHP 8.2. Die Basis des Docker- Images ist weiterhin Debian 11. Das Application Framework wurde auf Symfony 6.2 aktualisiert.
Unstertsützung für RHEL 9¶
Version 1.8 des Duden Korrekturservers unterstützt Red Hat Enterprise Linux (RHEL) 9 bzw. Rocky Linux 9. Installationspakete und Docker Images für RHEL/Rocky 9 sind auf Anfrage verfügbar.
Lokale Testseite mit Plug-in Version 2¶
Die lokale Testseite des Duden Korrekturservers verwendet nun Version 2 der Plug-ins für TinyMCE.
Duden Korrekturserver Version 1.7.1.372¶
Wir ergänzen ab dieser Version die Versionsnummer des Duden Korrekturservers um einen nachgestellte Code (‚.372‘) für die Version der linguistischen Basiskomponenten.
Linguistische Verbesserungen¶
Verbesserte Behandlung von sehr langen Bindestrichkomposita aus unbekannten Worten.
Der neue Fehlercode 276 korrigiert die falsche Position eines Kommas in der Mitte einer Nebensatzeinleitung, wie z. B. hier in „ohne, dass“.
Der neue Fehlercode 277 korrigiert falsche Bezüge bei Relativ- pronomen, z. B. in „Der Mann, die ich getroffen habe, hat mir mit dem Koffer geholfen.“
Die Abdeckung der Fehlercodes 144 und 145 wurde weiter verbessert. Das betrifft die Verwechslung von „das“ mit „dass“ in Situationen mit und ohne Komma. So werden jetzt z. B. die folgenden Fehler erkannt:
„Wenn Sie merken, dass Sie manchen Gesprächen nicht mehr gut folgen können, oder das Ihr Fernseher deutlich lauter eingestellt werden muss als früher, dann ist es Zeit für einen Hörtest.“
„Ferner weisen wir darauf hin das der Fahrradschuppen nur für den täglichen Gebrauch gedacht ist.“
Die Korrektur überflüssiger Kommas wurde weiter verbessert. Das betrifft die Fehlercodes 160 und 161. Zum Beispiel werden jetzt die folgenden Fehler gefunden:
„Kann es für uns etwas Schöneres geben, als dabei zu sein, und das Glück dieser Leute in uns aufzunehmen?“
„Ich freue mich, mit unseren Produkten in neue Märkte vordringen zu können, und neue Impulse zur Weiterentwicklung zu bekommen.“
„Der, schon wieder zu spät gekommene Schüler hatte eine gute Erklärung.“
„Heute vor einem Jahr, haben wir uns in München dazu entschieden, eine Niederlassung unserer Firma zu gründen.“
Ebenfalls verbessert wurde die Abdeckung von Code 254, der fehlende Artikel in Nominalgruppen anstreicht. Solche Fehler werden jetzt zum Beispiel auch in Datumsangaben wie hier gefunden: „Wir treffen uns an 10. April.“
Code 44 findet nun die falsche (und recht häufige) Verwendung von „währen“ statt „während“ als Nebensatzeinleitung, wie z. B. hier: „Das Interesse der Anleger habe sich auf Titel der zweiten Reihe beschränkt, währen die großen Namen vernachlässigt blieben.“
Für viele andere Fehlercodes gab es Detailverbesserungen.
Wie immer wurde das Lexikon ausgebaut und aktualisiert.
Duden Korrekturserver Version 1.7.1¶
Version 1.7.1 enthält in erster Linie technische Verbesserungen und Korrekturen.
Maximale Eintragslänge¶
Berücksichtigung der maximalen Zeichenlänge von Wörterbucheinträgen (72) bei Import, im Frontend sowie bei API-Requests
Lokalisierungen¶
Korrekturen und Nachtrag von fehlenden Lokalisierungen
Neuen OS Basiversion für Docker-Container¶
Update auf Debian 11.6 als Basis für den Docker-Container
Duden Korrekturserver Version 1.7.0¶
Glossarwörterbücher¶
Der Duden Korrekturserver unterstützt nun Glossarwörterbücher mit ergänzenden Informationen für den Autor eines Textes, die angezeigt werden können, falls das betreffende Wort in einem Text auftritt.
Morphologische Informationen¶
Positiveinträge in Wörterbüchern können nun um zusätzliche Angaben zur Morphologie eines Wortes ergänzt werden, um automatisch alle flektieren Formen (sowie Derivationen und Komposita) eines unbekannten Wortes erkennen zu können.
Deutsches Webinterface¶
Die Sprache für das Webinterface des Duden Korrekturservers kann nun individuell für jeden Benutzer zwischen Englisch und Deutsch umgeschaltet werden. (Über Interface-Sprache, Änderungen werden mit dem nächsten Anmelden gültig)
im FeldVerbesserte Unterstützung für HA und Load Balancing¶
Die Synchronisation zwischen mehreren Instanzen des Duden Korrekturservers in einer High Availability und/oder Load Balancing Umgebung wurde verbessert und die Latenz beim Abgleich von Zusatzwörterbüchern zwischen den einzelnen Instanzen reduziert.
Linguistische Verbesserungen¶
Der Umgang mit wörtlicher Rede wurde verbessert, insbesondere bei fehlerhafter Kommasetzung (Fehlercodes 76, 81 und 275).
Die Erkennung von fremdsprachlichem Text wurde verbessert. Die Erkennung fremdsprachlicher Textpassagen wurde verbessert (Code 139) und eingebettete fremdsprachliche Zitate innerhalb von Sätzen werden erkannt (Code 138).
Kontextabhängige Schreibvarianten werden je nach gewähltem Prüfstil korrigiert (Codes 29, 31, 33, 35).
Die Korrektur fehlender Leerzeichen wurde verbessert, insbesondere zwischen abgekürzten Namensbestandteilen (Code 18) und zwischen Abkürzungen und folgenden Zahlen (Code 20).
Die Korrektur von Kommafehlern wurde verbessert, z. B. bei satzwertigen Infinitiven (Codes 157, 158) und am Ende eingeschobener Nebensätze (Code 150).
Die Prüfung falscher Kleinschreibung von substantivierten Adjektiven (Code 113) ist exakter geworden („bis ins kleinste“, „Sie wurde zwanzigste“).
Die Korrektur von Kongruenzfehlern in Nominalgruppen (Code 140) und Präpositionalgruppen (Code 149) wurde verbessert.
Die Erkennung der falschen Benutzung von „dass“ statt „das“ (Code 146) wurde weiter verbessert.
Eine Reihe von häufigen Wortverwechslungen wird nun erkannt, z. B.“Fußballstadium“ und „aufs Trapez bringen“
Duden Korrekturserver Version 1.6.1¶
Wechsel zu PHP 7.4¶
Version 1.6.1 des Duden Korrekturservers basiert nun auf PHP 7.4. Die Ubuntu-Basis des Docker- Images ist nun die Ubuntu-Server-Version 20.4 LTS.
Linguistische Verbesserungen¶
Das Wörterbuch der deutschen Rechtschreib- und Grammatikprüfung wurde ergänzt um das Vokabular der neuen, 12. Auflage von „Duden - Das Fremdwörterbuch“. Aufgenommen wurden mehrere Hundert Begriffe, darunter zum Beispiel Cross-Selling, Fan-Fiction und Phonometrie.
Die deutsche Rechtschreib- und Grammatikprüfung akzeptiert nun Schreibweisen mit Genderzeichen wie zum Beispiel „Bürger*innen“ oder „Autor:innen“, die ausdrücken sollen, dass neben dem männlichen und weiblichen Geschlecht weitere Kategorien möglich sind.
Der neue Fehlercode 262 korrigiert fehlerhafte Leerzeichen in beliebigen Bindestrichzusammensetzungen. Bisher gab es für diesen Bereich den Fehlercode 100, der Leerzeichen in lexikalisierten Bindestrichschreibungen wie „öffentlich- rechtlich“ korrigieren konnte. Mit Code 262 werden solche Fehler auch in spontanen Bildungen wie „Vier-Millionen- Euro-Spende“ oder „3:7- Niederlage“ korrigiert.
Der neue Fehlercode 156 korrigiert fehlende oder überflüssige Kommas bei Appositionen, zum Beispiel in „Die Ministerin Hanna Schmidt, stimmte dem Entwurf zu.“
Falsche Kommas vor „als“ oder „wie“ werden nun von Code 160 korrigiert, zum Beispiel in „Klarer kann man es nicht sagen, als im aktuellen Bericht.“ oder in „Besonders, wenn ein so seltener Gast, wie Peter dabei ist.“
Die Abdeckung von Code 161, der bisher falsche Kommas bei einleitenden Präpositionalphrasen korrigierte, wurde ebenfalls merklich erweitert. Er korrigiert nun auch falsche Kommas vor dem finiten Verb wie in „Die Trauben für diese Weine, stammen vorwiegend aus den Lagen unterhalb der Burg.“. Außerdem werden nun falsche Kommas vor Präpositionalgruppen korrigiert, wie in „Ich bedanke mich, für Ihre Aufmerksamkeit und freue mich, auf ein Kennenlernen.“
Fehlercode 159, der fehlendes Komma bei „das heißt“ korrigiert, arbeitet nun wesentlich zuverlässiger.
Die Fehlercodes 144 und 146, die sich mit der Korrektur von „dass“ vs. „das“ beschäftigen, beherrschen nun auch Verdreher wie „Wir hoffen, das dass klappt.“ (Code 144) und falsche Verwendung von „dass“ als Artikel wie in „Wir schätzen dass logische Denkvermögen.“ (Code 146).
Code 140 (fehlerhafte Übereinstimmung in einer Nomengruppe) wurde weiter ausgebaut. Zum Beispiel werden nun die Fehler in den+ folgenden Sätzen erkannt: „Die Gruppen nutzen den Saal und die beiden multifunktionalen Räumen denn auch liebend gern und oft.“ und „Wir haben uns darauf verständigt, anerkannten internationalen Rahmenwerke beizutreten.“
Wie immer gab es weitere Detailverbesserungen sowie Ausbau und Aktualisierung des Lexikons.
Duden Korrekturserver Version 1.6.0¶
Default-Installation als Docker-Image¶
Mit Version 1.6 des Duden Korrekturservers wird Docker als Standardplattform verwendet. Installationspakete zur direkten Installation auf vorinstallierten Linux-Systemen werden weiterhin unterstützt und können von EPC bezogen werden.
Linguistische Verbesserungen¶
Die Wörterbücher des Duden Korrekturserver sind gemäß der 28. Auflage von „Duden - Die Deutsche Rechtschreibung“ ergänzt worden.
Die Korrektur der Groß- und Kleinschreibung sowie der Getrennt- und Zusammenschreibung von „zuhause“, „zu Hause“ und „Zuhause“ wurde stark verbessert.
Vielfache Verbesserung bei der Behandlung von Kommafehlern:
Die Behandlung falscher Kommas vor Konjunktionen wurde überarbeitet und hat nun eine deutlich verbesserte Abdeckung.
Bei der Korrektur optionaler Kommas bei Infinitivkonstruktionen mit „zu“ wird nun in fast allen Fällen auch ein Korrekturvorschlag generiert.
Erkennung eines fehlendes Kommas vor den Konjunktionen „aber“ und „denn“, zum Beispiel in „Um die Ecke ist ein kleines aber feines Restaurant.“
Korrektur von fehlendem Komma nach Anreden wie zum Beispiel in „Peter das Essen ist fertig.“
Korrektur der falschen Getrenntschreibung der Konjunktionen „seitdem“, „indem“, „nachdem“, wie zum Beispiel in „Ich nehme die Natur anders wahr, seit dem ich jogge.“
Die Erkennung der falschen Verwendung von „dass“ statt „das“ wurde überarbeitet und erkennt nun merklich mehr Fehler bei gleichzeitig geringerer Wahrscheinlichkeit für Fehlalarme.
Duden Korrekturserver Version 1.5.1¶
Zusätzliche Sprachen mit Hunspell¶
Für Sprachen, die nicht direkt vom Duden Korrekturserver unterstützt werden, kann der Duden Korrekturserver auf installierte Hunspell- bzw. Hyphen-Pakete zurückgreifen, um auch für sonst unbekannte Sprachen eine einzelwortbasierte Rechtschreibprüfung und Silbentrennung anzubieten.
Hierzu müssen die jeweiligen Hunspell- und Hyphen-Pakete des verwendeten Betriebssystems sowie die sprachspezifischen Wörterbücher installiert werden. Am Beispiel für Portugiesisch auf Ubuntu 18.04:
sudo apt install hunspell
sudo apt install libhyphen0
sudo apt install hunspell-pt-pt
sudo apt install hyphen-pt-pt
Danach kann im API des Duden Korrekturservers die Sprache mit „pt_PT“ übergeben werden.
Beispiel für einen Request:
{
"text-language": "pt_PT",
"property-sets": [
"base"
],
"hyphenation": true,
"spellchecking-level": 2,
"correction-proposals": true,
"single-word-mode": false,
"message-language": "de_DE",
"message-level": 1,
"text": "Nao falo portugues."
}
Und der dazugehörige Response des Servers:
{
"check-positions": [
{
"offset": 0,
"length": 3,
"errorcode": 21,
"type": "orth",
"proposals": [
"Ao",
"Mao",
"Tao",
"Yao",
"Não",
"Ano",
"Na",
"No",
"Nano",
"Nato",
"Naco",
"Nado",
"Nabo",
"Nas",
"Nau"
]
},
{
"offset": 9,
"length": 9,
"errorcode": 21,
"type": "orth",
"proposals": [
"português",
"portuguesa"
]
}
],
"sentence-boundaries": [],
"messages": {
"21": "Dieses Wort korrigieren?"
},
"hyphenation-positions": [
{
"offset": 5,
"quality": 1
},
{
"offset": 11,
"quality": 1
},
{
"offset": 13,
"quality": 1
}
]
}
Die verfügbaren Sprachen sowie die Qualität und Umfang der Prüfung und Silbentrennung werden von der installierten Hunspell- und Hyphen-Version bestimmt, an die diese Aufgaben delegiert werden.
Beschleunigte Authentisierung bei HTTP Basic Auth¶
Um die „HTTP Basic Auth“-Authentisierung zu beschleunigen, wurde das Verschlüsselungsverfahren für in der Datenbank gespeicherte Passwörter geändert.
Bei der Neuinstallation wird das Standardpasswort für den Benutzer duden bereits mit dem neuen Algorithmus verschlüsselt.
Beim Upgrade einer bestehenden Installation bleiben die bisherigen Passwörter erhalten und müssen vom Anwender oder Administrator neu vergeben werden, um vom beschleunigten Algorithmus zu profitieren.
Duden Korrekturserver Version 1.5.0¶
Neu: Support von PHP 7.2 auf Ubuntu 18.04, Ubuntu 16.04 und CentOS 7. Die Unterstützung für PHP 5.6 wird bis Version 1.6 des Duden Korrekturservers beibehalten. Nicht mehr unterstützt wird Ubuntu 14.04, für das auch keine Sicherheitsupdates mehr verfügbar sind.
Neu: Linguistic Engine Version 3.4.3. Verbesserte Korrektur folgender Phänomene:
Fehlende Kongruenz in der Nominalgruppe, insbesondere im Bereich der Adjektivflexion, z. B. „in dessen erstaunten Gesicht“
Ungültige Dopplungen von Satzendezeichen, wie z. B. in „Das ist sicher falsch.!“
Fehlendes Komma vor Datumsangaben, z. B. „Am Montag den 12. Oktober ist Abgabe.“
Fehlendes, von Duden empfohlenes Komma nach einer Datumsangabe im Dativ, z. B. „Unser nächstes Treffen ist am Freitag, dem 15. Mai in der Mehrzweckhalle.“
Erkennung falscher Groß- und Kleinschreibung von Zahlwörtern.
Prüfstilabhängige Großschreibung der Pronomen „wenig“, „viel - (meist…)“, „ein“ und „ander“.
Prüfstilabhängige Kleinschreibung von „im mindesten/Mindesten“.
Korrektur von Adjektiven im Superlativ, die bereits in ihrer Grundform einen höchsten oder geringsten Grad ausdrücken, zur Grundform zurück.
Falsch mit Komma abgetrennte Adverbiale am Satzanfang, z. B. „Generell, halte ich das für eine gute Idee.“
Die Zuverlässigkeit der Füllwortanalyse in Nebensätzen wurde verbessert.
Erweiterung und Aktualisierung des Lexikons.
Sicherheitsbezogene Änderungen
Der Zugriff auf das API kann mit Benutzernamen und Passwort geschützt werden. Dazu können Benutzer mit der Rolle „Api“ angelegt werden.
Verbesserungen am User Interface:
Verbesserung der Darstellung und der Handhabung von Suchergebnissen in Zusatzwörterbüchern.
Der Download-Link für das TinyMCE Plug-in ist nun extern und zeigt auf https://services.epc.de/dks/tinymce-plugin/tinymce-plugin.zip, wo er auf die jeweils aktuelle Version des Plug-ins geroutet wird.