Leichte Sprache-Classifier

Dieses Repository enthält eine Implementierung eines Algorithmus zur Klassifizierung von Texten in Leichte Sprache und reguläre Sprache. Der Algorithmus verwendet deterministische Heuristiken, um Texte basierend auf verschiedenen linguistischen Merkmalen zu bewerten.

Merkmale des Algorithmus

Betrachtet werden:

Satzlänge
Wortlänge
Verwendung von Fremdwörtern
Anzahl der Silben

Funktionsweise

Der Algorithmus gibt jedem Text eine Punktzahl, die seine Übereinstimmung mit den Kriterien für Leichte Sprache widerspiegelt. Niedrigere Punktzahlen deuten auf eine schlechtere Übereinstimmung hin.

Die Punktzahlen sind lediglich ein Hinweis auf die Textqualität und garantieren nicht, dass Prüfer:innen für Leichte Sprache diese in der Realität verstehen werden.

Nutzung

Einen Datensatz klassifizieren:

python3 ./src/rate_dataset.py username/hf-repo [--instruct]

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
src		src
.env.example		.env.example
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Leichte Sprache-Classifier

Merkmale des Algorithmus

Funktionsweise

Nutzung

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

Leichte Sprache-Classifier

Merkmale des Algorithmus

Funktionsweise

Nutzung

About

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages