Liebe Kolleg:innen, als einer der Betreuer des angesprochenen Projektes (insbesondere aus fachlich/anwaltlicher Sicht) kann ich vielleicht noch ein paar weitere Informationen liefern, um die Erwartungen ein wenig zu dämpfen, ohne die studentische Leistung zu schmälern! Grundlage des Projektes war die Aufgabe, aus bestehenden, historischen Daten eine Prognose für die Zukunft treffen zu können, also eben nicht auf Grundlage laufender Verfahren, sondern allein anhand von Referenzurteilen. Hierzu wurde eine Machine Learning-Pipeline mit historischen Urteilen gefüttert. Die Studenten der Uni Köln haben sich dann mit zwei ganz unterschiedlichen Problemstellungen beschäftigt: 1. Kann eine KI auf Grundlage eines in natürlicher Sprache eingekippten Sachverhaltes entsprechende Referenzurteile finden, die inhaltlich hinreichend genau übereinstimmen, um von ähnlichen Sachverhalten zu sprechen? 2. Kann eine KI auf Grundlage eines Referenzurteils zweifelsfrei erkennen, ob das Verfahren positiv oder negativ oder nur teilweise positiv ausgegangen ist. Beide Aufgabenstellungen wurden recht gut absolviert - insbesondere, da die Studenten weder über einen technischen, noch einen juristischen Hintergrund verfügen, waren die Ergebnisse bemerkenswert. Natürlich handelt es sich aber bei dem Projekt um ein solches unter "Laborbedingungen", und eben kein fertiges "Erfolgsvorhersagetool", welches so schon uneingeschränkt am Markt eingesetzt werden könnte. Die Studierenden haben aber bewiesen, dass man mit modernen Algorithmen entsprechende Probleme lösen kann - der Rest sind Daten und Rechenpower. Hinzu kommt, dass die Studierenden hier einen eher traditionellen Ansatz gewählt haben. Würde man beispielsweise ein Large Language Model verwenden, um beide Problemstellungen (unabhängig voneinander) zu bewältigen, dann würde man sicherlich noch wasserdichtere Ergebnisse erhalten - denn diese Modelle verstehen auch den Inhalt eines Textes, und sind daher wesentlich weniger anfällig für anders gewählte Formulierungen oder kryptische Aussagen "zwischen den Zeilen". Zuammenfassend: -Was kann der Prototyp (mit entsprechender Datengrundlage): Vergleichbare Urteile auf Grundlage eines Sachverhaltes finden und ausgeben, beispielsweise als ersten Ansatzpunkt einer anwaltlichen Recherche nach Referenzurteilen. Zudem kann der Prototyp erkennen, wie viele historische und vergleichbare Urteile zu wieviel Prozent in welcher Weise entschieden wurden. -Was kann der Prototyp nicht: In laufenden Verfahren auf Grundlage von Beweismitteln und Parteivortrag erkennen, wie das Verfahren wohl ausgehen wird - sofern nicht Informationen enthalten sind, die sich so auch in historischen Referenzurteilen finden lassen. Entscheidend wie bei allen entsprechenden KI-Anwendungen ist immer die Datengrundlage - ergeben sich Rechtsprechungsänderungen und werden diese auch in die Datengrundlage eingepflegt, kann auch die KI damit umgehen. Das Problem sehe ich aber eher an anderer Stelle: solange die Justiz nur spärlich, und dann häufig auch nur divergierende Urteile veröffentlicht, ist es sehr schwierig, eine klare, "einheitliche" Rechtsprechungspraxis aufzuzeigen. Das wird erst möglich, wenn auch die "üblichen" Entscheidungen Bestandteil der Datengrundlage werden. Ich finde es spannend, dass hier zu diesem Thema so angeregt diskutiert wird - zeigt mir, dass wir mit unserem für die Studenten formulierten Use Case vielleicht tatsächlich einen Nerv getroffen haben. Vielen Dank dafür. Beste kollegiale Grüße!
... Mehr anzeigen