Informationen zu Tobias_Wagner - DATEV-Community

Tobias_Wagner · ‎24.07.2023

Ganz so einschränkend würde ich es nicht sehen - es kommt eben darauf an, was man unter "Textverständnis" versteht... Moderne LLMs - und wir sind da mit ChatGPT noch lange nicht am Ende der Fahnenstange, wenn man sich z.B. Claude 2 mal anschaut - können Texte zusammenfassen, interpretieren, Argumente extrahieren und widerlegen, kritisieren oder kreativ ergänzen. Sicherlich, das menschliche Gehirn können künstliche Neuronen auch langfristig nicht ersetzen, aber insbesondere im kreativen Bereich sind die LLMs ein echter Meilenstein, der über das bloße Erfassen und Neuverpacken von Informationen weit hinausgeht. Was die Anfälligkeit für clever geschriebene Prompts angeht: Hier liegt gleichzeitig aber auch die Chance, der man sich bewusst sein muss, wenn man heute mit diesen Modellen experimentiert. Durch Prompt Engineering lässt sich die Qualität der erhaltenen Antworten um ein Vielfaches verbessern, das "Phantasieren" der KI vermeiden, die Tonalität der Antworten auf den gewünschten Zweck anpassen, die Datengrundlage für die Antwort konkretisieren... Klar ist auch, dass wir gerade in der Juristerei nicht vorsichtig genug sein können, wenn es um den Einsatz solcher Modelle geht. Das ändert aber nichts daran, dass wir alle uns in Zukunft damit beschäftigen werden müssen - kritisch, aber mit der Bereitschaft, sich auch mal darauf einzulassen!

Tobias_Wagner · ‎24.07.2023

Liebe Kolleg:innen, als einer der Betreuer des angesprochenen Projektes (insbesondere aus fachlich/anwaltlicher Sicht) kann ich vielleicht noch ein paar weitere Informationen liefern, um die Erwartungen ein wenig zu dämpfen, ohne die studentische Leistung zu schmälern! Grundlage des Projektes war die Aufgabe, aus bestehenden, historischen Daten eine Prognose für die Zukunft treffen zu können, also eben nicht auf Grundlage laufender Verfahren, sondern allein anhand von Referenzurteilen. Hierzu wurde eine Machine Learning-Pipeline mit historischen Urteilen gefüttert. Die Studenten der Uni Köln haben sich dann mit zwei ganz unterschiedlichen Problemstellungen beschäftigt: 1. Kann eine KI auf Grundlage eines in natürlicher Sprache eingekippten Sachverhaltes entsprechende Referenzurteile finden, die inhaltlich hinreichend genau übereinstimmen, um von ähnlichen Sachverhalten zu sprechen? 2. Kann eine KI auf Grundlage eines Referenzurteils zweifelsfrei erkennen, ob das Verfahren positiv oder negativ oder nur teilweise positiv ausgegangen ist. Beide Aufgabenstellungen wurden recht gut absolviert - insbesondere, da die Studenten weder über einen technischen, noch einen juristischen Hintergrund verfügen, waren die Ergebnisse bemerkenswert. Natürlich handelt es sich aber bei dem Projekt um ein solches unter "Laborbedingungen", und eben kein fertiges "Erfolgsvorhersagetool", welches so schon uneingeschränkt am Markt eingesetzt werden könnte. Die Studierenden haben aber bewiesen, dass man mit modernen Algorithmen entsprechende Probleme lösen kann - der Rest sind Daten und Rechenpower. Hinzu kommt, dass die Studierenden hier einen eher traditionellen Ansatz gewählt haben. Würde man beispielsweise ein Large Language Model verwenden, um beide Problemstellungen (unabhängig voneinander) zu bewältigen, dann würde man sicherlich noch wasserdichtere Ergebnisse erhalten - denn diese Modelle verstehen auch den Inhalt eines Textes, und sind daher wesentlich weniger anfällig für anders gewählte Formulierungen oder kryptische Aussagen "zwischen den Zeilen". Zuammenfassend: -Was kann der Prototyp (mit entsprechender Datengrundlage): Vergleichbare Urteile auf Grundlage eines Sachverhaltes finden und ausgeben, beispielsweise als ersten Ansatzpunkt einer anwaltlichen Recherche nach Referenzurteilen. Zudem kann der Prototyp erkennen, wie viele historische und vergleichbare Urteile zu wieviel Prozent in welcher Weise entschieden wurden. -Was kann der Prototyp nicht: In laufenden Verfahren auf Grundlage von Beweismitteln und Parteivortrag erkennen, wie das Verfahren wohl ausgehen wird - sofern nicht Informationen enthalten sind, die sich so auch in historischen Referenzurteilen finden lassen. Entscheidend wie bei allen entsprechenden KI-Anwendungen ist immer die Datengrundlage - ergeben sich Rechtsprechungsänderungen und werden diese auch in die Datengrundlage eingepflegt, kann auch die KI damit umgehen. Das Problem sehe ich aber eher an anderer Stelle: solange die Justiz nur spärlich, und dann häufig auch nur divergierende Urteile veröffentlicht, ist es sehr schwierig, eine klare, "einheitliche" Rechtsprechungspraxis aufzuzeigen. Das wird erst möglich, wenn auch die "üblichen" Entscheidungen Bestandteil der Datengrundlage werden. Ich finde es spannend, dass hier zu diesem Thema so angeregt diskutiert wird - zeigt mir, dass wir mit unserem für die Studenten formulierten Use Case vielleicht tatsächlich einen Nerv getroffen haben. Vielen Dank dafür. Beste kollegiale Grüße!

Beiträge und Ideen von Tobias_Wagner

Datev und KI

Datev und KI

Datev und KI

Datev und KI

Datev und KI

Datev und KI

Datev und KI

Auszeichnungen