Αυτόματη Περίληψη Νομοθετημάτων
Η Υπηρεσία Αυτόματης Περίληψης Νομικών Κειμένων του έργου +ΝΟΜΟΣ αναπτύχθηκε με σκοπό τη συνοπτική, συνεκτική και αξιόπιστη απόδοση εκτενών νομικών εγγράφων. Διευκολύνει την κατανόηση, την αναζήτηση και την αξιοποίηση της νομικής πληροφορίας, υποστηρίζοντας τόσο εξαγωγική (extractive) όσο και αφαιρετική (abstractive) περίληψη.
Στόχοι Υπηρεσίας
- ✔
Υποστήριξη της ταχείας κατανόησης εκτενών νομικών εγγράφων. - ✔
Παραγωγή σύντομων, συνεκτικών και αξιοποιήσιμων περιλήψεων. - ✔
Διατήρηση της βασικής νομικής πληροφορίας και της ειδικής ορολογίας. - ✔
Υποστήριξη διαφορετικών στρατηγικών περίληψης ανάλογα με τις απαιτήσεις του χρήστη. - ✔
Διάθεση μέσω REST API για ερευνητική και εφαρμοσμένη αξιοποίηση.
Τεχνολογική Υλοποίηση
Η ανάπτυξη βασίστηκε σε διεθνή και ελληνικά σύνολα δεδομένων όπως το EUR-Lex και το GreekLegalSum.
- Εξαγωγική προσέγγιση: Αλγόριθμος LexRank.
- Αφαιρετική προσέγγιση: Μοντέλο Llama-Krikri-8B-Base.
Αρχιτεκτονική: prompt-guided generation, chunking, ιεραρχική σύνοψη και faithfulness filtering.
Αποτελέσματα Αξιολόγησης
Η αξιολόγηση ανέδειξε τον συμπληρωματικό χαρακτήρα των μεθόδων: η εξαγωγική μέθοδος προσφέρει αυξημένη πιστότητα, ενώ η αφαιρετική εξασφαλίζει φυσικότητα και συνοχή. Συνολικά, επιτυγχάνεται βέλτιστη ισορροπία μεταξύ αναγνωσιμότητας και λειτουργικής αξιοποίησης.
Εύρεση Συναφών Εγγράφων και Οπτικοποίηση Νομοθεσίας
Η υπηρεσία Εύρεσης Συναφών Εγγράφων και Οπτικοποίησης Νομοθεσίας του έργου +ΝΟΜΟΣ ενισχύει τη νομική έρευνα μέσω του ταχύτερου εντοπισμού εγγράφων με θεματική και εννοιολογική συνάφεια. Ξεπερνά τους περιορισμούς της απλής αναζήτησης λέξεων, αναγνωρίζοντας σχέσεις συνάφειας ακόμη και με διαφορετική ορολογία ή διατύπωση.
Στόχοι & Λειτουργία
- ● Εντοπισμός συναφών νομοθετικών και νομικών εγγράφων.
- ● Αντιμετώπιση ορολογικής ασυνέπειας μεταξύ διαφορετικών κειμένων.
- ● Αναγνώριση θεματικής και λειτουργικής συνάφειας.
- ● Δημιουργία εργαλείων οπτικοποίησης για την εποπτεία του νομοθετικού χάρτη.
Υβριδικό Μοντέλο Ανάκτησης
Συνδυασμός λεξικών, θεματικών και contextual τεχνικών για μέγιστη ακρίβεια.
Λεξική ομοιότητα
Θεματικά μοτίβα
Σημασιολογία
Τελική σύνθεση μέσω τεχνικών Reciprocal Rank Fusion και Borda Count.
Αποτελέσματα & Οπτικοποίηση
Η υβριδική προσέγγιση προσφέρει υψηλότερη σταθερότητα και καλύτερη κατάταξη αποτελεσμάτων. Παράλληλα, η δυνατότητα οπτικοποίησης προσφέρει στον χρήστη μια καθαρή εικόνα του νομοθετικού περιβάλλοντος μέσα στο οποίο εντάσσεται κάθε έγγραφο.
Αυτόματη Κατηγοριοποίηση Κειμένου (Θεματοποίηση)
Η υπηρεσία Αυτόματης Κατηγοριοποίησης του έργου +ΝΟΜΟΣ διαχειρίζεται την πολυ-θεματική φύση των νομικών εγγράφων, αποδίδοντας αυτόματα τις κατάλληλες κατηγορίες βάσει ιεραρχικών ταξινομιών.
Τεχνολογική Καινοτομία
Η υπηρεσία βασίζεται στη μέθοδο zero-shot multi-label text classification, επιτρέποντας την αναγνώριση κατηγοριών ακόμη και χωρίς προηγούμενα παραδείγματα εκπαίδευσης.
Αρχιτεκτονική Encoder-Decoder
Χρήση διττού κωδικοποιητή για την αναπαράσταση εγγράφων και ετικετών, και ενός αποκωδικοποιητή που παράγει τη λίστα κατηγοριών με βάση ενισχυμένες περιγραφές (enriched label descriptions).
Αποτελέσματα
Η μέθοδος υπερτερεί έναντι εναλλακτικών λύσεων (state-of-the-art), επιδεικνύοντας ιδιαίτερη ικανότητα στον χειρισμό κατηγοριών με περιορισμένα ή μηδενικά δεδομένα εκπαίδευσης.
Αναγνώριση Ονοματικών Οντοτήτων
Η υπηρεσία Αναγνώρισης Ονοματικών Οντοτήτων (NER) του έργου +ΝΟΜΟΣ αυτοματοποιεί την εξαγωγή δομημένης πληροφορίας από αδόμητα νομικά κείμενα, μετατρέποντάς τα σε αξιοποιήσιμα δεδομένα.
Τεχνολογική Υπεροχή: Σύνθεση Embeddings
Η υπηρεσία βασίζεται στη σύνθεση πολλαπλών διανυσματικών αναπαραστάσεων (embeddings), συνδυάζοντας διαφορετικές “όψεις” του κειμένου για μέγιστη απόδοση.
- Υποδομή: DeBERTa, GreekLegalRoBERTa και FastText.
- Grouped-ACE (G-ACE): Τεμαχισμός και επιλογή του βέλτιστου συνδυασμού ετερογενών embeddings.
- Hierarchical-ACE (H-ACE): Δημιουργία συμπαγών συνόλων αναπαραστάσεων με ανταγωνιστική απόδοση.
Ροή Συστήματος
Τεμαχισμός εγγράφου σε προτάσεις και εντοπισμός οντοτήτων μαζί με τις ακριβείς θέσεις εμφάνισής τους στο κείμενο.
Αποτελέσματα
Ανάπτυξη βελτιωμένου συνόλου δεδομένων Greek Legal NER και επιτυχημένη αξιολόγηση σε Ελληνικά, Αγγλικά και Ρουμάνικα.