Legal Data Processing Toolbox
Στο πλαίσιο του έργου +ΝΟΜΟΣ, παρέχουμε ανοιχτή πρόσβαση στον κώδικα (toolboxes) και στα επισημειωμένα σύνολα δεδομένων (datasets) που αναπτύχθηκαν. Στόχος μας είναι η ενίσχυση της έρευνας στη Νομική Πληροφορική.
Data Processing Toolboxes
Classification
Εργαλεία προετοιμασίας δεδομένων και παραγωγής Enriched Labels για νομικές έννοιες μέσω LLMs.
GitHub SourceNER Toolbox
Διαδραστικό πλαίσιο (HITL) σε Streamlit για ημιαυτόματη επισημείωση Ονοματικών Οντοτήτων.
GitHub SourceEUR-Lex Toolkit
Μηχανισμός μαζικής ανάκτησης και καθαρισμού Ευρωπαϊκών νομικών κειμένων και συνόψεων.
GitHub SourceReference Texts
Αυτόματη ανάκτηση και εκκαθάριση πρωτογενών κειμένων εθνικής νομοθεσίας (ET.gr).
GitHub SourceOpen Legal Datasets
NER GLN v2
Βελτιωμένο σύνολο δεδομένων για Αναγνώριση Ονοματικών Οντοτήτων στην Ελληνική νομοθεσία.
🤗 Hugging FaceHellasVOC EURLEX
Σύνολο δεδομένων για ταξινόμηση Ευρωπαϊκών κειμένων βάσει του ελληνικού λεξιλογίου HellasVoc.
🤗 Hugging FaceHellasVOC GLC
Ελληνικό νομικό corpus (GLC) επισημειωμένο με τις ιεραρχικές κατηγορίες του HellasVoc.
🤗 Hugging FaceGreek Legal Ref
Τυποποιημένο σώμα κειμένων (Reference Texts) εθνικής νομοθεσίας για εργασίες NLP.
🤗 Hugging FaceEUR-Lex Sum
Σώμα κειμένων Ευρωπαϊκής νομοθεσίας (πλήρη κείμενα και συνόψεις) στην ελληνική γλώσσα.
🤗 Hugging FaceHellasVoc MEU
Πολυγλωσσικό νομικό dataset (MEU) προσαρμοσμένο στην ταξινομία HellasVoc.
🤗 Hugging Face