RESOURCES
Εργαλειοθήκη ανοιχτού κώδικα που αναπτύχθηκε στα πλαίσια του +ΝΟΜΟΣ

Legal Data Processing Toolbox

Στο πλαίσιο του έργου +ΝΟΜΟΣ, παρέχουμε ανοιχτή πρόσβαση στον κώδικα (toolboxes) και στα επισημειωμένα σύνολα δεδομένων (datasets) που αναπτύχθηκαν. Στόχος μας είναι η ενίσχυση της έρευνας στη Νομική Πληροφορική.

Data Processing Toolboxes

Classification

Εργαλεία προετοιμασίας δεδομένων και παραγωγής Enriched Labels για νομικές έννοιες μέσω LLMs.

GitHub Source

NER Toolbox

Διαδραστικό πλαίσιο (HITL) σε Streamlit για ημιαυτόματη επισημείωση Ονοματικών Οντοτήτων.

GitHub Source

EUR-Lex Toolkit

Μηχανισμός μαζικής ανάκτησης και καθαρισμού Ευρωπαϊκών νομικών κειμένων και συνόψεων.

GitHub Source

Reference Texts

Αυτόματη ανάκτηση και εκκαθάριση πρωτογενών κειμένων εθνικής νομοθεσίας (ET.gr).

GitHub Source

Open Legal Datasets

NER GLN v2

Βελτιωμένο σύνολο δεδομένων για Αναγνώριση Ονοματικών Οντοτήτων στην Ελληνική νομοθεσία.

🤗 Hugging Face

HellasVOC EURLEX

Σύνολο δεδομένων για ταξινόμηση Ευρωπαϊκών κειμένων βάσει του ελληνικού λεξιλογίου HellasVoc.

🤗 Hugging Face

HellasVOC GLC

Ελληνικό νομικό corpus (GLC) επισημειωμένο με τις ιεραρχικές κατηγορίες του HellasVoc.

🤗 Hugging Face

Greek Legal Ref

Τυποποιημένο σώμα κειμένων (Reference Texts) εθνικής νομοθεσίας για εργασίες NLP.

🤗 Hugging Face

EUR-Lex Sum

Σώμα κειμένων Ευρωπαϊκής νομοθεσίας (πλήρη κείμενα και συνόψεις) στην ελληνική γλώσσα.

🤗 Hugging Face

HellasVoc MEU

Πολυγλωσσικό νομικό dataset (MEU) προσαρμοσμένο στην ταξινομία HellasVoc.

🤗 Hugging Face