Skip to content

Natural Language Model

Sotiris Papadiamantis edited this page Aug 22, 2019 · 2 revisions

Natural Language Model

As part of GSOC-2019, we have also trained a natural language model to generate legislative text in Greek. We used TPU acceleration offered by Google Colab to train a deep LSTM network that uses word embeddings as inputs, following an approach by the TensorFlow Hub Authors . The model therefore, is made up of an input layer of embeddings created using the codifier corpus. We then stacked 3 LSTM layers on top and a Dense layer with softmax activation. After initially training a character level model we decided to follow a word level approach. We also tried to add attention layers in-between LSTM layers but with little success. The final version of the model totals 877 Mb and can be found alongside relevant dictionaries in the models directory.

For example using the seed text 'Οι όροι που πρέπει να τηρούνται προκειμένου να χορηγηθεί η άδεια, είναι οι ακόλουθοι:' our model produced texts such as:

στον ΟΑΕΕ δεν επιτρέπεται να ή καμία άλλη υπόθεση που υπάγονται στην κάλυψη των καθηκόντων του Άρθρο 32 Το ένα μέρος αντικλήτων άλλο και ασκούνται  εκ τόπου έκδοσης της αίτησης κατά τον οποίο υποβάλλεται έλεγχο  βάσει του πρωτοκόλλου των προγραμμάτων  που αναφέρονται στον ηλεκτρονικό τίτλο  Περαιτέρω ζώνη που έχει ασκηθεί έδρα της γενικού ή μικτής περιόδου και καθορίζεται στην Οδηγία νομοθεσία ή από το Υπουργείο Υγείας και Κοινωνικής Αλληλεγγύης  καθώς και οι προθεσμίες που εμπλέκονται στις υποχρεώσεις των μερών και μετατροπής  καθώς και για όσο χρόνο   Τελωνείο 8  Στο αρμόδιο μέλος εφαρμογής κατασκευής σε σχέση με τα κριτήρια διορισμού Άρθρο 4 Με προεδρικό διάταγμα  που εκδίδεται μετά από εισήγηση του Διοικούσας εδαφίου της παραγράφου 12 του άρθρου 73 του ν δ  1508 Α΄ 141 7  προστίθενται 6 και την παράγραφο 4 και 9 του άρθρου 101 του ν Κάμπο  όπως αντικαταστάθηκε με το ως άρθρο 6α Α΄ 34 σχετικά με το Κεφάλαιο του διαγωνισμού ή άλλες υπηρεσίες των ετήσιων βεβαίωσης ψήφου από την εθνική Δημοκρατία και αρχαιότητα  έχουν τις ακόλουθες αρμοδιότητες  α  και στη συνταξιοδότηση των εταιρειών και της ζωικής ανάπτυξης όπως κυρώθηκε με το άρθρο 13  του ν  3149/2003 Α΄ νέα του ν  4093/2012 προστίθεται εδάφιο ως εξής  1  Με πράξη του Δικαστηρίου  όπως Αγ ασφαλειών  κατά την διάρκεια της θητείας τους Άρθρο 2 Οι κατά νόμο εταιρείες που προκύπτουν από τη σύμβαση του 73/1995

We are aiming to ameliorate the model's performance using a Greek spellchecker after generating the text.