Γεια χαρά κ χρόνια πολλά σε όλους.
Context-Free Grammar για ελληνικά.
Ακολουθεί η δημιουργία απλής γραμματικής για πρόταση που αποτελείται από ερωτηματική αντωνυμία και ρήμα, χρησιμοποιώντας nltk
# -*- coding: utf-8 -*-
import nltk
grammar = nltk.CFG.fromstring("""
S -> ErotimatikiAntonimia Rima
ErotimatikiAntonimia -> a
V -> b
""")
a="τί"
b="κάνεις"
user_input = "τί κάνεις"
Δεν γνωρίζω με ποιόν τρόπο μου ελέγχει αν η πρόταση user_input είναι συντακτικά σωστή σύμφωνα με την γραμματική grammar που συντάχθηκε παραπάνω.
Βρήκα αυτό:
sent = user_input.split()
parser = nltk.ChartParser(grammar)
for tree in parser.parse(sent):
print tree
Αλλά εμφανίζει λάθος μήνυμα (ValueError: Grammar does not cover some of the input words: u"'\\xcf\\x84\\xce\\xaf', '\\xce\\xba\\xce\\xac\\xce\\xbd\\xce\\xb5\\xce\\xb9\\xcf\\x82'".
)
Ευχαριστώ εκ των προτέρων.