Συζήτηση
Γεια χαρά, Επισκέπτης
Όνομα χρήστη: Κωδικός: Να με θυμάσαι

ΘΕΜΑ: Tokenization in Python

Tokenization in Python 14 Χρόνια 5 Μήνες πριν #630

  • nick_the_greek
  • Το Άβαταρ του/της nick_the_greek
  • Αποσυνδεμένος
  • p_____
  • Δημοσιεύσεις: 1
Πώς σε ένα κείμενο .txt ή οποιοδήποτε άλλο, μπορώ να κάνω tokenization?
Χρησιμοποιώ split αλλά δέχεται μόνο 1 delimiter. Σκέφτηκα να το κάνω επαναληπτικά με νέο delimiter κάθε φορά αλλά φοβάμαι ότι τα πολλά file I/O θα προσθέσουν σημαντική καθυστέρηση. Επομένως μήπως ξέρει κανείς πώς θα ξεπεράσω αυτό το πρόβλημα? Ίσως μια regular expression? εκτός βέβαια κι αν υπάρχει κάποιος έτοιμος tokenizer.
Ευχαριστώ....!!!!
Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.

Απ:Tokenization in Python 14 Χρόνια 5 Μήνες πριν #631

  • myle
  • Το Άβαταρ του/της myle
  • Αποσυνδεμένος
  • Admin
  • Δημοσιεύσεις: 467
  • Ληφθείσες Ευχαριστίες 15
Δες στις λύσεις της 1ης άσκησης, την ενότητα 3.3 στα στατιστικά εγγράφου.
Αν δεν σε καλύπτει, πες για περισσότερη ανάλυση.
Επίσης, φθάνει μια φορά να γραμμή από τον δίσκο. Στην συνέχεια κάνεις την επεξεργασία χωρίς να χρειαστεί να την ξαναδιαβάσεις και τότε προχωράς στην επόμενη.

Υπάρχει και το shlex ως εναλλακτική.
«Αν υποθέσουμε ότι αυτό είναι δυνατό, (να μεταδώσουμε τη σοφία παντού) τότε ειλικρινά ο τρόπος ζωής των θεών θα περάσει στους ανθρώπους. Τα πάντα θα είναι γεμάτα...
Τελευταία διόρθωση: 14 Χρόνια 5 Μήνες πριν από myle.
Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.
Συντονιστές: pmav99
Χρόνος δημιουργίας σελίδας: 0.261 δευτερόλεπτα

Μοιράσου το!

Powered by CoalaWeb

Λίστα Ταχυδρομείου