Συζήτηση
Γεια χαρά, Επισκέπτης
Όνομα χρήστη: Κωδικός: Να με θυμάσαι

ΘΕΜΑ: Κωδικοποίηση ... ANSI ... UTF-8 ... UTF-8 χωρίς BOM ?

Κωδικοποίηση ... ANSI ... UTF-8 ... UTF-8 χωρίς BOM ? 11 Χρόνια 5 Μήνες πριν #1996

  • seeder
  • Το Άβαταρ του/της seeder
  • Αποσυνδεμένος
  • pyt___
  • Δημοσιεύσεις: 34
  • Ληφθείσες Ευχαριστίες 3
Καλησπέρα λίγο τα φώτα σας γιατί έχω μπερδευτεί.

Οταν δουλεύω κάποια έτοιμα scripts συνήθως είναι σε ΑΝSI και είναι λογικό διότι είναι γραμμένα από αυτούς που έχουν στην Αγγλική ως μητρική γλώσσα και δεν έχουν προβλήματα με περίεργους χαρακτήρες.

Εμείς ως Ελληνες από την άλλη μεριά από ότι έχω καταλάβει συνηθήζεται περισσότερο να χρησιμοποιούμε το UTF-8 .

Τώρα ποια είναι η απορία μου;

α) μπορούμε σε ένα project να έχουμε κάποια αρχεια ansi και κάποια utf-8 ; (φαντάζομαι πως ναι)

β) όταν τροποποιούμε ένα κείμενο πχ. html που είναι σε ansi και το αλλάζουμε σε utf-8 διαλέγουμε με BOM ή χωρίς ;

Αν μπορεί κάποιος να μου εξηγήσει κάποια πράματα σχετικά με το "τι παίζει" γενικά.
Ευχαριστώ!
Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.

Κωδικοποίηση ... ANSI ... UTF-8 ... UTF-8 χωρίς BOM ? 11 Χρόνια 5 Μήνες πριν #1998

  • kamar
  • Το Άβαταρ του/της kamar
  • Αποσυνδεμένος
  • python
  • Δημοσιεύσεις: 409
  • Ληφθείσες Ευχαριστίες 88
Αν έχεις ANSI και UTF-8 αρχεία δεν υπάρχει λόγος ανησυχίας με την προϋπόθεση ότι δεν θα γράψεις ελληνικά στα πρώτα. Μια λογική πρόταση είναι να τα σώσεις σε utf-8 και να ξεμπλέκεις από μελλοντικά προβλήματα.

Σίγουρα χωρίς BOM. Στα windows δεν θα έχεις πρόβλημα. Σε linux, Unix και ίσως σε Mac θα πρέπει να αφαιρέσεις τους πρώτους χαρακτήρες '\ufeffC:\\Users\\χχχχχχχ\20130329_130450.zip', που γράφονται απ' το BOM, δηλαδή \ufeff.

Προσωπικά όταν γράφω αρχεία δηλώνω ρητά encoding='utf-8', για να μην υπάρχουν επιπλοκές σε διάφορες πλατφόρμες.

Γενικά το θέμα θέλει πολλή συζήτηση.
Γράφω σε Python 3
Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.
Οι ακόλουθοι χρήστες είπαν "Σε Ευχαριστώ": seeder

Κωδικοποίηση ... ANSI ... UTF-8 ... UTF-8 χωρίς BOM ? 11 Χρόνια 5 Μήνες πριν #1999

  • myle
  • Το Άβαταρ του/της myle
  • Αποσυνδεμένος
  • Admin
  • Δημοσιεύσεις: 467
  • Ληφθείσες Ευχαριστίες 15
ANSΙ είναι υποσύνολο του utf8.*

Η Python 3 χρησιμοποιεί από default utf8 για τον κώδικα.

Όταν επεξεργάζεσαι εξωτερικά αρχεία, πρέπει να τα επεξεργάζεσαι με βάση το αντίστοιχο encoding. Υπάρχουν βιβλιοθήκες της Python που το κάνουν αυτό.

*Υπάρχει μια σύγχυση στο τι αναφέρεται ως ansi πολλές φορές. Αν εννοείς το ευρέως διαδεμένο 7-bit ascii τότε ισχύει το παραπάνω.
«Αν υποθέσουμε ότι αυτό είναι δυνατό, (να μεταδώσουμε τη σοφία παντού) τότε ειλικρινά ο τρόπος ζωής των θεών θα περάσει στους ανθρώπους. Τα πάντα θα είναι γεμάτα...
Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.
Συντονιστές: pmav99
Χρόνος δημιουργίας σελίδας: 0.247 δευτερόλεπτα

Μοιράσου το!

Powered by CoalaWeb

Λίστα Ταχυδρομείου