ΘΕΜΑ: Διάβασμα δεδομένων από web page.

Διάβασμα δεδομένων από web page. 9 Χρόνια 1 Εβδομάδα πριν #2886

Tassos
Αποσυνδεμένος
pyth__
g-lts.info
Δημοσιεύσεις: 78
Ληφθείσες Ευχαριστίες 5

Σας ευχαριστώ πάρα πάρα πολύ για τις απαντήσεις σας.

Δηλαδή έκανα μεγάλο λάθος με τις κανονικές εκφράσεις έτσι; ( Αν και κατάφερα κάτι.. δεν ήταν ο καλύτερος και "πιο καλός προγραμματιστικά" τρόπος να το κάνω αυτό ; )

Παρόλα αυτά σας ευχαριστώ ιδιαίτερα, όσοι μου είπατε να χρησιμοποιήσω κανονικές εκφράσεις. Ήταν μια εμπειρία και ένα μάθημα που πείρα. Ευχαριστώ επίσης όμως, και εσάς που μου είπατε πόσο λάθος είναι και μου δώσατε μια απίστευτα χρήσιμη πληροφορία με επιχειρήματα που δεν την είχα βρει ( και δε ξέρω αν θα την έβρισκα ).

Πλέον αν και σε αυτή την επεξεργασία της απάντησης μου, έχω βρει σχεδόν την λύση, θέλω να αφήσω ένα σαν "χρονικό" της προσπάθειας να υλοποιήσω αυτό που θέλω, αλλά και να μου πείτε αν η υλοποίηση μου είναι αυτή που θα κάνατε και εσείς.

Προσθήκη πρώτης απάντησης :

ΠΡΟΣΟΧΗ Spoiler! [Πατήστε για επέκταση]

Ενημέρωση απάντησης : Τελικά φίλοι μου, είμαι πολύ χαρούμενος διότι κατάφερα να κάνω αυτό που ήθελα με αυτό τον κώδικα :

#!/usr/bin/env python3
#-*-coding: utf-8-*-
 
from bs4 import BeautifulSoup
import urllib.request
 
page = urllib.request.urlopen('https://www.site.gr/news.php')
 
html = BeautifulSoup(page)
 
center = html.find_all('center')
# Έτσι πείρα την λίστα "center", που η κάθε θέση της έχει ένα παιδίο <center>...</center>
 
for line in center: 
	for a in line.find_all('a'):
		print (a)
 
 
print ("\nΑναλυτικό print!\n")
 
link_anakinosis = []
anakinosi = []
 
for line in center:
	for link in line.find_all('a'):
		link_anakinosis.append( link.get('href') )
		anakinosi.append( link.get_text() )
 
 
 
for i in range(0,len(anakinosi)):
	print (anakinosi[i], "-", link_anakinosis[i] )

Δείτε εδώ το αποτέλεσμα.

Ο τρόπος που το έκανα, πως σας φαίνεται;

Όσο για μία πρόταση, που μου λέτε να χρησιμοποιήσω το RSS, αντί να κάνω scrapping.
Αν και η συγκεκριμένη σελίδα δε βλέπω να έχει RSS, ποτέ δεν ασχολήθηκα ιδιαίτερα με ρο RSS, απλώς γνωρίζω τι είναι. Αν μπορεί κάποιος - έχει τον χρόνο και την ευχαρίστηση να μοιραστεί κάποιες γνώσεις πάνω στο RSS μαζί μας, θα ήταν μεγάλη η χαρά μου και η ευχαρίστηση.

Παρόλα αυτά, θέλω να σημειώσω τελικά, πως αν και στην αρχή η βιβλιοθήκη BeautifulSoup μου έβγαζε κάτι σαν "οχ.. τι είναι τώρα αυτό.. πως θα το καταλάβω και θα το μάθω..", στη πορεία με λίγο ψάξιμο και πειραματισμούς κατάφερα κάπως να την χρησιμοποιήσω.

Περιμένω τις πολύ ενδιαφέρουσες και ουσιώδεις απόψεις σας!

Σας ευχαριστώ και πάλι, πάρα πολύ!

Ομάδα Ελληνικής - Μακροχρόνιας υποστήριξη.

Greek - Long Term Support Team.

Επισκεφθείτε μας εδώ : g-lts.info

Τελευταία διόρθωση: 9 Χρόνια 1 Εβδομάδα πριν από Tassos. Αιτία: Ενημέρωση προόδου.

Πρέπει να είστε εγγεγραμμένο μέλος του Φόρουμ για να κάνετε μια δημοσίευση.

Σελίδα:
1
2

Συντονιστές: pmav99

Συζήτηση

Προγραμματισμός

Αναζήτηση Βοήθειας

Διάβασμα δεδομένων από web page.

Χρόνος δημιουργίας σελίδας: 0.347 δευτερόλεπτα

Μενού Συζήτησης

Λίστα Ταχυδρομείου

© 2009-2024 Ελληνική Κοινότητα Προγραμματιστών Python - Η παρούσα δουλειά από το http://python.org.gr αδειοδοτήται κάτω από την Creative Commons Attribution 3.0 Greece License
Η διαχείριση του περιεχομένου του site γίνεται με το Joomla από τους Κωνσταντίνο Αραβανή και Δημήτρη Λεβεντέα. Σχεδιάστηκε από Shape5.com

ΘΕΜΑ: Διάβασμα δεδομένων από web page.

Διάβασμα δεδομένων από web page. 9 Χρόνια 1 Εβδομάδα πριν #2886

Μοιράσου το!

Μενού Συζήτησης

Λίστα Ταχυδρομείου