Come fare web scraping con Matlab

In questa lezione ti spiego come fare web scraping con Matlab.

Cos'è il web scraping? Il web scraping consiste nel leggere il contenuto di una pagina web per memorizzarlo in una variabile della sessione di lavoro di Matlab oppure in un file sul PC. In questo modo puoi elaborare il testo contenuto nella pagina tramite lo script. Ad esempio per cercare informazioni nel testo ed estrapolare dati.

Per leggere e scaricare una pagina web usa la funzione urlread()

>> page=urlread('https://www.eage.it')

Digita l'indirizzo URL della pagina web che vuoi scaricare tra le parentesi tonde.

La funzione urlread() legge il contenuto online della pagina web e lo salva nella variabile page di Matlab.

E per salvare il contenuto della pagina su un file?

In questo caso devi usare la funzione urlwrite()

>> urlwrite('https://www.eage.it', 'prova.dat')

La funzione urlwrite() ha due parametri tra le parentesi tonde

  • L'indirizzo Url della pagina web o del documento online
  • Il nome del file dove salvare il contenuto

Questa funzione legge il contenuto della pagina e lo salva sul file nella cartella di lavoro di Matlab sul tuo PC.

In questo caso il nome del file è prova.dat

Nota. In entrambi i casi le funzioni di web scraping richiedono che sia aperto un collegamento internet per poter accedere accedere ai contenuti della rete internet.

Una volta salvato il contenuto della pagina sul file, per elaborare le informazioni puoi aprirlo come un normale file di testo.




Non hai risolto il tuo problema? Scrivi una domanda




FacebookTwitterLinkedinLinkedin