Python-Internet-yhteys käyttämällä Urllib.Request- ja urlopen () -ominaisuuksia

Sisällysluettelo:

Anonim

Mikä on urllib?

urllib on Python-moduuli, jota voidaan käyttää URL-osoitteiden avaamiseen. Se määrittelee toiminnot ja luokat, jotka auttavat URL-toiminnoissa.

Pythonilla voit myös käyttää ja hakea tietoja Internetistä, kuten XML, HTML, JSON jne. Voit myös käyttää Pythonia työskennellessäsi näiden tietojen kanssa suoraan. Tässä opetusohjelmassa aiomme nähdä, miten voimme noutaa tietoja verkosta. Esimerkiksi tässä käytimme guru99-video-URL-osoitetta, ja aiomme käyttää tätä video-URL-osoitetta Pythonilla sekä tulostaa tämän URL-osoitteen HTML-tiedoston.

Tässä opetusohjelmassa opimme

  • URL-osoitteen avaaminen Urllibin avulla
  • Kuinka lukea HTML-tiedosto URL-osoitteellesi Pythonissa

URL-osoitteen avaaminen Urllibin avulla

Ennen kuin suoritamme koodin muodostaaksesi yhteyden Internet-tietoihin, meidän on tuotava käsky URL-kirjastomoduulille tai "urllib".

  • Tuo urllib
  • Määritä päätoiminto
  • Ilmoitetaan muuttuja webUrl
  • Kutsu sitten URL-kirjaston urlopen-toiminto
  • Avaamasi URL-osoite on guru99-opetusohjelma YouTubessa
  • Seuraavaksi aiomme tulostaa tuloskoodin
  • Tuloskoodi noudetaan kutsumalla getcode-funktio luomallamme webUrl-muuttujalla
  • Muunamme sen merkkijonoksi, jotta se voidaan yhdistää merkkijonolla "tuloskoodi"
  • Tämä on tavallinen HTTP-koodi "200", mikä osoittaa, että http-pyyntö on käsitelty onnistuneesti

Kuinka saada HTML-tiedostolomakkeen URL Pythonissa

Voit myös lukea HTML-tiedoston käyttämällä Pythonin "lukutoimintoa", ja kun suoritat koodin, HTML-tiedosto näkyy konsolissa.

  • Kutsu lukutoiminto webURL-muuttujassa
  • Lukumuuttuja mahdollistaa datatiedostojen sisällön lukemisen
  • Lue URL-osoitteen koko sisältö muuttujaksi nimeltä data
  • Suorita koodi - Se tulostaa tiedot HTML-muotoon

Tässä on täydellinen koodi

Python 2 -esimerkki

## read the data from the URL and print it#import urllib2def main():# open a connection to a URL using urllib2webUrl = urllib2.urlopen("https://www.youtube.com/user/guru99com")#get the result code and print itprint "result code: " + str(webUrl.getcode())# read the data from the URL and print itdata = webUrl.read()print dataif __name__ == "__main__":main()

Python 3 -esimerkki

## read the data from the URL and print it#import urllib.request# open a connection to a URL using urllibwebUrl = urllib.request.urlopen('https://www.youtube.com/user/guru99com')#get the result code and print itprint ("result code: " + str(webUrl.getcode()))# read the data from the URL and print itdata = webUrl.read()print (data)