Pytanie w sprawie cookies, urllib2, python, httplib – Jak „zachować przy życiu” z cookielib i httplib w pythonie?

1

W pythonie używam httplib, ponieważ „podtrzymuje” połączenie http (w przeciwieństwie do urllib (2)). Teraz chcę używać cookielib z httplib, ale wydają się nienawidzić! (nie ma możliwości łączenia ich ze sobą).

Czy ktoś zna rozwiązanie tego problemu?

Aby zachować spójność, możesz zmienić wszystkie odwołania do capitalize () przez lower () i has_header oraz get_headers klucz przekonwertowany również na niższy user414742
czy użycie httplib jest wymogiem? cookielib działa świetnie z urllib2 i możesz dodawać własne nagłówki podtrzymujące. Corey Goldberg

Twoja odpowiedź

2   odpowiedź
2

Powinieneś rozważyć użycieRequests zamiast tego przy najbliższej okazji musisz zmienić kod. W międzyczasie;

HACK ALERT! :)

Poszedłem na inny sugerowany sposób, ale zrobiłem hack (zrobiony z różnych powodów), który tworzy interfejs międzyhttplib icookielib.

To, co zrobiłem, to stworzenie podróbkiHTTPRequest z minimalnym wymaganym zestawem metod, więcCookieJar rozpoznałby go i przetworzył pliki cookie zgodnie z potrzebami. Użyłem tego fałszywego obiektu żądania, ustawiając wszystkie dane potrzebne dla cookielib.

Oto kod klasy:

<code>class HTTPRequest( object ):
"""
Data container for HTTP request (used for cookie processing).
"""

  def __init__( self, host, url, headers={}, secure=False ):
    self._host = host
    self._url = url
    self._secure = secure
    self._headers = {}
    for key, value in headers.items():
      self.add_header(key, value)

  def has_header( self, name ):
    return name in self._headers

  def add_header( self, key, val ):
    self._headers[key.capitalize()] = val

  def add_unredirected_header(self, key, val):
    self._headers[key.capitalize()] = val

  def is_unverifiable( self ):
    return True

  def get_type( self ):
    return 'https' if self._secure else 'http'

  def get_full_url( self ):
    port_str = ""
    port = str(self._host[1])
    if self._secure:
      if port != 443:
        port_str = ":"+port
    else:
      if port != 80:
        port_str = ":"+port
    return self.get_type() + '://' + self._host[0] + port_str + self._url

  def get_header( self, header_name, default=None ):
    return self._headers.get( header_name, default )

  def get_host( self ):
    return self._host[0]

  get_origin_req_host = get_host

  def get_headers( self ):
    return self._headers
</code>

Proszę zauważyć, że klasa obsługuje tylko protokół HTTPS (wszystko, czego potrzebowałem w tej chwili).

Kod, który używał tej klasy, to (proszę zwrócić uwagę na kolejny hack, aby odpowiedź była zgodna z cookielib):

<code>cookies = CookieJar()

headers = {
  # headers that you wish to set
}

# construct fake request
fake_request = HTTPRequest( host, request_url, headers )

# add cookies to fake request
cookies.add_cookie_header(fake_request)

# issue an httplib.HTTPConnection based request using cookies and headers from the fake request
http_connection.request(type, request_url, body, fake_request.get_headers())

response = http_connection.getresponse()

if response.status == httplib.OK:
  # HACK: pretend we're urllib2 response
  response.info = lambda : response.msg

  # read and store cookies from response
  cookies.extract_cookies(response, fake_request)

  # process response...
</code>
Ten hack właśnie zaoszczędził mi kilka godzin na samodzielnej realizacji tego samego. Dziękuję Ci. zwol
Witaj, Zack! To główny powód dzielenia się. :) Serge Broslavsky

Powiązane pytania