首页 > 解决方案 > Python需要一个类似字节的对象,而不是'str'错误

问题描述

我正在尝试编写一个基本的 python 程序,该程序从 yahoo Finance 的网站获取价格与账面比。但是,我收到一个错误:

failed in the main loop a bytes-like object is required, not 'str'

我已经尝试在这一行中使用编码:

sourceCode.read().decode('utf-8')

然而,这会导致另一个错误:

failed in the main loop 'bytes' object has no attribute 'read'

任何帮助,将不胜感激。完整代码如下:

import time
    import urllib.request
    from urllib.request import urlopen

stocks = ['aapl', 'fb', 'goog']

def keyStats(stock):
  try:
      sourceCode = urllib.request.urlopen('https://finance.yahoo.com/quote/' + stock + '/key-statistics?p=' + stock).read()
      ptb = sourceCode.split('Price/Book</span><!-- react-text: 58 --> <!-- /react-text --><!-- react-text: 59 -->(mrq)<!-- /react-text --><sup aria-label="KS_HELP_SUP_undefined" data-reactid="60"></sup></td><td class="Fz(s) Fw(500) Ta(end)" data-reactid="61">')[1].split('</td>')[0]
      print ('Price to Book Ratio: ', stock, ptb)

  except (Exception) as e:
      print ('failed in the main loop', e)

for newStock in stocks:
  keyStats(newStock)
  time.sleep(1)

标签: pythonpython-3.x

解决方案


urlopen返回一个响应对象,当使用 读取时read(),返回一个bytes对象。这是因为通常无法保证 HTTP 请求是返回二进制响应还是可以正确解码为字符串的响应。

相反,由您来显式解码响应,例如,如果您确切知道有 UTF-8 响应,或者通过显式检查 HTTP 响应中的 Content-Type 标头。

所以你需要这样做:

sourceCode = urllib.request.urlopen(url).read().decode()

它尝试bytes使用 UTF-8(默认情况下)将响应解码为字符串。然后sourceCode将是一个您可以调用的字符串str.split()


推荐阅读