消除 xa0返回UnicodeEncodeError

Question

我使用Xpath获取数据，输出的'xa0'是Unicode。我想消除它，但它返回：

UnicodeEncodeError: 'ascii' codec can't encode character u'xa0' in position 0: ordinal not in range(128)

这是我的代码：

page_active = requests.get('http://www.marketinout.com/stock-screener/stocks.php?list=volume_leaders&exch=asx')
active = html.fromstring(page_active.content)
data = active.xpath('//tbody/tr/td/text()')
data >>> [u'xa0', u'xa0', u'xa0Bard1 Life Sciences Limited                                                         

                                                                                                           ',
 u'xa0Gold', u'xa0Basic Materials', u'xa0ASX', u'xa07', u'xa00.025', u'xa00.015', u'xa0150.0', u'xa02
78,097,367', u'xa0', u'xa0', u'xa0Patrys Ltd  ...]

为了消除'xa0'，我尝试了[a.replace('xa0',' ') for a in data]，但它返回：

UnicodeEncodeError: 'ascii' codec can't encode character u'xa0' in position 0: ordinal not in range(128)

我也使用[a.decode('utf-8').replace("xa0","") for a in data]但我仍然得到同样的错误。

Answer 1

另一答案