得到Del.icio.us公司来自搜索的链接

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了得到Del.icio.us公司来自搜索的链接相关的知识,希望对你有一定的参考价值。

find great websites by scraping links from delicious.com
  1. #!/usr/bin/env python
  2. # -*- coding: utf-8 -*-
  3. # (C) 2009 HalOtis Marketing
  4. # written by Matt Warren
  5. # http://halotis.com/
  6.  
  7. """
  8. Scraper for Del.icio.us SERP.
  9.  
  10. This pulls the results for a match for a query on http://del.icio.us.
  11. """
  12.  
  13. import urllib2
  14. import re
  15.  
  16. from BeautifulSoup import BeautifulSoup
  17.  
  18. def get_delicious_results(query, page_limit=10):
  19.  
  20. page = 1
  21. links = []
  22.  
  23. while page < page_limit :
  24. url='http://delicious.com/search?p=' + '%20'.join(query.split()) + '&context=all&lc=1&page=' + str(page)
  25. req = urllib2.Request(url)
  26. html = urllib2.urlopen(req).read()
  27. soup = BeautifulSoup(HTML)
  28.  
  29. next = soup.find('a', attrs={'class':re.compile('.*next$', re.I)})
  30.  
  31. #links is a list of (url, title) tuples
  32. links += [(link['href'], ''.join(link.findAll(text=True)) ) for link in soup.findAll('a', attrs={'class':re.compile('.*taggedlink.*', re.I)}) ]
  33.  
  34. if next :
  35. page = page+1
  36. else :
  37. break
  38.  
  39. return links
  40.  
  41. if __name__=='__main__':
  42. links = get_delicious_results('halotis marketing')
  43. print links

以上是关于得到Del.icio.us公司来自搜索的链接的主要内容,如果未能解决你的问题,请参考以下文章

PHP 从del.icio.us链接生成blogroll

轻松地播放mp3文件直接在您的网站或博客使用del.icio.us公司戏耍者

在Python3.5中使用 The del.icio.us API

JavaScript del.icio.us Bookmarklet

JavaScript del.icio.us历史书签

JavaScript 使用del.icio.us PlayTagger直接在您的网站或博客上轻松播放mp3文件