爬虫简单python小程序
Posted chelseatan
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了爬虫简单python小程序相关的知识,希望对你有一定的参考价值。
import requests from bs4 import BeautifulSoup base_url = \'your_base_url_here\' # 根据网站的实际URL模式修改此函数 def get_page_url(page_number): return f\'base_url?page=page_number\' # 根据网站的HTML结构,您可能需要修改以下选择器以获取游戏标题 def get_game_titles(soup): return soup.select(\'span.title\') for page_number in range(1, 198): url = get_page_url(page_number) response = requests.get(url) soup = BeautifulSoup(response.text, \'html.parser\') game_titles = get_game_titles(soup) print(f\'Page page_number:\') for title in game_titles: print(title.text) print(\'\\n\')
python爬虫学习之用Python抢火车票的简单小程序
利用Python制作自动抢火车票小程序,过年再也不要担心没票了!
前言
每次过年很多人都会因为抢不到火车票而回不了家,所以小编利用Python写了一个自动抢火车票的工具,希望大家能抢到火车票,回家过个好年!
我本来想自己写一个练练手的,但是转眼一想,Python 本身最大的优势是什么,不就是有很多牛逼的人已经造好轮子了吗?你只需要知道这些轮子并会使用就行了,这样会节省你大量的精力和时间,而且站在巨人的肩膀上,会看得更远。于是我在 github 上一搜索,果然有不少抢票程序,有的是 Python2,有的是 Python3,按 start 数据排序,经过亲自使用和对比,我选择了一个相对较好用的程序,并稍加以改进和完善。
话不多说,直接上代码:
1 ‘‘‘ 2 在学习过程中有什么不懂得可以加我的 3 python学习交流扣扣qun,934109170 4 群里有不错的学习视频教程、开发工具与电子书籍。 5 与你分享python企业当下人才需求及怎么从零基础学习好python,和学习什么内容。 6 ‘‘‘ 7 8 @@ -0,0 +1,124 @@ 9 # -*- coding: utf-8 -*- 10 """ 11 @author: liuyw 12 """ 13 from splinter.browser import Browser 14 from time import sleep 15 import traceback 16 import time, sys 17 18 class huoche(object): 19 driver_name = ‘‘ 20 executable_path = ‘‘ 21 #用户名,密码 22 username = u"xxx" 23 passwd = u"xxx" 24 # cookies值得自己去找, 下面两个分别是沈阳, 哈尔滨 25 starts = u"%u6C88%u9633%2CSYT" 26 ends = u"%u54C8%u5C14%u6EE8%2CHBB" 27 28 # 时间格式2018-01-19 29 dtime = u"2018-01-19" 30 # 车次,选择第几趟,0则从上之下依次点击 31 order = 0 32 ###乘客名 33 users = [u"xxx",u"xxx"] 34 ##席位 35 xb = u"二等座" 36 pz = u"成人票" 37 38 """网址""" 39 ticket_url = "https://kyfw.12306.cn/otn/leftTicket/init" 40 login_url = "https://kyfw.12306.cn/otn/login/init" 41 initmy_url = "https://kyfw.12306.cn/otn/index/initMy12306" 42 buy = "https://kyfw.12306.cn/otn/confirmPassenger/initDc" 43 44 def __init__(self): 45 self.driver_name = ‘chrome‘ 46 self.executable_path = ‘D:/chromedriver‘ 47 48 def login(self): 49 self.driver.visit(self.login_url) 50 self.driver.fill("loginUserDTO.user_name", self.username) 51 # sleep(1) 52 self.driver.fill("userDTO.password", self.passwd) 53 print(u"等待验证码,自行输入...") 54 while True: 55 if self.driver.url != self.initmy_url: 56 sleep(1) 57 else: 58 break 59 60 def start(self): 61 self.driver = Browser(driver_name=self.driver_name,executable_path=self.executable_path) 62 self.driver.driver.set_window_size(1400, 1000) 63 self.login() 64 # sleep(1) 65 self.driver.visit(self.ticket_url) 66 try: 67 print(u"购票页面开始...") 68 # sleep(1) 69 # 加载查询信息 70 self.driver.cookies.add("_jc_save_fromStation": self.starts) 71 self.driver.cookies.add("_jc_save_toStation": self.ends) 72 self.driver.cookies.add("_jc_save_fromDate": self.dtime) 73 74 self.driver.reload() 75 76 count = 0 77 if self.order != 0: 78 while self.driver.url == self.ticket_url: 79 self.driver.find_by_text(u"查询").click() 80 count += 1 81 print(u"循环点击查询... 第 %s 次" % count) 82 # sleep(1) 83 try: 84 self.driver.find_by_text(u"预订")[self.order - 1].click() 85 except Exception as e: 86 print(e) 87 print(u"还没开始预订") 88 continue 89 else: 90 while self.driver.url == self.ticket_url: 91 self.driver.find_by_text(u"查询").click() 92 count += 1 93 print(u"循环点击查询... 第 %s 次" % count) 94 # sleep(0.8) 95 try: 96 for i in self.driver.find_by_text(u"预订"): 97 i.click() 98 sleep(1) 99 except Exception as e: 100 print(e) 101 print(u"还没开始预订 %s" % count) 102 continue 103 print(u"开始预订...") 104 # sleep(3) 105 # self.driver.reload() 106 sleep(1) 107 print(u‘开始选择用户...‘) 108 for user in self.users: 109 self.driver.find_by_text(user).last.click() 110 111 print(u"提交订单...") 112 sleep(1) 113 self.driver.find_by_text(self.pz).click() 114 self.driver.find_by_id(‘‘).select(self.pz) 115 # sleep(1) 116 self.driver.find_by_text(self.xb).click() 117 sleep(1) 118 self.driver.find_by_id(‘submitOrder_id‘).click() 119 print(u"开始选座...") 120 self.driver.find_by_id(‘1D‘).last.click() 121 self.driver.find_by_id(‘1F‘).last.click() 122 123 sleep(1.5) 124 print(u"确认选座...") 125 self.driver.find_by_id(‘qr_submit_id‘).click() 126 127 except Exception as e: 128 print(e) 129 130 if __name__ == ‘__main__‘: 131 huoche = huoche() 132 huoche.start()
以上是关于爬虫简单python小程序的主要内容,如果未能解决你的问题,请参考以下文章