mycursor.executemany 更新未按预期工作
Posted
技术标签:
【中文标题】mycursor.executemany 更新未按预期工作【英文标题】:mycursor.executemany UPDATE not working as expected 【发布时间】:2019-05-28 07:07:14 【问题描述】:问题:
我有一个 python 脚本来抓取和网站,它获取 2 个变量并将它们存储在 2 个列表中。然后,我使用 executemany 更新 mysql 数据库,使用一个变量匹配预先存在的行以将另一个变量插入其中。
代码:
Python 脚本
import mysql.connector
from bs4 import BeautifulSoup as soup
from selenium import webdriver
import time, re
mydb = mysql.connector.connect(
host="host",
user="user",
passwd="passwd",
database="database"
)
mycursor = mydb.cursor()
d = webdriver.Chrome('D:/Uskompuf/Downloads/chromedriver')
d.get('https://au.pcpartpicker.com/products/cpu/overall-list/#page=1')
def cpus(_source):
result = soup(_source, 'html.parser').find('ul', 'id':'category_content').find_all('li')
_titles = list(filter(None, [(lambda x:'' if x is None else x.text)(i.find('div', 'class':'title')) for i in result]))
data = [list(filter(None, [re.findall('(?<=\().*?(?=\))', c.text) for c in i.find_all('div')])) for i in result]
return _titles, [a for *_, [a] in filter(None, data)]
_titles, _cpus = cpus(d.page_source)
sql = "UPDATE cpu set family = %s where name = %s"
mycursor.executemany(sql, list(zip(_cpus, _titles)))
print(sql, list(zip(_titles, _cpus)))
_last_page = soup(d.page_source, 'html.parser').find_all('a', 'href':re.compile('#page\=\d+'))[-1].text
for i in range(2, int(_last_page)+1):
d.get(f'https://au.pcpartpicker.com/products/cpu/overall-list/#page=i')
time.sleep(3)
_titles, _cpus = cpus(d.page_source)
sql = "UPDATE cpu set family = %s where name = %s"
mycursor.executemany(sql, list(zip(_cpus, _titles)))
mydb.commit()
MySQL 更新代码
sql = "UPDATE cpu set family = %s where name = %s"
mycursor.executemany(sql, list(zip(_cpus, _titles)))
MySQL UPDATE 代码打印
print(sql, list(zip(_cpus, _titles)))
MySQL UPDATE 代码打印输出
UPDATE cpu set family = %s where name = %s [('Pinnacle Ridge', 'AMD Ryzen 5 2600'), ('Coffee Lake-S', 'Intel Core i7-8700K'),...
表格的前 2 行
预期结果
第一个变量是名称,即需要匹配的变量,第二个变量是要更新为行的族。名称完全匹配,运行程序时没有错误,但是所有家庭值都是空的。
不确定解决这个问题的最佳方法是什么,虽然我可以做一个小提琴但不确定 executemany 中的列表?
其他
如果您需要更多信息,请告诉我。
谢谢
【问题讨论】:
我可以问一个问题吗?任何名称的值都是Pinnacle Ridge
。因为我运行了一个像cur.executemany("UPDATE test SET col = %s WHERE col = %s", [("a","1"),("b","2")])
这样的小例子,所以效果很好。
对不起,我不确定我是否完全理解名称值是 AMD Ryzen 5 2600、Intel Core i7-8700k 等,该系列是 Pinnacle Ridge、Coffe-Lake-S。我不确定订单是否不正确,如果是,我该如何重新排列?
我认为您应该解决您的问题,您打印的内容和您在 executemany 中使用的内容不同。
其实你的情况让我很困惑。我创建了一个类似的表并首先在_titles
中插入所有值。然后使用你的部分代码(在for循环之前),我得到了你想要的| AMD Ryzen 5 2600 | Pinnacle Ridge | | Intel Core i7-8700K | Coffee Lake-S | | AMD Ryzen 7 2700X | Pinnacle Ridge | | AMD Ryzen 3 2200G | Raven Ridge |
抱歉,我不确定您的意思是什么,我正在尝试通过名称实现与行匹配的家庭?你知道我需要在我的代码中改变什么来实现这一点吗?
【参考方案1】:
只需要补充:
mydb.commit()
之后
executemany
【讨论】:
以上是关于mycursor.executemany 更新未按预期工作的主要内容,如果未能解决你的问题,请参考以下文章