如何用python将dataframe更新原来的sql表
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了如何用python将dataframe更新原来的sql表相关的知识,希望对你有一定的参考价值。
pandas是python环境下最有名的数据统计包,而DataFrame翻译为数据框,是一种数据组织方式,这么说你可能无法从感性上认识它,举个例子,你大概用过Excel,而它也是一种数据组织和呈现的方式,简单说就是表格,而在在pandas中用DataFrame组织数据,如果你不print DataFrame,你看不到这些数据,下面我们来看看DataFrame是如何使用的。首先是引入pandas和numpy,这是经常配合使用的两个包,pandas依赖于numpy,引入以后我们可以直接使用np/pd来表示这个两个模块
先创建一个时间索引,所谓的索引(index)就是每一行数据的id,可以标识每一行的唯一值
为了快速入门,我们看一下如何创建一个6X4的数据:randn函数用于创建随机数,参数表示行数和列数,dates是上一步创建的索引列
我们还可以使用字典来创建数据框,例如创建一个列名为A的数据框,索引是自动创建的整数
这又是一个字典创建DataFrame的例子
假如字典内的数据长度不同,以最长的数据为准,比如B列有4行:
可以使用dtypes来查看各行的数据格式
接着看一下如何查看数据框中的数据,看一下所有的数据
使用head查看前几行数据(默认是前5行),不过你可以指定前几行
查看前三行数据
使用tail查看后5行数据
查看数据框的索引
查看列名用columns
查看数据值,用values
查看描述性统计,用describe
使用type看一下输出的描述性统计是什么样的数据类型——DataFrame数据
使用T来转置数据,也就是行列转换
对数据进行排序,用到了sort,参数可以指定根据哪一列数据进行排序。
好了,这篇入门教程到这里,后面还有很多,希望有志同道合的朋友一起交流学习,有什么说的不对的地方,请批评指正。 参考技术A db_url = "mssql+pymssql://用户名:密码@ip地址:端口号/数据库"
engine = create_engine(db_url, encoding='utf8', echo=False)
df = DataFrame(pdu_update_info_list, columns=["equ_id", "p", "u", "i", "update_time"])
df.to_sql("pdu_update_info_list", con=engine, if_exists='append', index=False, chunksize=1000)
把DataFrame里面的columns里的字段对应上你的sql表字段 参考技术B pd.io.sql.to_sql(df,'xxx',zh_con,flavor='mysql',if_exists='append',index=False,chunksize=10000)
以上是关于如何用python将dataframe更新原来的sql表的主要内容,如果未能解决你的问题,请参考以下文章
如何用pandas将某列进行唯一编码后,修改原dataframe
如何用 4 个图例而不是 2 个更改 python pyplot 图例
如何用pandas将某列one-hot编码后,修改原dataframe