PYTHON怎样编写自动化

Posted 2023-03-09

tags:

篇首语：本文由小常识网(cha138.com)小编为大家整理，主要介绍了PYTHON怎样编写自动化相关的知识，希望对你有一定的参考价值。

就直接写脚本，给你举给例子：

编写工具：

1.设计目标：

首先说一下我要工具的功能：

遍历某个目录下包括其下子目录中所有指定的后缀文件，然后为这些文件的头部插入指定的字符串。

2.使用场景：

设计这样的工具起因是我最近在将之前 CSDN 中的博客搬运到自己的 Hexo 博客空间上，了解的应该知道，假如都是 Markdown 编写的话，搬运的时候只需要在文件头部加上如下的一串额外的内容：

---
title: 博客标题
date: 博客创建时间（例如：2016-09-03 17:15:22）
tags: 标签（如：[Hexo,Next]，多个的话用,号隔开）
categories: 分类(如：Web)
---123456

标题 title 直接使用文件名称去掉 .md 后缀即可；

时间 date 需要通过文件库获取文件的创建时间；

标签 tags 和分类 categories ，由于我的文件会根据分类放入不同的子目录下，所以直接获取当前文件所在目录的名称即可。

此外，为了在博客首页只展示部分内容，而不是展开博客的完整内容，还需要在博客中恰当的位置插入这个标签： ，通常加载第一段内容结束的位置。

3.实现代码：

根据上面的思路，我们在 source/_posts 目录下创建一个工具脚本，起名为 SuitFileToHexo.py ，然后依次完成以下步骤：

指定 Linux 环境下 Python 解释器目录，并指定编码方式：

引入的模块：

在脚本开始的地方，最先需要做的事情就是把需要用到的模块都先引入进来，大致分析一下我们这个功能需要用到的模块：

遍历当前目录下所有 .md 文件列表：

这就需要使用到 Python 的文件目录操作模块 os.path ，使用 os.listdir 获取目录列表，然后通过 os.path.splitext 分割文件名称和后缀名，从而筛选合格的文件：

这里发现了一个问题，就是在 os.path.isdir(i) 在 2.7.11 的版本莫名其妙地返回 false，需要做如下修改才能正常：

获取文件的创建时间：

需要使用到 os.time 模块的功能：

获取博客标题：

其实就是从目录字符串中截掉后缀名，再截掉最后一个 / 之前的内容即可得到博客名称：

获取文件所在的目录名称作为页签值：

与获取博客名称思路略有相似，获取最后一个斜杠位置，截掉斜杠之后的内容，在获取一个最后一个斜杠位置，假如有则截取斜杠之后的内容即是文件所在目录的名称：

向文件中插入内容：

调用以上方法即可分别得到我们想要的信息：

接下来要做的就是把这些内容按照格式插入到文件中去，当然插入之前需要先检查文件中是否已经插入过类似的内容了，可以简单地通过检查开头 40 个字符串中是否包含这个字符串来判别：

关于展示分隔符  插入的位置，大致逻辑是：第一个标题后面，而且刚好插入在第二个标题之前即可，而使用 Markdown 语法撰写的博客标题使用 # 来表示的，最终的插入方法如下：

最后完整的调用过程：

参考技术A python 有一个很优秀的自动化框架叫做selenium
但是在写程序之前，需要明确所操作的步骤是否是可重复性
然后定制流程计划
然后通过代码实现
python自动是一个十分强大的功能
如果想要了解更详细的内容可以搜索python selenium
获得更多更详细的内容

以上是关于PYTHON怎样编写自动化的主要内容，如果未能解决你的问题，请参考以下文章