python之字符处理
Posted OceanProo
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了python之字符处理相关的知识,希望对你有一定的参考价值。
一、判断字符
s = "Life is short. I use python"
s.isalnum() 判断字符串否是数字或字母
s.isalpha() 判断字符串是否为纯字母
s.isdigit() 判断字符串是否为纯数字
s.islower() 判断字符串中字母是否为纯小写字母(字符串中可以包含数字,返回为True)
s.isupper() 判断字符串中字母是否为纯大写字母(字符串中可以包含数字,返回为True)
s.isspace() 判断字符是否为空格,其中换行符(\\n)、回车符(\\r)、换页符(\\f)均返回True
s.istitle() 判断字符串为纯字母,且第一个字母是否为大写字母
二、字符转换
string = "you are a good man"
print(string.upper()) # 把所有字符中的小写字母转换成大写字母
print(string.lower()) # 把所有字符中的大写字母转换成小写字母
print(string.capitalize()) # 把第一个字母转化为大写字母,其余小写
print(string.title()) # 把每个单词的第一个字母转化为大写,其余小写
python入门,数据类型,字符编码,文件处理
1 DOM概述
1.1 什么是DOM
- 文档对象模型 Document Object Model
- 文档对象模型 是表示和操作 HTML和XML文档内容的基础API
- 文档对象模型,是W3C组织推荐的处理可扩展标志语言的标准编程接口
1.2 DOM分类
- 核心 DOM - 针对任何结构化文档的标准模型
- XML DOM - 针对 XML 文档的标准模型
- HTML DOM - 针对 HTML 文档的标准模型
1.3 DOM分级
-
1级dom
1级DOM在1998年10月份成为W3C的提议,由DOM核心与DOM HTML两个模块组成。DOM核心能映射以XML为基础的文档结构,允许获取和操作文档的任意部分。DOM HTML通过添加HTML专用的对象与函数对DOM核心进行了扩展。
-
2级dom
通过对原有DOM的扩展,2级DOM通过对象接口增加了对鼠标和用户界面事件、范围、遍历(重复执行DOM文档)和层叠样式表(CSS)的支持。
-
3级dom
3级DOM通过引入统一方式载入和保存文档和文档验证方法对DOM进行进一步扩展,DOM3包含一个名为“DOM载入与保存”的新模块,DOM核心扩展后可支持XML1.0的所有内容,包括XML Infoset、 XPath、和XML Base。
1.4 DOM树
2 节点
2.1 什么是节点
文档中的每一个部分都是节点,包括document 元素 属性 文本...
2.2 节点的分类
- Document
Element 元素 Attr 属性 - Text 文本
- Comment 注释
2.3 节点属性
-
nodeName 节点名字
document : #document element : 标签名 attr : 属性名 text : #text comment : #comment
-
nodeValue 节点值
document : null element : null attr : 属性值 text : 文本内容 comment : 注释内容
-
nodeType 节点类型
document : 9 element : 1 attr : 2 text : 3 coment : 8
3 获取元素对象
-
通过ID获取元素
document.getElementById() id属性可自动成为被脚本访问的全局变量
-
通过name值获取元素
document.getElementsByName() IE9+和标准浏览器认为 所有的元素都有name IE9- 认为只有个别元素有name 表单和表单控件 img iframe embed object .... docuemnt会为某些元素创建以元素name为名字的属性 <form> <img> .......
-
通过标签名获取元素
document.getElementsByTagName() element.getElementsByTagName() document.images 所有img的引用 document.forms 所有表单的引用 document.links 所有超链接的引用 docuent.anchors 所有锚点的引用
-
通过类名选取元素(IE9+)
document.getElementsByClassName() element.getElementsByClassName()
-
通过CSS选择器选取元素
document.querySelectorAll() document.querySelector() element.querySelectorAll() element.querySelector()
-
获取所有的元素
document.all
4 文档结构和遍历文档
4.1 节点关系
- 父节点 父元素
- 子节点 子元素
- 同辈节点 同辈元素
- 祖先节点 祖先元素
- 后代节点 后代元素
4.2 作为节点树的文档
- parentNode 父节点
- childNodes 所有子节点的集合
- firstChild 第一个子节点
- lastChild 最后一个子节点
- nextSibling 下一个兄弟节点
- previousSibling 上一个兄弟节点
4.3 作为元素树的文档
- parentElement 父元素 大部分情况下 parentElement 等同于 parentNode
- children 所有子元素的集合
- firstElementChild IE9+ 第一个子元素
- lastElementChild IE9+ 最后一个子元素
- nextElementSibling IE9+ 下一个兄弟元素
- previousElementSibling IE9+ 上一个兄弟元素
- childElementCount IE9+ 子元素的数量
- ownerDocument 返回元素所属的文档对象
5 属性
5.1 HTML标签的属性和元素对象的属性
HTMLElement对象映射了元素的HTML属性
5.2 获取和设置非标准的HTML属性
- getAttribute(attrname) 获取自定义或内置属性的值
- setAttribute(attrnane, value) 设置自定义或内置属性
- hasAttribute(attrname) 判断是否存在该属性
- removeAttribute() 移出自定义或内置的属性
5.3 作为Attr节点的
- arrtibutes 属性
- setAttributeNode()
- getAttributeNode()
- document.createAttribute() 创建属性节点
6 元素的内容
6.1 作为HTML的元素内容
- innerHTML
- outerHTML
6.2 作为纯文本的元素内容
- textContent IE9+
- innerText 会忽略多余空白
6.3 作为Text节点的元素内容
文本节点的方法
appendData() 向文本节点追加内容
deleteData() 删除文本节点的一部分内容
insertData() 向文本节点中插入内容
replaceData() 替换内容
substringData() 截取内容
创建文本节点
document.createTextNode()
7 创建、插入、删除 节点
7.1 创建节点
document.createElement()
7.2 插入节点
appendChild() 在元素的最后追加一个子元素
insertBefore() 在元素指定的位置插入一个子元素
7.3 删除节点
removeChild()
7.4 替换节点
replaceChild(new_node, old_node)
7.5 克隆节点
cloneNode()
参数
true 克隆元素以及所有的厚点节点
false 仅仅克隆节点本身
7.6 DocumentFragment
document.createDocumentFragment()可以创建该对象
DocumentFragment 接口表示文档的一部分(或一段)。更确切地说,它表示一个或多个邻接的 Document 节点和它们的所有子孙节点。
DocumentFragment 节点不属于文档树,继承的 parentNode 属性总是 null。
请求把一个 DocumentFragment 节点插入文档树时,插入的不是 DocumentFragment 自身,而是它的所有子孙节点。这使得 DocumentFragment 成了有用的占位符,暂时存放那些一次插入文档的节点
8 元素的尺寸、位置、滚动
8.1 元素坐标
offsetLeft 距离左边的距离, 相对规则同 css 的定位
offsetTop 距离上边的距离, 相对规则同 css 的定位
offsetParent 得到第一定位的祖先元素
clientLeft 没卵用 就是边框宽
clientTop 没卵用 就是边框宽
getBoundingClientRect() 返回对象 包含位置信息 大小信息
8.2 判定某个元素在某点
document.elementFromPoint()
8.3 查询元素的几何尺寸
getBoundingClientRect()
getClientRects()
offsetWidth
offsetHeight
clientWidth
clientHeight
scrollWidth
scrollHeight
8.4 滚动
scrollLeft
scrollTop
9 Document对象
每个载入浏览器的 HTML 文档都会成为 Document 对象。 Document 对象使我们可以从脚本中对 HTML 页面中的所有元素进行访问。
9.1 属性
URL 获取当前页面的url 只读
domain 获取域名
referrer 获取上一个页面的地址 只读
title
location
lastModified
cookie
9.2 方法
write()
writeln()
10 HTML表单中的相关对象
10.1 选取表单和表单元素
10.2 表单和表单元素的属性
10.3 from对象
属性
elements 所有表单控件组成的集合
方法
submit() 让表单提交
reset() 让表单重置
10.3 按钮(button submit reset)对象
方法
focus() 获得焦点
blur() 使失去焦点
click() 使按钮比被单击
10.4 单选复选
方法
focus() 获得焦点
blur() 失去焦点
click() 被单击
10.5 文本(input textarea)
方法
focus() 获取焦点
blur() 失去焦点
select() 全部被选中
10.6 select对象
属性
options
selectedIndex
length 选项的数量
方法
add() 添加选项
remove() 移出选项, 参数是option的索引
focus() 获取焦点
blur() 失去焦点
11 Table中相关对象
11.1 table对象
属性
cells 返回包含表格中所有单元格的一个数组。
rows 返回包含表格中所有行的一个数组。
方法
createCaption() 为表格创建一个 caption 元素。
deleteCaption() 从表格删除 caption 元素以及其内容。
createTHead() 在表格中创建一个空的 tHead 元素。
deleteTHead() 从表格删除 tHead 元素及其内容。
createTFoot() 在表格中创建一个空的 tFoot 元素。
deleteTFoot() 从表格删除 tFoot 元素及其内容。
insertRow() 在表格中插入一个新行。
deleteRow() 从表格删除一行。
11.2 tr对象
属性
cells 返回包含行中所有单元格的一个数组。
rowIndex 返回该行在表中的位置。
方法
deleteCell() 删除行中的指定的单元格。
insertCell() 在一行中的指定位置插入一个空的 <td> 元素。
11.3 td对象、th对象
属性
cellIndex 返回单元格在某行的单元格集合中的位置。
以上是关于python之字符处理的主要内容,如果未能解决你的问题,请参考以下文章