Python无疑是时下最热门的编程语言之一,尤其以其语法简洁著称。人生苦短,我用Python。
Python字符串是一个很神奇的东西,尤其是字符串格式化的部分。我们现在来看看。
首先,明确一点,Python中单引号、双引号引起来的都是字符串,两者并没有区别。与Java中不一样,Java中,单引号只能引起一个字符,双引号才是字符串。
注意,#在Python中表示注释的开始,类似于Java中的//。
字符串常用操作,现在假设names="developer":
判断字符串以什么开头,或以什么结尾
names.startswith("deve") # 返回True,和Java中的names.startsWith("deve")作用一样。
names.endswith("oper") # 返回True,和Java中的names.endsWith("deve")作用一样。
判断字符串是否全是字母、或数字、或空格
names.isalpha() # 判断names是否都是字母,此处返回True。
names.isdigit() # 判断names是否都是数字,此处返回False。
names.isspace() # 判断names是否都是空白符号(空格、制表符、回车换行符),此处返回False。
判断字符串是否全是大写、或小写
names.islower() # 判断是否全是小写字母。
names.isupper() # 判断是否全是大写字母。
字符串中查找字符串
names.find("e") # 查找e在names中第一次出现的位置,找不到返回-1。
find的函数会返回"e"在names中第一次出现的位置,那要查找最后一次出现的位置呢?用rfind()
names.rfind('e') # 从右边开始查找,查找e在names中最后一次出现的位置,找不到返回-1,类似于Java中的lastIndexOf()。
把列表中的每个元素用字符串连接起来
names.join(['1', '2']) # 返回"1developer2",列表中需要全部是str类型,否则出错。
把字符串转成小写、或大写
names.lower()
names.upper()
names.swapcase() # 如果现在names是大写,那么转成小写,反之亦然。
字符串特定字符替换成指定字符
names.replace(old, new[, count]) # 把names中的old字符串替换成new,最多替换count次。不支持正则表达式替换。其中,如果指定第三个参数count,则表示最多替换count次。
例如:
names.replace("er", "sir") # 返回"developsir",不支持正则表达式。要想使用正则表达式替换则应使用re.sub(pattern, repl, string[, count=0])
字符串分割
names.split() # 按照空白字符分割(换行符制表符空格都是空白字符),不支持正则表达式。
names.split("e") # 按照"e"分割,返回["d", "v", "lop", "r"]。
names.split("e", 1) # 按照e分割,最大分割次数为1,返回["d", "veloper"]。
names.rsplit([sep[, maxsplit]]) # 根据sep,从右边开始,分割names,最多分割maxsplit次。
例如:
names.rsplit("e", 1) # 返回["develop", "r"]。
去除字符串两端的字符
names.strip() # 去除names两边的字符,可以传参数,不传参数代表只去除两边的空白字符,返回去除后剩余的字符串。
names.lstrip() # 去除左边的特定字符,默认是空白符。
names.rstrip() # 去除右边的特定字符,默认是空白符。
names.strip("dre") # 返回"velop"。
按指定顺序,一个一个替换字符串中的字符
translate函数,例如:
from string import maketrans
names.translate(maketrans('ab', 'cd')) # 表示按照顺序,把names中的a替换c、b替换成d,返回替换后的字符串。
字符串格式化(重点):
类似于printf的格式化
Python中字符串的格式化可以使用百分号,例如:
"%s %d" % ("kzc",18) # 返回"kzc 18"。
使用关键字来格式化
"%(year)s, %(month)d" % {"year": "2017", "month": 12} # 返回"2017, 12"。
()函数格式化(重点中的重点):
使用位置参数来格式化
"{0},{1}".format("kzc",18) # 返回"kzc,18"。
注意,使用位置参数来格式化时, 字符串中大括号里的数字代表的是参数位置。如果参数使用dict,同时参数也是数字,则会有问题,例如:
mydict = {"5": "five"}
"{5}".format(**mydict) # IndexError: tuple index out of range,Python默认把format大括号中的数字当做索引来解析。
这个时候,就应该去掉这个索引,例如:
"{},{}".format("kzc",18) # 返回"kzc,18"。
使用关键字参数来格式化
"{name},{age}".format(age=18,name="kzc") # 返回"kzc,18"。
又例如:
people = {"name": "chen", "age": 18}
"{name},{age}".format(**people) # 返回"chen,18"。
使用列表参数来格式化
"{0[0]},{0[1]}".format(["kzc",18]) # 返回"kzc,18"。
指定格式化后的占位宽度
"{:>8}".format("189") # 返回" 189",表明输出需要占8个字符的宽度,不足8个字符的,用空白符补齐。
又例如:
"{:0>8}".format("189") # 返回"00000189",表明输出需要占8个字符的宽度,不足8个字符的,用0补齐。
格式化浮点数
"{:.2f}".forma) # 返回"321.33",其中".2f"表明小数位数保留2位。
指定输出数字的进制
"{:x}".format(17) # x表示按照16进制输出,此处返回"11"。
格式化数字,一般是比较大的数字,使用千分位
"{:,}".format(1234567890) # 返回"1,234,567,890"
更多文章
Python爬虫框架之Scrapy详解
Python爬虫框架Scrapy之爬取糗事百科大量段子数据
Python爬虫框架Scrapy架构和爬取糗事百科段子结果
Python网络爬虫requests、bs4爬取空姐网图片
Python网络爬虫:空姐网、糗百、xxx结果图与源码
Python爬虫源码地址: