NumPy 字符串函数
字符串函数(String processing function)也叫字符串处理函数,指的是编程语言中用来进行字符串处理的函数,如C,pascal,Visual以及LotusScript中进行字符串拷贝,计算长度,字符查找等的函数。
NumPy 字符串函数用于对 dtype 为 numpy.string_ 或 numpy.unicode_ 的数组执行向量化字符串操作。 它们基于 Python 内置库中的标准字符串函数。
这些函数在字符数组类(numpy.char)中定义。
| 序号 | 函数及描述 |
|---|---|
| 1. | add() 返回两个str或Unicode数组的逐个字符串连接 |
| 2. | multiply() 返回按元素多重连接后的字符串 |
| 3. | center() 返回给定字符串的副本,其中元素位于特定字符串的中央 |
| 4. | capitalize() 返回给定字符串的副本,其中只有第一个字符串大写 |
| 5. | title() 返回字符串或 Unicode 的按元素标题转换版本 |
| 6. | lower() 返回一个数组,其元素转换为小写 |
| 7. | upper() 返回一个数组,其元素转换为大写 |
| 8. | split() 返回字符串中的单词列表,并使用分隔符来分割 |
| 9. | splitlines() 返回元素中的行列表,以换行符分割 |
| 10. | strip() 返回数组副本,其中元素移除了开头或者结尾处的特定字符 |
| 11. | join() 返回一个字符串,它是序列中字符串的连接 |
| 12. | replace() 返回字符串的副本,其中所有子字符串的出现位置都被新字符串取代 |
| 13. | decode() 按元素调用str.decode |
| 14. | encode() 按元素调用str.encode |
numpy.char.add()
numpy.char.add() 函数依次对两个数组的元素进行字符串连接。
import numpy as np
# 连接两个字符串
print(np.char.add(['hello'], [' xyz'])) # ['hello xyz']
print(np.char.add(['hello', 'hi'], [' abc', ' xyz'])) # ['hello abc' 'hi xyz']
numpy.char.multiply()
numpy.char.multiply() 函数执行多重连接。
import numpy as np
print(np.char.multiply('numpy ', 3)) # numpy numpy numpy
numpy.char.center()
np.char.center(str , width,fillchar) 函数返回所需宽度的数组,以便输入字符串位于中心,并使用 fillchar 在左侧和右侧进行填充
import numpy as np
# np.char.center(str , width,fillchar) :
# str: 字符串,width: 长度,fillchar: 填充字符
print(np.char.center('numpy', 20, fillchar='*')) # *******numpy********
numpy.char.capitalize()
numpy.char.capitalize() 函数将字符串的第一个字母转换为大写
import numpy as np
print(np.char.capitalize('hello')) # Hello
numpy.char.title()
numpy.char.title() 函数将字符串的每个单词的第一个字母转换为大写:
import numpy as np
print(np.char.title('i like python')) # I Like Python
numpy.char.lower()
numpy.char.lower() 函数对数组的每个元素转换为小写。它对每个元素调用 str.lower。
import numpy as np
# 操作数组
print(np.char.lower(['NUMPY', 'GOOGLE'])) # ['numpy' 'google']
# 操作字符串
print(np.char.lower('HELLO')) # hello
numpy.char.upper()
numpy.char.upper() 函数对数组的每个元素转换为大写。它对每个元素调用 str.upper。
import numpy as np
# 操作数组
print(np.char.upper(['numpy', 'google'])) # ['NUMPY' 'GOOGLE']
# 操作字符串
print(np.char.upper('hello')) # HELLO
numpy.char.split()
numpy.char.split() 通过指定分隔符对字符串进行分割,并返回数组。默认情况下,分隔符为空格。
import numpy as np
# 分隔符默认为空格
print(np.char.split('i like python')) # ['i', 'like', 'python']
# 分隔符为 .
print(np.char.split('www.yuqingqi.com', sep='.')) # ['www', 'yuqingqi', 'com']
numpy.char.splitlines()
numpy.char.splitlines() 函数以换行符作为分隔符来分割字符串,并返回数组。\n,\r,\r\n 都可用作换行符。
import numpy as np
# 换行符 \n
print(np.char.splitlines('i\nlike python')) # ['i', 'like python']
print(np.char.splitlines('i\rlike python')) # ['i', 'like python']
numpy.char.strip()
numpy.char.strip() 函数用于移除开头或结尾处的特定字符。
import numpy as np
# 移除字符串头尾的 a 字符
print(np.char.strip('ilike pythoni', 'i')) # like python
# 移除数组元素头尾的 a 字符
print(np.char.strip(['apython', 'admin', 'java'], 'a')) # ['python' 'dmin' 'jav']
numpy.char.join()
numpy.char.join() 函数通过指定分隔符来连接数组中的元素或字符串
import numpy as np
# 操作字符串
print(np.char.join(':', 'python')) # p:y:t:h:o:n
# 指定多个分隔符操作数组元素
print(np.char.join([':', '-'], ['numpy', 'google'])) # ['n:u:m:p:y' 'g-o-o-g-l-e']
numpy.char.replace()
numpy.char.replace() 函数使用新字符串替换字符串中的所有子字符串。
import numpy as np
print(np.char.replace('i like pythnn', 'nn', 'on')) # i like python
numpy.char.encode()
numpy.char.encode() 函数对数组中的每个元素调用 str.encode 函数。 默认编码是 utf-8,可以使用标准 Python 库中的编解码器。
import numpy as np
a = np.char.encode('python', 'cp500')
print(a) # b'\x97\xa8\xa3\x88\x96\x95'
numpy.char.decode()
numpy.char.decode() 函数对编码的元素进行 str.decode() 解码。
import numpy as np
a = np.char.encode('python', 'cp500')
print(a) # b'\x97\xa8\xa3\x88\x96\x95'
print(np.char.decode(a, 'cp500')) # python

相关推荐
深度学习 -- 损失函数
深度残差网络(Deep Residual Networks (ResNets))
深度学习 -- 激活函数
神经网络训练 -- 调整学习速率
生成对抗网络(GAN)改进与发展
生成对抗网络(GAN)优点与缺点
生成对抗网络(GAN)的训练
生成对抗网络(GAN)基本原理
生成模型与判别模型