当前位置: 首页 > news >正文

pandas——字符串处理【建议收藏】

pandas——字符串处理

作者:AOAIYI
创作不易,如果觉得文章不错或能帮助到你学习,记得点赞收藏评论一下哦


文章目录

  • pandas——字符串处理
  • 一、实验目的
  • 二、实验原理
  • 三、实验环境
  • 四、实验内容
  • 五、实验步骤
    • 1.cat() 拼接字符串
    • 2.split()切片字符串
    • 3.get() 获取指定位置的字符串
    • 4.contains() 是否包含表达式,返回True或False。
    • 5.replace() 字符串替换
    • 6.slice() 按字符串下标的开始结束位置切割字符串。
    • 7.count() 计算给定单词出现的次数
    • 8.len() 计算字符串的长度
    • 9.strip()去除前后的空白字符
    • 10.lower() 全部小写
    • 11.upper() 全部大写
    • 12.index() 查找给定字符串的位置
    • 13.capitalize() 首字符大写
    • 14.swapcase()大小写互换
    • 15.islower()至少包含一个小写字符, 且不包含大写字符。
    • 16.isupper()至少包含一个大写字符, 且不包含小写字符。
  • 总结


一、实验目的

熟练掌握pandas中字符串操作

二、实验原理

在使用pandas框架的DataFrame的过程中,如果需要处理一些字符串的特性,例如判断某列是否包含一些关键字,某列的字符长度是否小于3等等这种需求,如果掌握str列内置的方法,处理起来会方便很多。
在这里插入图片描述

三、实验环境

Python 3.6.1以上

Jupyter

四、实验内容

下面我们来详细了解一下,Series类或DataFrame的字符串String自带的方法有哪些。

五、实验步骤

1.cat() 拼接字符串

import pandas as pd  
pd.Series(['a', 'b', 'c']).str.cat(['A', 'B', 'C'], sep=',')

在这里插入图片描述

pd.Series(['a','b','c']).str.cat(sep=',')  

在这里插入图片描述

2.split()切片字符串

import numpy as np  
s=pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])  
print(s)  
s.str.split('_')  
s.str.split('_',-1)  
s.str.split('_',1) 

在这里插入图片描述

3.get() 获取指定位置的字符串

import numpy as np  
s=pd.Series(['a_b_c', 'c_d_e', np.nan, 'f_g_h'])  
s.str.get(0)  
s.str.get(1)  
s.str.get(2) 

在这里插入图片描述

4.contains() 是否包含表达式,返回True或False。

s.str.contains('d')

在这里插入图片描述

5.replace() 字符串替换

s.str.replace("_", ".")  

在这里插入图片描述

6.slice() 按字符串下标的开始结束位置切割字符串。

s.str.slice(1,3)  

在这里插入图片描述

7.count() 计算给定单词出现的次数

s.str.count("a")  

在这里插入图片描述

8.len() 计算字符串的长度

s.str.len()

在这里插入图片描述

9.strip()去除前后的空白字符

idx = pd.Series([' jack', 'jill   ', '  jesse  ', 'frank'])  
print(idx)  
idx.str.strip()  

在这里插入图片描述

10.lower() 全部小写

s.str.lower()

在这里插入图片描述

11.upper() 全部大写

s.str.upper()

在这里插入图片描述

12.index() 查找给定字符串的位置

注意,如果不存在这个字符串,那么会报错!

s.str.index('_')

在这里插入图片描述

13.capitalize() 首字符大写

s.str.capitalize()

在这里插入图片描述

14.swapcase()大小写互换

s.str.swapcase()

在这里插入图片描述

15.islower()至少包含一个小写字符, 且不包含大写字符。

s.str.islower()

在这里插入图片描述

16.isupper()至少包含一个大写字符, 且不包含小写字符。

s.str.isupper()

在这里插入图片描述


总结

为什么纸上谈兵不行?纸上谈兵太理想化了,把自己没有发现的问题隐藏了,当成了不存在的问题。只有实际多多亲自动手,才会发现有太多的问题是书上没提到的,也是自己没想到的。才会发现,一个小小的问题也要搞上半天。当然,如果你基础巩固的话,那这些问题应该都是可以被你解决的。熟练后,就不认为这些问题了。
不要看代码不难就感觉会了,只有自己的手打一遍,没有错误,编程的严谨些决定了,你错一个字母都不行。所以大家一定要注意,编程是自己打出来的,不是复制,粘贴你就会了,以后碰到了,还是不会。

相关文章:

  • 机器学习基础总结
  • 前端高频面试题—JavaScript篇(二)
  • MongoDB--》MongoDB数据库以及可视化工具的安装与使用—保姆级教程
  • IC封装常见形式
  • 制作自己的ChatGPT
  • 数据结构与算法这么难,为什么我们还要学习?
  • 1.2(完结)C语言进阶易忘点速记
  • 大数据之Hadoop
  • spark数据清洗练习
  • ChatGPT 这个风口,普通人怎么抓住:比如APP集成ChatGPT,公众号集成ChatGPT...
  • 谷粒商城-品牌管理-JSR303数据校验
  • Lesson 6.5 机器学习调参基础理论与网格搜索
  • Servlet实现表白墙
  • java高频面试题(2023最新)
  • chatGPT接入个人微信教程(国内可用)
  • splay
  • 这是从零在独自开开发,将是副业赚钱最好的平台!
  • 基于 oss 框架的音频驱动
  • 基于matlab使用机器学习和深度学习进行雷达目标分类
  • LeetCode - 1109 - 航班预定统计
  • 解除近70家煤电厂有毒物质排放限制,特朗普能重振煤炭吗?
  • 市民建议公交广播增加“请勿大声喧哗”提示,上海交通委回复
  • 江苏银行去年净赚超318亿增超10%,不良贷款率持平
  • 上海地铁5G信号全覆盖后网速如何?记者亲测有这些发现
  • 习近平会见柬埔寨太后莫尼列
  • 云南双江迎傣历新年,游客和当地民众一起泼水送祝福