当前位置: 首页 > news >正文

Python常用函数笔记汇总2

1.分组汇总groupby
在这里插入图片描述
2.计算空值

# py计算空值
data.isnull().sum(axis=0)
data.notnull().sum(axis=0)

# py去重计数
data_op['id_num_op'].value_counts().size
data_op['id_num_op'].size

在这里插入图片描述
3.保留两位小数

# predict_proba保留两位小数
gnb = GaussianNB()
pre = gnb.fit(X_train,y_train).predict(X_test)

model = gnb.fit(X_train,y_train)
pro = model.predict_proba(X_test)
pd.DataFrame(pro).applymap(lambda x:np.round(x,2))      #概率值保留两位小数

4.数据表随机取数

np.random.seed(123)
data_1 = data.take(np.random.permutation(len(data))[:100])

5.pickle文件的保存、加载与使用

import pickle as pickle
# 保存
model_file = open(r'clf.model', 'wb')
pickle.dump(clf, model_file)
model_file.close()
# 加载
model_load_file = open(r'clf.model', 'rb')
model_load = pickle.load(model_load_file)
model_load_file.close()
# 预测
test_est_load = model_load.predict(test_data)
pd.crosstab(test_est_load,test_est)

问题:python在线pip无法安装package,如执行pip install jieba,显示红色错误:read time out

原因分析:连接服务器,网速慢,文件大,导致下载连接超时,无法完成下载。

添加参数:–default-timeout=100,执行命令为:pip --default-timeout=100 install jieba
或者 pip --default-timeout=1000 install jieba

6.时间的表达:datetime和timedelta

  • 基本上常用的类: datetime和timedelta两个。

  • 参数可以是days ,hours ,minutes ,seconds ,microseconds,如果是负数就是向前多少时间

    datetime可以查看:天数(day),小时数(hour),星期几(weekday())等
    timedelta可以查看:天数(days),秒数 (seconds)等

  • 每个类都有一些方法和属性可以查看具体的值.

# 天数
import datetime
d1 = datetime.datetime(2009, 3, 23)
d2 = datetime.datetime(2009, 10, 7)
dayCount = (d2 - d1).days
print(dayCount)

# 秒数
import datetime
starttime = datetime.datetime.now()
endtime = datetime.datetime.now()
res = (endtime - starttime).seconds
print(res)

# 时间相加
d1 = datetime.datetime.now()
d3 = d1 + datetime.timedelta(days=10)
print (d3.ctime())

在这里插入图片描述
7.dict_to_dataframe

import pandas as pd
data = {'a': 3000, 'b': 2000, 'a': 3000, 'c': 6000, 'd': 5000}
pd.DataFrame.from_dict(data,orient='index')     #默认去重
pd.DataFrame.from_dict(data,orient='index').T

在这里插入图片描述

8.类别转换数值

# 如用1来表示“好的”、“优质”,用-1来表示“坏的”、“差的”
data[data == u'好的'] = 1
data[data == u'优质'] = 1
data[data != 1] = -1
data2 = data.as_matrix().astype(int)

9.查看第三方包的版本

a.命令行直接输入pip list 或 conda list

b.运用pandas查看包的版本

import pandas as pd
pd.show_versions()

c.导入第三方包,利用包的内置方法__version__查看

import numpy as np
np.__version__

相关文章:

  • AI小组2022总结
  • 【jrebel and xrebel问题记录】激活时出现LS client not configued
  • css中动画之transition
  • QT学习 控件(一):按钮类
  • 数据治理:企业数据治理蓝图
  • Socket套接字(网络编程万字总结-附代码)
  • 6、GPIO输入按键检测(轮询检测)
  • C# XPath的概念
  • redhat9安装卸载mysql
  • 个人博客系统(前后端分离)
  • 商品分类管理系统实现(Vue + ElementUI)
  • ReactJS入门之Model层
  • 一文解析Linux中断子系统softirq和tasklet
  • Arduino与Proteus仿真实例-雷达扫描仿真
  • Redis高可用之集群架构(第三部分)
  • 京东零售大数据云原生架构实践
  • 铝合金表面处理废水除铝工艺
  • Ansible剧本使用
  • 【JavaScript】基于SPA的单页面路由
  • Java基础:Lambda表达式方法引用
  • 央行回应美债波动:单一市场、单一资产变动对我国外储影响总体有限
  • 民航局:中方航空公司一季度运输国际旅客同比大增34%
  • 六部门:进一步优化离境退税政策扩大入境消费
  • 涨价应对关税变化是短期之策,跨境电商塑造新品牌开辟“新蓝海”
  • 特朗普承认“24小时结束俄乌冲突”是玩笑:大家都知道
  • 如何做大中国拳击产业的蛋糕?这项赛事给出办赛新思考