文件处理
导包
添加镜像
语法
其中http
和https
是可选的
导入文件
excel
csv
EDA报告
dataframe导出excel文件
数据处理
数据筛选
分类均值展示
标签编码
交叉比例表
计算分布比例
多列apply函数
卡方检验
条件筛选
map函数分组
apply多列赋值
这是一个分布比例函数
特征工程
时间数据处理
SMOTE过抽样
输出缺失值
影响分析
xgb输出特征重要性
计算相关系数并画图
Pandas处理
常用操作
为dataframe添加1列
合并表格再排序
dataframe排序
选取指定行(以列的值筛选)
获取列名
修改列名
删除一列
列表转dataframe(嵌套列表)
类型转换
Dataframe到Series
Series到list
list 转 array
array 转 torch.Tensor
torch.Tensor 转 array
torch.Tensor 转 list
array 转 list
list 转 torch.Tensor
array或者list转Series
list转dataframe
array转dataframe
python需要注意的地方
变量
列表的复制:直接采用a=b的方式会指向同一个内存地址
全局变量:函数内部的变量,外部是无法访问的,在函数内部定义global 后函数运行过才可访问
循环
- continue: 跳出本次循环
- break: 跳出本层循环
运算
矩阵numpy乘法:
- 点乘: np.dot(xy)
- 数乘: np.mat(x,int)
随机数
画图
画图准备
解决中文符号显示问题
设置背景样式
绘图
这是一个画箱线图代码
画缺口饼图
画相关性系数图
画核密度估计
模型训练
导入模块
设置训练集
训练模型
模型评估
小工具
tqdm显示进度条
记录时间
jupyter操作
- Shift+上下键 # 按住Shift进行上下键操作可复选多个cell
- Shift-M # 合并所选cell或合并当前cell和下方的cell
- Ctrl + Shift + - # 从光标所在的位置拆分cell
原创作者:孤飞-博客园 原文链接:https://www.cnblogs.com/ranxi169/p/16838967.html
标签:
留言评论