ML_BrainWave代码初读
pandas
用处:Pandas 的主要数据结构是 Series (一维数据)与 DataFrame(二维数据),这两种数据结构足以处理金融、统计、社会科学、工程等领域里的大多数典型用例。

1 | # 读取数据 |
shuffle()
方法将序列的所有元素随机排序。

1 | # 意思应该是训练时完全随机 |
dwt
在数字图像处理中,需要将连续的小波及其小波变换离散化。一般计算机实现中使用二进制离散处理,将经过这种离散化的小波及其相应的小波变换成为离散小波变换(简称DWT)。实际上,离散小波变换是对连续小波变换的尺度、位移按照2的幂次进行离散化得到的,所以也称之为二进制小波变换。
虽然经典的傅里叶变换可以反映出信号的整体内涵,但表现形式往往不够直观,并且噪声会使得信号频谱复杂化。在信号处理领域一直都是使用一族带通滤波器将信号分解为不同频率分量,即将信号f(x)送到带通滤波器族Hi(x)中。
1 | # 小波变换 |
模型封装
转化为paddle的model
1 | model = paddle.Model(model_res) |
定义优化器
优化器:在深度学习反向传播过程中,指引损失函数(目标函数)的各个参数往正确的方向更新合适的大小,使得更新后的各个参数让损失函数(目标函数)值不断逼近全局最小。
1 | # 定义优化器 |
Cosine learning rate decay
学习率不断衰减是一个提高精度的好方法。其中有step decay和cosine decay等,前者是随着epoch增大学习率不断减去一个小的数,后者是让学习率随着训练过程曲线下降。
warmup step decay
复习?
Adam
1 | optim = paddle.optimizer.Adam(learning_rate=scheduler, parameters=model.parameters()) |
Adam优化器能够利用梯度的一阶矩估计和二阶矩估计动态调整每个参数的学习率。
VisualDL
1 | callback = paddle.callbacks.VisualDL(log_dir='visualdl_log_dir_alexdwt') |
VisualDL
是一个visualdl( 飞桨可视化分析工具 )的回调类。该类将训练过程中的损失值和评价指标储存至日志文件中后,启动面板即可查看可视化结果。
训练
(不太清楚细节)
1 | pre_list = [] |
预测并生成文件
1 | img_test = pd.DataFrame(labeled_img_list) |
Pandas 数据结构 - DataFrame
DataFrame 是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型值)。DataFrame 既有行索引也有列索引,它可以被看做由 Series 组成的字典(共同用一个索引)。