数学
小结数学学习过程中总结的文档
之前整理了一套文档生成、托管和发布流程,使用Sphinx
完成工程文档的生成,使用Github
完成文档的托管,使用Readthedocs
完成文档的发布
在实践过程中发现整个流程都有或大或小的不足,尤其是Sphinx
工具,最近学习了另外一个文档生成工具MkDocs
,更加符合个人的需求
Iris
数据集包含3
个类别4
个属性,共150
个实例
德国信用卡数据(German Credit Data
)提供了一个二分类数据集,下载地址 - statlog/german
对于分类问题,最开始想到的评判标准就是检测准确率(accuracy
),即样本检测类别和实际一致的数量占整个样本集的比率。进一步研究发现,还可以用更精细的标准来比较检测性能,学习步骤如下:
TP/FP/TN/FN
TPR/FPR/FDR/PPV/ACC
ROC/AUC
学习了PyTorch
环境下的Tensorboard
使用 - [PyTorch]Tensorboard可视化实现。PyTorch
也提供了Tensorboard
学习教程 - Visualizing Models, Data, and Training with TensorBoard
下面结合一个完整的训练过程,通过Tensorboard
实现可视化
最新版本的PyTorch 1.3
内置支持了Tensorboard,实现模型、数据以及训练可视化
之前识别测试最常用的是手写数字数据集MNIST,今天遇到一个新的基准数据集 - Fashion-MNIST
PyTorch通过TorchVision工具包提供统一的数据加载、数据处理的接口,允许自定义类的方式加载数据集,通过DataLoader接口来批量处理
相关实现:zjykzj/vocdev
PASCAL VOC 2007
数据集基于4
个大类别,共包含了20
个目标类:
Person: person
Animal: bird, cat, cow(奶牛), dog, horse, sheep(绵羊)
Vehicle(交通工具): aeroplane(飞机), bicycle, boat(小船), bus(公共汽车), car(轿车), motorbike(摩托车), train(火车)
Indoor(室内): bottle(瓶子), chair(椅子), dining table(餐桌), potted plant(盆栽植物), sofa, tv/monitor(电视/显示器)
PASCAL VOC 2007
数据集主要用于分类/测试任务,同时也提供了分割和人体部件检测的数据。示例如下: