专栏名称: AI前线
我们专注大数据和机器学习,关注前沿技术和业界实践。每天发布高质量文章,技术案例等原创干货源源不断。同时有四千人的社群微课堂,每周一次业界大牛技术分享,也希望你能从这里分享前沿技术,交流深度思考。
目录
相关文章推荐
数据派THU  ·  ICML 2025 | ... ·  昨天  
数据派THU  ·  npj Digital ... ·  15 小时前  
艺恩数据  ·  【艺恩报告】衣物洗护市场消费趋势报告 ·  昨天  
51好读  ›  专栏  ›  AI前线

十年云计算老兵零基础进军深度学习的方法论

AI前线  · 公众号  · 大数据  · 2017-10-16 18:00

正文

请到「今天看啥」查看全文


-- 下图是 01 样本图片 --

我做测试的图片是官方教程提供了个白底红字的“2”.

-- 下图是 02 测试图片 --

制作数据集

首先我们要做一个图片识别的数据集,数据集文件放在“/data/train_small”目录下,图片的类型选择“Grayscale”,大小选 28x28,其他都选默认,然后选择创建数据集“minidata”。

-- 下图是 03 初始数据集 --

下面是数据集创建的过程,因为我们的文件很小很少,所以速度很快;如果是几千万张高清大图速度就会很慢,甚至要搭建分布式系统把 IO 分散到多台机器上。

-- 下图是 04 初始数据集中 --

这是创建完成数据集的柱形统计图,鼠标恰好停在第二个柱形上,显示当前标记为“9”的图片有 466 个。

-- 下图是 05 创建完成数据集 --

开始创建模型

有了数据集以后我们就可以创建模型了,我们选择创建一个图像分类模型(Image Classification Model),数据集选之前创建的“minidata”,训练圈数输 30 次,其他选项暂时保持默认。

-- 下图是 06 新建模型 --

到了创建模型的下半段是选择网络构型,我们选择 LeNet 即可,将模型命名为 TestA。

-- 下图是 07 选择 LeNet --

这次 Demo 我们没做细节设置,但生产环境可能要经常修改配置文件。

-- 下图是 08 微调 LeNet --

接下来就开始生成模型了,小数据集简单任务的速度还是很快的,而且验证正确率很高。但是如果是大任务大模型,可能会算上几天时间。

-- 下图是 09 开始生成模型 --

模型生成完成,我们再看一下验证正确率很高了,如果生产环境正确率太低,可能你要微调创建模型的参数。







请到「今天看啥」查看全文