专栏名称: 程序员大咖

为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源；提供最新最全的编程学习资料：PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。

scikit-learn机器学习初体验

程序员大咖 · 公众号 · 程序员 · 2018-04-06 10:24

正文

请到「今天看啥」查看全文

digits = datasets . load_digits ()

# 这里我们感兴趣的数据是不同灰度的 8x8 个小格子组成的图像

# 如果我们直接使用图像进行处理，就需要使用 pylab.imread 来加载图像数据，而且这些图像数据必须都是 8x8 的格式

# 对于这个 dataset 中的图像，dataset.target 给出了它们实际对应的数字

images_and_labels = list ( zip ( digits . images , digits . target ))

for index , ( image , label ) in enumerate ( images_and_labels [: 4 ]):

plt . subplot ( 2 , 4 , index + 1 )

plt . axis ( 'off' )

plt . imshow ( image , cmap = plt . cm . gray_r , interpolation = 'nearest' )

plt . title ( 'Training: %i' % label )

# 为了使用分类器，需要将每个表示手写图像的 8x8 数字转换为一个数字数组

# 这样 digits.images 就变为了(采样，采样特性)的一个矩阵

n_samples = len ( digits . images )

data = digits . images . reshape (( n_samples , - 1 ))

print ( digits . images [ 0 ])

print ( data [ 0 ])

# 创建一个分类器，这里 gamma 的值是给定的，可以通过 grid search 和 cross validation 等技术算出更好的值。

# 下面的链接有个例子是自己算 gamma：

# http://efavdb.com/machine-learning-with-wearable-sensors/

classifier = svm . SVC ( gamma = 0.001 )

# 用前半部分数据训练分类器

classifier . fit ( data [: n_samples / 2 ], digits . target [: n_samples / 2 ])

# 对后半部分数据使用训练好的分类器进行识别

expected = digits . target [

请到「今天看啥」查看全文

推荐文章

大淘宝技术 · 大模型微调知识与实践分享

11 小时前

码农翻身 · 坚决不招人，一个人创业写网站，功能简单，年入1400万美元！

18 小时前

码农翻身 · 投诉领导被光速开除，和烂人说再见啦~

昨天

稀土掘金技术社区 · 掘金 AI 编程社区- 人人都是 AI 编程家竞赛

4 天前

程序员技术 · 阿里员工爆料：程序员真的好单纯。别的行业都是闷声发大财，只有程序员，生怕别人不知道自己月薪五万，号召所有人来卷死自己。

2 天前

抢先电影院 · 李易峰杨洋劣迹斑斑，被央视春晚封杀？

8 年前

早安晚安心语 · 在爱情里，这些事情你不可不知！

8 年前

飞猪 · 旅行日历：保守主义

7 年前

厦大EMBA江浙沪教学中心 · 华为10年员工离职：人可以累，但不能停止思考

7 年前

云石 · “解放军在澳门杀人”的谣言果然是从这个国家传到香港的！

7 年前