专栏名称: 程序员大咖
为程序员提供最优质的博文、最精彩的讨论、最实用的开发资源;提供最新最全的编程学习资料:PHP、Objective-C、Java、Swift、C/C++函数库、.NET Framework类库、J2SE API等等。并不定期奉送各种福利。
目录
相关文章推荐
大淘宝技术  ·  大模型微调知识与实践分享 ·  11 小时前  
码农翻身  ·  投诉领导被光速开除,和烂人说再见啦~ ·  昨天  
稀土掘金技术社区  ·  掘金 AI 编程社区- 人人都是 AI 编程家竞赛 ·  4 天前  
51好读  ›  专栏  ›  程序员大咖

scikit-learn机器学习初体验

程序员大咖  · 公众号  · 程序员  · 2018-04-06 10:24

正文

请到「今天看啥」查看全文


  • digits = datasets . load_digits ()

  • # 这里我们感兴趣的数据是不同灰度的 8x8 个小格子组成的图像

  • # 如果我们直接使用图像进行处理,就需要使用 pylab.imread 来加载图像数据,而且这些图像数据必须都是 8x8 的格式

  • # 对于这个 dataset 中的图像,dataset.target 给出了它们实际对应的数字

  • images_and_labels = list ( zip ( digits . images , digits . target ))

  • for index , ( image , label ) in enumerate ( images_and_labels [: 4 ]):

  • plt . subplot ( 2 , 4 , index + 1 )

  • plt . axis ( 'off' )

  • plt . imshow ( image , cmap = plt . cm . gray_r , interpolation = 'nearest' )

  • plt . title ( 'Training: %i' % label )

  • # 为了使用分类器,需要将每个表示手写图像的 8x8 数字转换为一个数字数组

  • # 这样 digits.images 就变为了(采样,采样特性)的一个矩阵

  • n_samples = len ( digits . images )

  • data = digits . images . reshape (( n_samples , - 1 ))

  • print ( digits . images [ 0 ])

  • print ( data [ 0 ])

  • # 创建一个分类器,这里 gamma 的值是给定的,可以通过 grid search 和 cross validation 等技术算出更好的值。

  • # 下面的链接有个例子是自己算 gamma:

  • # http://efavdb.com/machine-learning-with-wearable-sensors/

  • classifier = svm . SVC ( gamma = 0.001 )

  • # 用前半部分数据训练分类器

  • classifier . fit ( data [: n_samples / 2 ], digits . target [: n_samples / 2 ])

  • # 对后半部分数据使用训练好的分类器进行识别

  • expected = digits . target [







  • 请到「今天看啥」查看全文