正文
2015 年的 9 月 29 日,中国气象数据网正式上线对外服务,该站将成为中国气象局对社会开放基本气象数据和产品的共享门户。
当深度学习遇到气象创业
彩云天气是第一个受益于此的民间组织。
2014 年 4 月,当气象爱好者、工程师袁行远将自己开发的天气 App 彩云天气 提交在 App Store 后,很快拿到了苹果商店新品推荐的第一名。2014 年的六月份北京一共下了十场雨,彩云天气将每一场雨都精确预测到了。气象从业者大喊「狼来了」,然后意识到,商业气象这件事是可行的。
2014 年 9 月,中国气象局主动找到彩云天气开始合作,后者成为第一个受惠于官方气象数据的民营组织。
传统的天气预报方式,通常是分析雷达卫星收集的图片,然后人工总结规律与经验,从而进行天气预测。小时候我们等着看的《新闻联播》之后的天气预报环节的数据就是这样得出的。
「
局部
天气有阵雨」——没有人说的清楚哪里是局部,阵雨是多大雨。
如何把预报做的更精确——从城市精确到地点,从天精确到分钟,从区域精确到经纬度?传统的解决方案是写规则。假设风往西边吹,那么人为推测出雨也可能往西边移动。很明显,这个规则不仅不符合潮流,而且精确程度十分有限。
袁行远的解决方案是利用计算机和图像识别技术的完成更精确的算法。把雷达探测到的图像交给计算机,让计算机判断判断云的移动和走势,它会计算出云层一定的位置和速度,根据这个结果人就能判断什么时候雨会到达。
这也是深度学习发挥作用之处。计算机能看比人更多的图,这个「多」是成千上万倍。对于降雨而言,把所有天气信息和天气的雷达图分成两类,一类是会导致下雨的图,另一类是不会导致下雨的图。
处理了足够的图片与数据之后,计算机就能计算出,一类天气情况下雨的概率是多少,另一类概率是多少。所谓深度学习,就是计算机不再需要人告诉它第一步、第二步该怎么做,告诉它问题与答案,它就能够自己写程序,实现中间的过程。
技术变革给天气预测带来显著效果,结合图像识别与机器学习之后,预测天气的精确概率相比人工操作提高了 20%。
这样做的前提是有足够数据来源。彩云天气目前的主要数据来自中国气象局官方以及日本、美国气象卫星的部分开放数据:天上的卫星,空间的探空气球,高山上的气象雷达,地面上的探测站都是气象数据的来源。除此以外,彩云天气的用户也可以实时在 app 里反馈数据,更新到其数据系统当中。