专栏名称: 雷峰网
中国智能硬件第一媒体
目录
相关文章推荐
51好读  ›  专栏  ›  雷峰网

亚马逊外包平台的50万劳工:人工智能的背后,无尽数据集的建造

雷峰网  · 公众号  · 科技媒体  · 2016-12-20 12:40

正文

请到「今天看啥」查看全文



“我不像一些人那么拼命,我比较注重睡眠。”LaPlante说,”有些人会给自己的手机和电脑都设置提醒。如果一份工作在凌晨3点发布,他们也会起床干活。这份工作已经完全地控制了他们。“


而Turkers的平均收入大概是多少呢?这因人而异。来自印度的Adrien Jabbour说:“如果每天工作4 - 5个小时,那么2个月大概能赚到700美元。”Milland却说最近工作8个小时才能赚25美元,这还是好的时候。根据Pew Research的一份研究报告, 超过一半的Turkers的时薪都没有达到美国联邦最低7.25美元的标准。


上图是Milland的收入表。“Submitted”表示工作已经提交但是还是还没被确认。“Approved”表示已经支付过了。“Rejected”表示雇主对工作的结果不满,不会支付酬劳。


手工劳动者的等级制度


对那些在AMT上工作的人来说,他们不得不面对令人沮丧的现实:不是所有的Turkers都是平等的。


亚马逊的系统会给一些特定的人员评级:“大师级(Master's Level)”。当雇主发布劳务需求时,系统会自动将工作优先分给“大师级”的这类人。对于任务的发布者来说,成本更高,劳务者的收入也因此更高。而如果你没有这个等级,那么被分配到任务的机会将少很多。


Milland说,三月有一个工作日,在AMT上有4911个需求,但是她只有资格接触到其中的393个,只占其中的8%。那么,要怎样才能获得“大师”这个等级呢?没人知道。


Milland观察发现,有的人完成的任务不多,任务完成后的通过率也较低,但是他们也获得了“大师级”这个评级。“这个评级似乎没有任何逻辑可言”,她说。


除了大师这个评级,有时候你的居住地也会导致接到任务的机会变少。比如很多任务的发布者要求你必须在美国境内。据雷锋网了解,亚马逊一直不愿意公开他们的评级标准。


领取卑微的报酬


“Turker和Turker之间也不一样。”LaPlante说,“有些人是以此为生,而有些人只不过是想赚点零花钱。”


William Little是加拿大安大略省在线论坛TurkerNation的版主,他通过AMT赚些小钱。他的目标是每天花3个小时的时间挣15美元。他说大部分的时间能够达到这个目标。


不过,怎样拿到报酬对很多Turkers来说是一个大问题。


目前,只有美国和印度的Turkers可以拿到用现金支付的薪水。而其他的国家则只能通过亚马逊的礼品卡来获取报酬。


对于那些需要现金的人来说,也有变通的方法,不过这通常意味着收入要打点折扣。有些网站,比如purse.io可以把亚马逊的礼品卡兑换成比特币。


“有的人会将自己的愿望清单发布在purse.io上,你看到后,可以把他想要的买了后给她寄过去。”Little说,“而那些比特币暂时由第三方保管,当你收到物品之后,我就会收到比特币。”


然后就可以把通过PayPal把比特币卖掉换取现金,然后再转到自己的银行账号上。但是两次的交易过程中都会有损耗,因此不是很划算。


机器的奴隶


Milland和LaPlante只不过一支庞大的互联网劳工中不起眼的两个个案,但是他们在帮助训练机器智能方面的作用却越来越重要。


智能系统在日常应用中越来越普及,人工智能也在慢慢扩大应用范围。不管是语音控制的虚拟助手,比如亚马逊的Alexa和微软的Cortana,还是计算机视觉系统,比如特斯拉的Autopilot,背后都离不开人工智能的支撑。这些系统被训练去执行那些之前对计算机来说太复杂的任务:从理解语音命令到定位正在穿越马路的人。


训练人工智能系统完成这些棘手的任务需要大量的标记数据。这些被标记的数据可能需要辨别照片中是否有狗,或者句子中的“bass”是指男低音还是指鲈鱼。 这种通过实例来训练机器的方法称为监督式学习,那些被标记的数据通常就是由Turkers或者其他的在线劳动力完成的。


训练这些系统通常需要大量的数据,有的甚至需要几百万的实例训练才能达到高效执行任务的结果。现在,训练数据集的规模也越来越大。最近谷歌刚刚公布了开源的图像数据集(Open Image Datasets),其中包含了900万张图片,而视频数据集Youtube-8M中则包含了800万段被标记的视频。ImageNet,作为最早的图片数据集,目前已有超过1400万张被分类的图片。而这些大部分是由AMT上的50000名人力花费两年的时间完成的。


然而,因为数据集规模太过庞大,即使是分配给这么多人,每个人也需要成百上千次地重复同一种任务。这是一份非常消磨心智的工作。


冲向未来


通过做标记,删除重复的数据,填充空白等一系列任务,Turkers以及其他的在线工作者们将这些原本杂乱无章的数据整理成了可以用来训练机器学习系统的数据集。


随着人工智能变得无处不在,所有知名的科技公司都开始雇佣大量人力来完成这样细碎的任务以支撑机器学习。亚马逊、苹果、Facebook、谷歌、IBM、微软等等,要么有自己的劳务众包平台,要么会使用死三方的服务,其中两个最大平台的就是AMT以及CrowdFlower。


有的公司会通过内部的微型任务发布系统来完成大量的基础工作,比如微软的UHRS(Universal Human Relevance System),谷歌的EWOK。5年前,当UHRS发布的时候,主要是用来为微软的必应搜索(Bing)以及其他产品服务的。UHRS每个月需要统筹750万项任务。


据微软高级研究员Mary Gray描述,微软的UHRS和AMT非常相似。当需要众包的工作不在AMT覆盖的范围,或者任务内容比较敏感需要保密时,他们会选用UHRS。


微软剑桥研究实验室的主管Chris Bishop说,对比第三方平台AMT,UHRS让微软更具灵活性。微软会利用人工智能自动识别众包人群的优势和弱点,比如专业知识的水平,这反过来可以帮助微软判定哪个工人的结果更可靠。


除了帮助训练人工智能,像AMT这样平台还帮助eBay、Autodesk这样的知名公司,减轻了重复、枯燥乏味的工作负担。多年以来,它们一直是AMT上的大型雇主。


这种低技术水平、单调的劳动包含了各式各样的任务:比如筛选用户生产的图片和其他内容,完成市场和学术调查,删除重复的输入,检查在线零售商的产品说明和图片。 亚马逊最初创办AMT系统就是为了帮助其管理库存,将图片和产品分类,撰写网站描述,从邮件中提取人名,翻译文本,将语音或者图片转录成文本,检查拼写错误,验证地理位置,为网页设计提供反馈,对产品进行评论,选择视频的缩略图,以及让公司能够追踪你查看的是广告的哪一部分。


众包平台的历史和今天


人类帮助机器执行它们不胜任的工作并不是什么新鲜事。


近年人工智能产业的爆发,需要大量的人力来对数据进行分类和标记。Gray说,对这种细碎工作任务需求可以追溯至20年前,那时微软需要提高Microsoft Word的拼写和语法检查的能力。其实,这种点击式的互联网劳务更远可以追溯至90年代末和20世纪初互联网泡沫的年代。


2001年的时候,亚马逊希望寻求更高效的方式来管理商店里快速增长的产品数量,解决库存难题,然而这些都超出计算机的能力,为此亚马逊申请了人机混合系统的专利。4年之后,亚马逊正式发布了AMT数字数字平台,通过这个平台,亚马逊可以对接到巨大的在线人力资源。


亚马逊的这个平台吸引了很多公司,从在线零售商到色情网站希望利用AMT的廉价劳动力来对执行类似产品分类这样的细碎任务。2015年,平均每天有1278个雇主在AMT平台上发布任务。与此同时,平台上完成提交的工作量也在持续上涨。


虽然目前已经有50万人在AMT上注册,但是亚马逊公布的数据中并不包含其中全职人员和兼职人员的比例。


牛津互联网研究所(Oxford Internet Institute)的数据显示,AMT和CrowdFlower两大众包平台2013年的收入总额大约为1亿2千万美元。研究所的Vili Lehdonvirta教授估计,这两者占据了在线众包劳务市场大约5%到10%的份额。不过,由于非英语市场的数据难以统计,所以很难得到最终的确数。


不断点击的代价


这种”点击、点击、点击“的工作不仅沉闷,而且很可能对劳工们的造成身心的双重伤害。


“每天早上醒来,我就会忽略一切。”Milland说,“我的家人会为我准备食物,让我可以边工作边进食。我的手腕之前得过腱鞘囊肿,而且非常严重,我的胳膊也有重复性劳损。但,这就是工作。”


来自南印度的一名Turker,Manish Bhatia,是MTurk论坛的志愿版主。他接到过最奇怪的任务是:拍摄自己躺在撒满玫瑰花瓣的浴缸里的视频。而在标记图片时候,经常会看到一些令人不舒服的内容,因为事先并不知道图片内容,而且也不能中途退出,如果你不能完成任务的话就拿不到报酬。


Milland说自己也有类似的经历:“人们常羡慕在家工作的人,但是你不能告诉他们今天看了一天的ISIS的图片,到处都是人头。”而Little则说,他自己常常需要标记含有色情内容的图片或者视频。


但是当任务一旦完成之后,你不会知道是否会有人检查了你的工作成果,也不会知道你的工作成果最终被用来做了什么。因为 工作的发布者用的是假名,没人知道到底是谁在发布这些任务。此外,只有发布者能够评价Turker,Turker却不能为雇主打分。







请到「今天看啥」查看全文