专栏名称: 人人都是产品经理
产品经理不再是一个单纯的职位,而是一种思维方式,这种思维是所有互联网人必备的,做互联网的人不能不懂产品,关注产品,改变生活。
目录
相关文章推荐
人人都是产品经理  ·  985毕业后,他选择给AI“拧螺丝” ·  18 小时前  
三节课  ·  怎么我的AI,老是在帮倒忙? ·  2 天前  
低维 昂维  ·  高质量CuCrP2S6单晶 ·  2 天前  
低维 昂维  ·  高质量CuCrP2S6单晶 ·  2 天前  
51好读  ›  专栏  ›  人人都是产品经理

985毕业后,他选择给AI“拧螺丝”

人人都是产品经理  · 公众号  · 产品  · 2025-06-14 10:00

正文

请到「今天看啥」查看全文


但做过类似兼职的人在社交媒体抱怨:真的做不了太久,眼睛受不了。

在那个标记为11群的近200人大群内,不断地有人退出、加入,就像一条永不停歇的虚拟流水线。

苏打也在类似的一个微信群里。

前不久,她在招聘平台看到国内某个大厂发布的数据标注兼职岗位。专业不限、经验不限,唯一的门槛是学历——必须是985/211硕士及以上。

这份兼职是为大模型思考过程和输出结果进行打分。输出结果的正确与否、是否照顾到了用户的情绪、感受,以及思考过程是否符合逻辑且高效等等都需要纳入考量。

苏打通过筛选后,也被拉到了一个微信群。同样的,在正式接单之前,需要先进行培训和测试。

苏打收到了一份长达几十页的文件,详细介绍了各个打分维度和评判标准。根据这个打分体系,她需要先进行两到三轮的试标,达标后才可进行接单。通过测试后,在正式的标注过程中,也需保证正确率。如果正确率低于平均水平,便会失去标注资格,需要重新测试。

据苏打观察,她所在群里测试的通过率并不高。

“这份工作的难点是记忆、理解的成本特别高。在标注之前,你得先理解、记住他们的评价体系和打分标准。”更让苏打难受的是,这些标准并不是固定不变的。

有时候,面对相似的问题和回答,她用相同的思考方式去打分,结果却截然相反。

就像是写没有标准答案的一张张试卷,无法通过自我努力或学习提升正确率,只能原地不停得打转、消耗自己的脑力和体力,最后获得的报酬微乎其微。

苏打告诉我们,这份兼职也是按计件收费,标注一件的费用只有3-7元。

比苏打幸运一些,廖仔没有这些严苛的KPI和考核标准。

廖仔参与标注的是国内另外一家互联网大厂的外包项目。他领导着一个由10名标注师组成的小组。项目里,有好几个这样的组别,对该大厂的大模型进行评估、鉴定、指定标注规则。廖仔会对每天需要标注的任务进行分配,再告诉组员具体的规则和评判标准确保客观性。除数据标注之外,他还需跟算法团队、产品研发团队沟通,根据上下游反馈调整模型的评估和鉴定。

廖仔还是以咖啡机器人举例,如果要AI制作咖啡,那么就需告诉它整个链路,包括咖啡树如何种植、咖啡豆有哪些品类、分子结构如何、怎么研磨等等。通过每一步的数据标注,对它进行调校,然后再回归到模型,让它自主训练。

三种数据标注工作可以大致勾勒出这个职业背后的隐形分层:

  1. 自动售货机标注,考验“体力+注意力”,靠重复和熟练提升效率;

  2. 为大模型的思考过程和输出结果打分,要求较强的理解力和记忆力,像在答一道道没有标准答案的试卷;

  3. 大模型评估,则在标注之外承担流程管理和沟通工作,具备一定自主性。

常有人将数据标注比做AI流水线上的“螺丝钉”。

在廖仔看来,即便是拧螺丝钉,到他这一步,最起码清楚了用什么工具拧、怎么拧效率会更高。

尴尬的岗位:

重要,但是廉价

站在产业链更上游的Jackson,能从更为完整的流水线上审视数据标注的意义。

Jackson是海外一所名校研究生毕业,现在在上海一家科技企业从事基础模型训练工作。他告诉「定焦One」,模型训练主要包含三个部分:预训练、监督微调和强化学习。

预训练所需的数据量动辄十几TB,主要来源于公开爬虫数据、模型合成数据、第三方采购数据或企业自有数据。这一阶段对人工标注的依赖较少。

数据标注师主要介入的,是后两个阶段。

  1. 微调阶段(Supervised Fine-Tuning,简称SFT)目标是让预训练后的通用语言模型适应特定任务或对话场景,使其输出更符合人类期望。简而言之,就是输入特定数据后,教会模型“如何回答”。







请到「今天看啥」查看全文


推荐文章
人人都是产品经理  ·  985毕业后,他选择给AI“拧螺丝”
18 小时前
三节课  ·  怎么我的AI,老是在帮倒忙?
2 天前
低维 昂维  ·  高质量CuCrP2S6单晶
2 天前
低维 昂维  ·  高质量CuCrP2S6单晶
2 天前
食尚知味  ·  人生有尺,做人有度
8 年前
地新引力  ·  沪上豪宅制胜市场的两大法宝
8 年前