07月18日,星期二 05:00
火讯财经讯,据甲子光年报道,数据标注圈正在面临行业内卷和被AI取代的风险。一方面,数据直标注需求激增导致大量标注工人和中间商一同涌入,单价更低了。从业者表示,在2022年疫情期间,每天拉框(用方框框定选定对象)6小时,每月可以获得有4~5千元的收入。现在随着整个行业陷入内卷,每月收入只有2~3千元。另一方面,数据标注员训练的AI,正在人类监督中自我学习,进行自标注。在苏黎世大学的调查报告中,研究人员通过实测发现,ChatGPT在15项标注任务中的处理能力高于众包人员。大模型嵌入众包平台的进度条也被拉快了。洛桑联邦理工学院之后的研究发现,已有超过30%的众包标注者在处理文本标注时使用了大模型。