智东西 06-25
印度,成了全球机器人“数据工厂”:拍摄日常时薪4美元
index_new5.html
../../../zaker_core/zaker_tpl_static/wap/tpl_keji1.html

 

智东西

编译 | 陈佳

编辑 | 云鹏

智东西 6 月 25 日消息,据 CNBC 今日报道,印度正在迅速成为全球 AI 机器人的训练数据供应基地。在中美两国主导机器人研发的格局下,拥有全球第二大劳动力人口、劳动力成本相对低廉的印度找到了一个独特的切入口——为机器人公司提供大规模的人类操作视频数据。

不到一年时间,印度已涌现出一批专门为美国和中国客户录制第一人称视频、执行数据标注的企业。工人每天录制 3 到 4 小时的日常操作视频,时薪不到 4 美元(约合人民币 27 元)。

▲纳吉雷迪 · 斯里拉米亚钱德拉(Nagireddy Sriramyachandra)在金奈家中佩戴手机录制洗碗动作,用于机器人动作捕捉数据采集(图源:Getty Images)

但随着竞争者大量涌入,数据采集合同价格在短短几个月内已经腰斩,行业面临快速商品化的挑战。

多位业内人士告诉 CNBC,在整个 AI 技术栈中,数据层是印度 " 不仅能参与、而且能赢 " 的环节,但前提是印度企业能从单纯的数据采集者进化为数据转化者。

投行对人形机器人市场前景高度乐观。据巴克莱 1 月 14 日发布的研报,在最乐观情景下,全球人形机器人市场到 2035 年有望从目前的 20 亿至 30 亿美元增长至 2000 亿美元(约合人民币 1.36 万亿元)。摩根士丹利 2025 年 4 月 29 日发布的研报则预测,到 2050 年人形机器人市场规模将达到约 5 万亿美元(约合人民币 34 万亿元),届时全球投入使用的人形机器人数量将达到约 10 亿台。

一、南印度教师兼职当 " 机器人陪练 ",中美客户订单推动采集行业井喷

南印度一位私立学校教师坦妮莎 · 雷迪(Tanisha Reddy)正在兼职做机器人训练员。她说,自己每天录制第一人称视频——拍摄做饭、洗碗、打包午餐等日常操作,晚间再重复一遍,每天产出 3 到 4 小时的视频素材,每小时录制报酬不到 4 美元(约合人民币 27 元)。

" 我对这份工作十分满意。" 雷迪称,这项操作简单省力,不会占用她照顾两个孩子的时间。她已经为数据采集服务商 Qanat Consulting Services 工作超过四个月。

Qanat Consulting Services 位于印度安得拉邦。该公司创始人塔斯利姆 · 帕坦(Thaslim Pattan)告诉 CNBC,合同客户主要来自美国和中国,客户可能是机器人公司,也可能是其他中间商。

帕坦最近拿下了一份新合同,安排服装制造企业的工人在真实工厂环境中录制操作视频。她说,机器人在实验室里被开发出来,但需要在真实世界环境中接受训练。随着机器人市场预期快速增长,数据采集的需求正在飙升。

但帕坦也坦言了一个严峻的现实:尽管业务总量持续上涨,但行业竞争者不断增多,数据采集外包单价持续走低,短短数月内报价已腰斩。

业内专家告诉 CNBC,数据采集正在被商品化,印度企业需要向价值链上游移动才能保持竞争力。

二、摆脱 " 数据搬运工 " 角色,印度创业公司争夺数据资产价值

面对数据采集快速商品化的趋势,部分印度创业公司正尝试从单纯的 " 采集者 " 转型。

机器人数据创业公司 Neocambrian AI 位于北印度,今年 5 月在诺伊达(Noida)建立了一座机器人数据工厂,在模拟环境中采集训练数据。

该公司创始人阿比纳夫 · 库克雷贾(Abhinav Kukreja)告诉 CNBC,他还建立了一个覆盖 100 多家工厂的网络,让工人在真实工作场景中录制操作视频。

库克雷贾说,公司的重点是创建 " 解决灵巧性问题 " 的数据集,教机器人 " 如何操控物体 "。他举了一个例子:机器人需要理解握鸡蛋和握水瓶所需的力度差异,每一组新数据都能帮助机器人提升物体操控能力。他称,要达到人类水平的灵巧度,需要 1 亿小时的视频数据。

与多数同行不同,Neocambrian AI 的核心策略是自主拥有数据,而非按客户需求定制采集。

库克雷贾解释:" 我们不会主动询问客户需求,而是向客户交付公司提前搭建完成的标准化数据集。"

库克雷贾称:" 在 AI 全产业链中,只有数据采集环节,印度不仅能参与竞争,更有机会占据优势。" 自 AI 诞生以来,人力标注数据就具备极高价值,印度有望复刻信息技术行业的发展路径,成为 " 全球人力数据供给市场 "。

业内专家指出,机器人和智能手机类似,分为硬件与操作系统两大板块。印度机器人硬件制造产业仍有很长发展之路,但在机器人操作系统研发领域具备发展机遇。

印度另一家 AI 数据创业公司 Humyn Labs 主攻数据转化业务,搭建覆盖多元场景的混合数据集。该公司声称可规模化提供经过核验的人工标注数据,其素材来源中拉美占 50%、印度本土占 35%、亚洲其他地区占 15%。

Humyn Labs 联合创始人马尼什 · 阿加瓦尔(Manish Agarwal)告诉 CNBC,公司的核心在于数据转化和拥有数据所有权,而不仅仅是采集。

结语:数据采集终将饱和,印度需从采集者进化为数据转化者

从整体格局看,印度在全球 AI 机器人产业中的角色正在经历一轮快速但可能短暂的红利期。中美两国主导机器人研发和制造,印度凭借人口规模和劳动力成本优势承接了训练数据采集这一环节。但合同价格在几个月内腰斩的事实已经发出了明确信号,纯粹的数据采集正在走向低价竞争。

正如阿加瓦尔所说,视频训练机器人行业尚处早期阶段,但数据采集市场终会趋于饱和,印度若想持续保有行业优势,必须完成转型:从单纯的数据采集方升级为数据加工转化方。

来源:CNBC

宙世代

宙世代

ZAKER旗下Web3.0元宇宙平台

一起剪

一起剪

ZAKER旗下免费视频剪辑工具

相关标签

机器人 雷迪 印度 美国
相关文章
评论
没有更多评论了
取消

登录后才可以发布评论哦

打开小程序可以发布评论哦

12 我来说两句…
打开 ZAKER 参与讨论