拓展器材综合服务商
Alexandr Wang创办的Scale AI是一个为AI模型提供训练数据的数据标注平台,近期完成新一轮10亿美元融资,估值飙升至138亿美元。该公司表示将利用新资金生产丰富的前沿数据,为通向AGI铺平道路。
Scale AI为想要训练机器学习模型的企业来提供数据标注服务,已从亚马逊和Meta等众多知名机构和企业投资者那里筹集了10亿美元的F轮融资。
本轮融资由Accel领投,它之前还领投了Scale AI的A轮融资,并参与了后续的风险投资。
这轮融资让Scale AI的身价飙升。尽管去年年初裁员20%,但公司目前估值已达到了138亿美元。
除了亚马逊和Meta之外,Scale AI还吸引了各种各样的新投资者:思科、英特尔、AMD等风险投资部门去参加了,而且很多注资过的公司也回归了,包括英伟达、Coatue、Y Combinator等等。
Scale AI由Alexandr Wang和Lucy Guo于2016年创立,由著名创业孵化器Y Combinator投资。该公司使用机器学习来标记和分类大量数据,以便客户用于训练模型。
Scale AI的客户包括Meta、微软、英伟达、OpenAI、丰田和哈佛医学院。
2022年,持有15%股份的Alexandr Wang成为全世界最年轻的白手起家的亿万富翁。
1997年出生于新墨西哥州,父母都是在新墨西哥州洛斯阿拉莫斯国家实验室的物理学家。
高中阶段开始利用互联网自学编程,并报上自己的姓名去参加了一些世界级的编程大赛,比如美国计算机奥林匹克竞赛(USACO)。
在MIT大一刚结束后的暑假,他就和Guo一起创办了Scale,并且拿到了Y Combinator的投资。
Scale AI刚起步时,有些人确实觉得这就是一个笑话,毕竟公司当时只有三名员工。
不过,在不断地融资和发展之下,Scale AI发展飞速,到2021年已经成长为价值73亿美元的独角兽企业,2023年初公司规模也扩展到了700人。
Wang在接受《财富》杂志独家采访时透露,随企业客户竞相训练生成式AI模型,Scale AI的这方面业务快速增长。
2023年,公司年度经常性收入(企业长期为数据服务支付的费用)增加了两倍,预计2024年底将达到 14 亿美元。
由于Scale AI的惊人成就,Alexandr Wang在2021年入选福布斯企业技术领域「30 under 30」排行榜,他本人在硅谷也被称为「下一个扎克伯格」。
算法领域,前有谷歌、微软的大型研究院,后有推出过Sora和GPT系列模型的OpenAI;算力领域有供货全球的英伟达,但在Scale AI还未诞生的2016年,数据领域仍处于空白。
19岁的Alexandr Wang在看到这一点后,做出了辍学创业的决定,「我创办 Scale 的原因是未解决人工智能中的数据问题」。
大部分数据都是非结构化的,AI很难直接学习这一些数据;而且大型数据集的标注一项资源密集型工作,因此,「数据」被很多人认为是科技领域最辛苦、最卑微的部分。
但Scale AI却在短时间内就获得了巨大成功。他们能够为不一样的行业的企业客户量身定制数据服务。
在自动驾驶领域,Cruise和Waymo等公司通过摄像头和传感器收集了大量数据,Scale AI将机器学习与「人机回路」(human-in-loop)监督相结合,管理和标注这些数据。
CEO Wang在接受《财富》杂志采访时表示,Scale AI将自己定位为整个AI生态的基础设施供应商,构建「数据铸造厂」,而不仅仅是在子公司Remotasks中雇佣大量的合同工进行人工标注。
Scale AI慢慢的开始与不相同的领域的专家合作,比如博士级学者、律师、会计师、作家等。
给聊天机器人的回复进行打分,这样的工作为什么能让博士级别的专家参与其中?
Wang的回应是,原因有很多:「如果你是一名博士,习惯于做一些非常小众、深奥的研究,也许世界上只有少数人能够理解。但这个工作中,你能够在一定程度上帮助改进和构建这些AI系统的前沿数据,有机会产生真正的社会影响。」
同时,Wang也认为,这些专家所能提供的高质量数据对AI的未来非常重要。
他补充说,来自专家的、包含复杂推理的数据是未来人工智能的必备条件。「你不能随便把旧数据输入给算法中,然后期待着它会自我改进」。
传统的数据来源,比如从Reddit等社区的评论中抓取数据存在局限性。Scale AI构建了一些流程,模型先输出一些内容,例如撰写研究论文,在此基础上,人类专家可以改进这一些内容,从而改进模型的输出。
关于AI生成并注释的数据,有人持积极态度,认为可以消除对人类注释数据注释,但Wang的观点并没这么单纯。
他说,合成数据及人类创建的数据,这两个方面Scale AI都有投入。「虽然AI生成的数据很重要,但想要获得有一定质量和准确性的数据,唯一方法是通过人类专家的验证。」
就在上周,印度的数据平台Weka表示,它以16亿美元的投后估值筹集了1.4亿美元,以帮助公司为其AI应用程序构建数据管道。
人工智能数据的主体问题任旧存在。Scaling Law的存在意味着,随着模型变大,对数据的需求也呈现指数级增长,慢慢的变多的人担心大模型会耗尽可用数据。
Alexandr Wang在Scale AI的官网上这样写道,「数据丰富不是默认情况,而是一种选择,它需要汇集工程、运营和AI方面最优秀的人才」
Scale AI的愿景之一是「数据丰富」,从而将前沿LLM扩展到更大数量级,「为通向AGI铺平道路。在达到 GPT-10 的过程中,我们不应该受到数据的限制」。
特别声明:以上内容(如有图片或视频亦包括在内)为自媒体平台“网易号”用户上传并发布,本平台仅提供信息存储服务。
300万支步枪下发 140万青年要求奔赴战场:启封12条弹药生产线万员工涌入上海青浦,苏沪两地房东狂欢,有房源租金几近翻倍
突然确诊“癌王”!浙江30岁男子崩溃:我不沾烟酒啊!医生:这事做错了……
网传某校园招聘会出现逆天职位,“平台支撑”月薪1~1000,网友:要饭都比这强
真我 realme UI 6.0 用户内测体验招募 10 月 21 日启动
力压iPhone!荣耀Magic7系列再次被确认:AI技术、关键配置清晰了