本科生已不够 AI公司雇佣各领域专家训练大模型

9月29日消息,人工智能模型的性能在很大程度上依赖于其训练数据的质量。传统方法通常是雇用大量低成本劳动力对图像、文本等数据进行标注,以满足模型训练的基本需求。然而,这种方式容易导致模型在理解和生成信息时出现“幻觉”现象,即生成不准确或误导性的信息。为了解决这一问题,许多初创公司如今更倾向于聘请拥有高学历和专业背景的专家来参与模型训练,确保训练数据的准确性和深度,从而提升模型的整体表现。

以下为翻译全文:

早年,像ChatGPT及其竞争对手Cohere等人工智能模型要生成类似人类的反应,需要依赖大量低成本的人力团队,帮助模型区分基本事实,比如一张图像是汽车还是胡萝卜。

然而,随着竞争愈发激烈,对人工智能模型的升级已转变为一项高复杂度的专业任务,如今需要一个快速扩展的专业训练师网络。这些训练师涵盖从历史学家到科学家等专业人才,有些甚至拥有博士学位。

Cohere联合创始人Ivan Zhang在谈到其内部训练师队伍的变化时表示:“一年前,我们还可以雇佣本科生来大致教AI如何改进。而现在,我们有执业医师教模型如何在医疗环境中工作,还有金融分析师和会计师帮助模型在特定领域表现更好。”

在这里插入图片描述
为提升培训能力,估值已超50亿美元的Cohere与一家名为Invisible Tech的初创公司合作。Cohere是OpenAI的主要竞争对手之一,专注于为企业提供AI服务。

初创公司Invisible Tech雇佣了数千名远程培训师,并已成为AI行业的主要合作伙伴之一,为包括AI21和微软在内的多家人工智能公司提供训练服务,帮助减少被称为“幻觉”的AI错误现象。Invisible创始人弗朗西斯·佩德拉萨(Francis Pedraza)表示:“我们在全球100多个国家拥有5000多名具有博士、硕士学位及深厚专业知识的专家。”

根据任务的复杂程度和工作地点,Invisible的时薪最高可达40美元。其他公司如Outlier支付的时薪高达50美元,而Labelbox则为像量子物理这样的“高专业性”科目提供高达200美元的时薪,基础类任务起步价为15美元。

Invisible成立于2015年,最初主要为DoorDash等公司提供工作流程自动化服务,比如将外卖菜单数字化。然而,转折点出现在2022年春季,在ChatGPT公开发布前,OpenAI主动寻求与Invisible合作。

佩德拉萨回忆道:“OpenAI遇到了一个问题,早期版本的ChatGPT在回答问题时容易陷入‘幻觉’,其答案不可靠。为此,他们需要一个能够通过人类反馈来强化AI学习的先进训练伙伴。”

生成式人工智能依赖过去用于训练的数据生成新内容。然而,有时它无法区分真假信息,产生所谓的“幻觉”。一个例子发生在2023年,当时谷歌的聊天机器人在宣传视频中分享了关于哪个望远镜首次拍摄到太阳系外行星的不准确信息。

AI公司意识到,“幻觉”现象可能会影响生成式人工智能在商业领域的吸引力,因此他们正在尝试各种方法减少这种现象,其中包括利用人类训练师来教导AI区分事实与虚构。

自与OpenAI合作以来,Invisible迅速成为众多生成式AI公司的首选培训伙伴,其客户包括Cohere、AI21和微软等。尽管微软尚未正式确认合作关系,但Cohere和AI21已承认是Invisible的大客户。

佩德拉萨指出:“在人工智能行业,培训成本是企业的第二大支出,仅次于算力。而高质量的培训对于确保模型的准确性和可靠性至关重要。”

它是如何工作的?

OpenAI的生成式人工智能热潮背后有一个名为“人类数据团队”的团队支持。该团队与AI训练师合作,收集专业数据以训练ChatGPT等模型。

熟悉该公司流程的知情人士透露,OpenAI的研究人员设计了一系列实验,旨在解决诸如减少“幻觉”、优化写作风格等问题。他们与Invisible等供应商的AI训练师合作,根据需求收集和处理数据。

上述知情人士说,在任何时候,同时进行的实验项目都可能多达数十项,这些项目有的可以采用OpenAI的自研工具,也可以使用供应商提供的解决方案。

Invisible会根据AI公司的需求,雇佣具有相关学科背景的专家,无论是研究瑞典历史的学者还是金融建模专家,都可以为这些AI项目贡献力量,帮助减少AI公司管理大量训练师的负担。

佩德拉萨表示:“OpenAI拥有世界顶尖的计算机科学家,但他们不一定精通瑞典历史、化学或生物等专业领域的问题。”他补充说,仅OpenAI就有超过1000名合同工为其提供数据标注服务。

Cohere的Ivan Zhang亲自体验了Invisible训练师的能力,并成功教会Cohere的生成式AI模型如何从大数据集中提取相关信息。

竞争加剧

在AI训练数据集领域,Scale AI是Invisible的主要竞争对手。这家私营初创公司估值达140亿美元,不仅提供数据集服务,还开始为AI公司提供培训服务,并将OpenAI列为其客户之一。Scale AI没有回应置评请求。

相比之下,Invisible的资金募集显得更为保守,自2021年起开始盈利,仅获得了800万美元的主要资本。佩德拉萨表示:“我们70%的股权归团队所有,30%的股权归投资者。”他还透露,最近的公司估值已达5亿美元。

最早进入AI训练领域的培训师主要通过从事数据标注工作,要求相对较低,因此报酬也较低,有时每小时薪酬低至2美元,主要由非洲和亚洲国家的劳动者完成。

然而,随着AI技术的快速发展,对专业培训师的需求急剧上升,涵盖数十种语言和领域,创造了一个高薪利基市场。如今,来自各个学科的专家无需编程技能,也有机会成为AI培训师。

AI公司的需求正催生出更多提供类似服务的企业。Ivan Zhang说:“我的收件箱几乎被不断涌现的新公司所淹没,这些公司纷纷涌入人工智能训练服务市场。这的确是一个全新的领域,公司雇佣人类只是为了给我们这样的人工智能实验室创造数据。”

感谢大家花时间阅读我的文章,你们的支持是我不断前进的动力。期望未来能为大家带来更多有价值的内容,请多多关注我的动态!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/885920.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

【递归】11. leetcode 129 求根节点到叶节点数字之和

1 题目描述 题目链接: 求根节点到叶节点数字之和 2 解答思路 第一步:挖掘出相同的子问题 (关系到具体函数头的设计) 第二步:只关心具体子问题做了什么 (关系到具体函数体怎么写,是一个宏观…

追随 HarmonyOS NEXT,Solon v3.0 将在10月8日发布

Solon (开放原子开源基金会,孵化项目)原计划10月1日发布 v3.0 正式版。看到 HarmonyOS NEXT 将在 10月8日启用公测,现改为10月8日发布以示庆贺。另外,Solon 将在2025年启动“仓颉”版开发(届时,…

数据仓库的建设——从数据到知识的桥梁

数据仓库的建设——从数据到知识的桥梁 前言数据仓库的建设 前言 企业每天都在产生海量的数据,这些数据就像无数散落的珍珠,看似杂乱无章,但每一颗都蕴含着潜在的价值。而数据仓库,就是那根将珍珠串起来的线,它能够把…

WebSocket消息防丢ACK和心跳机制对信息安全性的作用及实现方法

WebSocket消息防丢ACK和心跳机制对信息安全性的作用及实现方法 在现代即时通讯(IM)系统和实时通信应用中,WebSocket作为一种高效的双向通信协议,得到了广泛应用。然而,在实际使用中,如何确保消息的可靠传输…

解决Windows远程桌面 “为安全考虑,已锁定该用户账户,原因是登录尝试或密码更改尝试过多,请稍后片刻再重试,或与系统管理员或技术支持联系“问题

根本原因就是当前主机被通过远程桌面输入了过多的错误密码,被系统锁定。这种情况多数是你的服务器远程桌面被人试图攻击了,不建议取消系统锁定策略。如果阿里云或者腾讯云主机,只需要在管理后台通过管理终端或者VNC登陆一次,锁定即…

哈希表(HashMap、HashSet)

文章目录 一、 什么是哈希表二、 哈希冲突2.1 为什么会出现冲突2.2 如何避免出现冲突2.3 出现冲突如何解决 三、模拟实现哈希桶/开散列(整型数据)3.1 结构3.2 插入元素3.3 获取元素 四、模拟实现哈希桶/开散列(泛型)4.1 结构4.2 插…

DC00025【含论文】基于协同过滤推荐算法springboot视频推荐管理系统

1、项目功能演示 DC00025【含文档】基于springboot短视频推荐管理系统协同过滤算法视频推荐系统javaweb开发程序设计vue 2、项目功能描述 短视频推荐系统分为用户和系统管理员两个角色 2.1 用户角色 1、用户登录、用户注册 2、视频中心:信息查看、视频收藏、点赞、…

1.1.4 计算机网络的分类

按分布范围分类: 广域网(wan) 城域网(man) 局域网(lan) 个域网(pan) 注意:如今局域网几乎采用“以太网技术实现”,因此“以太网”几乎成了“局域…

Python核心知识:pip使用方法大全

什么是 pip? pip 是 Python 的包管理工具,允许用户安装、升级和管理 Python 的第三方库和依赖。它极大地简化了开发过程,使开发者可以轻松地获取并安装所需的软件包。pip 已成为 Python 项目中最常见的包管理工具,并且自 Python …

【STM32开发笔记】移植AI框架TensorFlow到STM32单片机【下篇】

【STM32开发笔记】移植AI框架TensorFlow到STM32单片机【下篇】 一、上篇回顾二、项目准备2.1 准备模板项目2.2 支持计时功能2.3 配置UART4引脚2.4 支持printf重定向到UART42.5 支持printf输出浮点数2.6 支持printf不带\r的换行2.7 支持ccache编译缓存 三、TFLM集成3.1 添加tfli…

Ceph RocksDB 深度调优

介绍 调优 Ceph 可能是一项艰巨的挑战。在 Ceph、RocksDB 和 Linux 内核之间,实际上有数以千计的选项可以进行调整以提高存储性能和效率。由于涉及的复杂性,比较优的配置通常分散在博客文章或邮件列表中,但是往往都没有说明这些设置的实际作…

C# 相等性检测方法差异分析(==,Equals,ReferenceEquals)

先给结论: 对于每种类型创建2个一样的数据,比较结果如下表所示: 数据类型EqualsReferenceEqualsint(值类型)√√引用类型引用类型(带override)以operator 实现为准以Equals覆写为准struct必须实现操作符√struct&…

Android 12系统源码_输入系统(三)输入事件的加工和分发

前言 上一篇文章我们具体分析了InputManagerService的构造方法和start方法,知道IMS的start方法经过层层调用,最终会触发Navite层InputDispatcher的start方法和InputReader的start方法。InputDispatcher的start方法会启动一个名为InputDispatcher的线程&…

基于深度学习的点云处理模型PointNet++学习记录

前面我们已经学习了Open3D,并掌握了其相关应用,但我们也发现对于一些点云分割任务,我们采用聚类等方法的效果似乎并不理想,这时,我们可以想到在深度学习领域是否有相关的算法呢,今天,我们便来学…

给Windows系统设置代理的操作方法

一、什么是代理 网络代理是一种特殊的网络服务,允许一个网络终端通过这个服务与另一个网络终端进行非直接的连接,而提供代理服务的电脑系统或其它类型的网络终端被称为代理服务器。 代理服务器是网络信息的中转站,代理服务器就像是一个很大的…

DBC差异比较工具DBCCompare_原理介绍(四)

DBC比对工具UI图片 DBC比对工具:功能详解与源码分析 在现代汽车开发和诊断过程中,DBC(Database Container)文件扮演着至关重要的角色。它们详细描述了CAN(Controller Area Network)网络中各消息和信号的详…

GB28181信令交互流程及Android端设备对接探讨

GB28181规范必要性 好多开发者在做比如执法记录仪、智能安全帽、智能监控等设备端视频回传技术方案选型的时候,不清楚到底是用RTSP、RTMP还是GB28181,对GB28181相对比较陌生,我们就GB28181规范的必要性,做个探讨: 实现…

【北京迅为】《STM32MP157开发板嵌入式开发指南》- 第十八章 Linux编写第一个自己的命令

iTOP-STM32MP157开发板采用ST推出的双核cortex-A7单核cortex-M4异构处理器,既可用Linux、又可以用于STM32单片机开发。开发板采用核心板底板结构,主频650M、1G内存、8G存储,核心板采用工业级板对板连接器,高可靠,牢固耐…

企业安全策略制定

如今,网络安全是所有组织的必需品,而不是奢侈品。现代企业面临着针对其数据、网络和系统的复杂且不断演变的威胁。 即使一个漏洞也可能导致严重违规、财务损失和声誉受损。正如堡垒依靠多层防御共同作用一样,公司的安全措施必须作为一个整体…

【学习笔记】手写 Tomcat 六

目录 一、线程池 1. 构建线程池的类 2. 创建任务 3. 执行任务 测试 二、URL编码 解决方案 测试 三、如何接收客户端发送的全部信息 解决方案 测试 四、作业 1. 了解工厂模式 2. 了解反射技术 一、线程池 昨天使用了数据库连接池,我们了解了连接池的优…