扩展人工智能模型以获得更好的工作成果
Posted: Mon Dec 02, 2024 9:12 am
几十年来,全球各地的组织都依赖 Upwork 寻找最佳人才来解决最棘手的业务问题。最近,先进机器学习和人工智能的新时代开启了更好的工作方式,充分利用了人才和技术方面的最佳资源。对于 Upwork 上的企业来说,人工智能可以提供更简化和直观的体验,因此招聘经理可以更快地找到所需的解决方案和人员,并更有效地获得最终的工作成果。对于自由职业者来说,人工智能创新可以帮助他们提高生产力,实现高质量的业务成果,并最终在平台上赚取更多收入。
今年,我们推出了Upwork 的 Mindful AI Uma,以支撑我们整个平台,并日益成为我们客户的 Upwork 对话伙伴。我们致力于负责任地开发人工智能,Upwork 上的“Mindful AI”意味着根据我们的人工智能原则设计和开发的人工智能体验。Uma在我们的招聘和匹配流程中提供了许多关键体验,这些体验对于客户和自由职业者相互发现、开始工作和共同完成更多工作至关重要。我们将继续培训 Uma,使其成为企业和自由职业者的持久智能伴侣,在整个 Upwork 体验的每一步为他们提供帮助。
我们的人工智能和机器学习团队(内部称为 Umami)不仅在构建 Uma 以服务 斯洛文尼亚电话号码数据 广泛的客户,而且还在服务于我们工作市场上各种非常具体但影响深远的用例,包括发现、搜索和匹配等特定于市场的功能。
为我们的市场设计 AI 模型是一项具有挑战性的技术问题。我们必须服务于庞大且不断增长的客户群,这些客户群如今期待着 AI 解决方案,但同时还需要提供能够精准满足特定客户需求的语言模型,以确保我们为 Upwork 上的自由职业者和客户创造真正的价值。
高效 AI 和高效 Uma 产品的基础是高质量数据和优先考虑定制的多 AI 模型方法的结合。让我们深入了解一下。
理解数据,人工智能的支柱
大型语言模型 (LLM) 的强大程度完全取决于训练模型所用的数据。训练模型所用数据的质量、多样性和数量直接影响其生成准确、情境感知和细致入微的响应的能力。在人工智能时代获胜的公司将拥有最高质量的数据作为护城河。
数据不仅必须是高质量的,而且在 LLM 时代,还需要反映客户与这些模型之间可能进行的丰富互动。在更丰富、更多样化、更复杂的对话中训练的模型将优于在从互联网随机角落抓取的低质量片段中训练的模型。不仅如此,基于网络的数据往往简单且非对话性强,这通常使其不足以支持旨在处理复杂客户问题的 LLM。在为现实世界训练 LLM 时,精心策划高质量数据总是胜过大量自动数据收集。
在 Upwork,我们处于有利地位,可以利用我们的人工智能推动成功的工作成果,这不仅是因为我们正在开发新颖的合成数据生成算法(用于创建模拟现实世界数据的人工数据的技术)来大规模支持我们的 LLM,还因为我们可以访问我们平台上收集的大量丰富历史信号,以及顶级创意写作人才,以帮助从头开始创建黄金标准的 LLM 数据。以下是我们用于训练模型的几种数据集:
平台数据: Upwork 已经以各种形式存在了 20 多年。这是 20 多年的内部数据——数以万亿的 token,记录了一系列与工作相关的互动和时刻,我们可以将它们输入到我们的模型中。作为一个同时拥有自由职业者和企业的双边市场,我们利用等式两边富有成效和成功的工作互动中的见解,从赢得财富 500 强公司工作的自由职业者提案,到获得顶级自由职业者高度参与的职位发布,再到专家审核人才的自由职业者档案。Upwork 上的自由职业者也涵盖了越来越大和多样化的工作类别,从化学到编剧再到软件工程,代表了为我们的模型提供信息的无与伦比的主题和数据点的广度。来自成功结果的工作互动的特定数据点可用于训练我们的 AI 模型,以向我们的客户提供与有效绩效和解决方案相关的解决方案和建议。*我们致力于负责任地开发和使用人工智能,以帮助我们的客户充分发挥其潜力,并且仅根据我们的隐私政策和客户的用户设置使用平台数据。
今年,我们推出了Upwork 的 Mindful AI Uma,以支撑我们整个平台,并日益成为我们客户的 Upwork 对话伙伴。我们致力于负责任地开发人工智能,Upwork 上的“Mindful AI”意味着根据我们的人工智能原则设计和开发的人工智能体验。Uma在我们的招聘和匹配流程中提供了许多关键体验,这些体验对于客户和自由职业者相互发现、开始工作和共同完成更多工作至关重要。我们将继续培训 Uma,使其成为企业和自由职业者的持久智能伴侣,在整个 Upwork 体验的每一步为他们提供帮助。
我们的人工智能和机器学习团队(内部称为 Umami)不仅在构建 Uma 以服务 斯洛文尼亚电话号码数据 广泛的客户,而且还在服务于我们工作市场上各种非常具体但影响深远的用例,包括发现、搜索和匹配等特定于市场的功能。
为我们的市场设计 AI 模型是一项具有挑战性的技术问题。我们必须服务于庞大且不断增长的客户群,这些客户群如今期待着 AI 解决方案,但同时还需要提供能够精准满足特定客户需求的语言模型,以确保我们为 Upwork 上的自由职业者和客户创造真正的价值。
高效 AI 和高效 Uma 产品的基础是高质量数据和优先考虑定制的多 AI 模型方法的结合。让我们深入了解一下。
理解数据,人工智能的支柱
大型语言模型 (LLM) 的强大程度完全取决于训练模型所用的数据。训练模型所用数据的质量、多样性和数量直接影响其生成准确、情境感知和细致入微的响应的能力。在人工智能时代获胜的公司将拥有最高质量的数据作为护城河。
数据不仅必须是高质量的,而且在 LLM 时代,还需要反映客户与这些模型之间可能进行的丰富互动。在更丰富、更多样化、更复杂的对话中训练的模型将优于在从互联网随机角落抓取的低质量片段中训练的模型。不仅如此,基于网络的数据往往简单且非对话性强,这通常使其不足以支持旨在处理复杂客户问题的 LLM。在为现实世界训练 LLM 时,精心策划高质量数据总是胜过大量自动数据收集。
在 Upwork,我们处于有利地位,可以利用我们的人工智能推动成功的工作成果,这不仅是因为我们正在开发新颖的合成数据生成算法(用于创建模拟现实世界数据的人工数据的技术)来大规模支持我们的 LLM,还因为我们可以访问我们平台上收集的大量丰富历史信号,以及顶级创意写作人才,以帮助从头开始创建黄金标准的 LLM 数据。以下是我们用于训练模型的几种数据集:
平台数据: Upwork 已经以各种形式存在了 20 多年。这是 20 多年的内部数据——数以万亿的 token,记录了一系列与工作相关的互动和时刻,我们可以将它们输入到我们的模型中。作为一个同时拥有自由职业者和企业的双边市场,我们利用等式两边富有成效和成功的工作互动中的见解,从赢得财富 500 强公司工作的自由职业者提案,到获得顶级自由职业者高度参与的职位发布,再到专家审核人才的自由职业者档案。Upwork 上的自由职业者也涵盖了越来越大和多样化的工作类别,从化学到编剧再到软件工程,代表了为我们的模型提供信息的无与伦比的主题和数据点的广度。来自成功结果的工作互动的特定数据点可用于训练我们的 AI 模型,以向我们的客户提供与有效绩效和解决方案相关的解决方案和建议。*我们致力于负责任地开发和使用人工智能,以帮助我们的客户充分发挥其潜力,并且仅根据我们的隐私政策和客户的用户设置使用平台数据。