Google Vertex AI 是一个基于 Google Cloud 的平台,企业家、开发者和 AI 研究人员可以使用它来管理他们的 AI 项目。我们在之前的文章《Google Vertex AI:加速 AI 开发及更多》中详细讨论了整个 Vertex AI 生态系统的架构。
本文将讨论 Vertex AI 中的托管 ML 数据集,以及如何使用它们创建生成式 AI 应用程序。我们将涵盖以下主题:
1.什么是托管数据集?
2.如何准备托管数据集?
2.1.基于图像的数据集
2.2.表格数据集
2.3.文本数据集
2.4.视频数据集
3.如何创建托管数据集?
4.结论
托管数据集是在 Vertex AI 框架内运行的数据集。您需要它们进 巴林电报号码数据 行 AutoML 训练(以及 Gemini 训练),但不需要它们用于您的自定义模型。
但是,通过提供多种功能,管理数据库可以减少您在 Vertex 生态系统中的工作量。托管数据库的优势如下:
1.您可以从集中位置管理您的数据集。
2.您可以轻松创建标签和多个注释集。
3.可以创建人工标注的任务。
4.您可以根据AI模型跟踪此数据库的谱系,以进行迭代和训练。
5. 您可以通过使用相同的数据集训练多个模型来比较 AI 模型的性能。
6.您可以生成统计数据,
7. Vertex 允许您将数据集分成训练、测试和验证数据。
这些功能让您可以使用任何所需的数据集在 Vertex AI 上以原生方式端到端运行您的 AI 项目。您还可以使用 Google 提供的数据集来训练模型并检查其性能。