China Data

Posted: **Tue Dec 10, 2024 5:19 am**

标签可帮助人们和机器了解内容项的含义。标签很重要，，无论是修改现有内容、将内容整合到大型内容项中、提供个性化内容还是评估内容性能。

标签提供了一种标准语言，可以在整个组织内使用，以管理和协调其内容。依靠标签提供正确的内容取决于标签是否正确。这就是人们对自动标记感兴趣的原因。它承诺提供一种更好的向内容添加标签的方法。

什么是自动标记？
标签与术语有关，因此让我们先来澄清一下我们将要使用的术语俄罗斯手机号码列表标签是一种内容元数据（但请注意，还存在其他类型的元数据，它们不是标签）。标签根据定义的分类术语列表来识别内容的内容，这些术语是标准化的描述性关键字。由于内容标签使用标准化术语，因此它们不同于通常由用户定义的社交媒体主题标签。

标记是一个手动或自动化的过程，通过分类术语来描述和标记内容。

自动标记是指自动应用标签来描述内容。请注意，用于描述的自动标记不同于 Google 用于广告跟踪目的的广告系列标签，Google 也将其称为自动标记。

开发人员已经探索了减少标记内容的手动工作量的方法，以加快该过程并增加其应用。一些常见的方法包括：

批量标记：同时为许多类似的项目添加相同的标签
基于规则的标记：根据内容是否包含某些词语来应用标记
基于人工智能的标记：应用人工智能的解决方案
本次讨论将重点介绍基于 AI 的解决方案，即为内容添加标签，这比批量或基于规则的方法更为复杂。基于 AI 的软件可以提供最大的灵活性，并且一旦设置好就可以自主运行。这些方法也在快速发展。

可以自动标记的内容种类
自动标记可用于文本和图像，但图像所采用的过程与文本不同。

确定文本内容的来源。您发布的文本可能来自内部或外部来源。

您组织中的作者将创建内容，并作为工作流程的一部分添加元数据标签。软件可以通过评估文本自动添加标签，从而简化内容开发流程。

另一种可能性是用户生成的文本，例如来自客户的评论和反馈。例如，一些电子商务供应商会在产品评论中添加标签，以记录与耐用性、便利性或满意度相关的具体评论。此类文本没有明确的工作流程，这意味着自动标记特别有用。自动标记将几乎立即添加标签，客户可以使用这些标签对评论进行分类，找到他们最感兴趣的功能。

自动标记功能对图像（尤其是照片）

大有裨益。如果没有标记，图像将很难搜索和定位。相似商品的图像有时难以区分，这意味着人们可能会访问错误的图像。自动标记功能可以识别图像中的内容，例如人物、位置、设置、物体和颜色。许多零售商可能会使用自动标记功能来标记可见的产品特征。

音频和视频的自动标记也是可能的，但其应用通常比较有限。人工智能软件开始识别片段和事件，但大多数自动分类依赖于文本描述和标题，而不是音频或视频源文件的内容。

为什么人们对自动标记的兴趣日益增长
长期以来，出版商一直难以跟踪和管理他们制作的大量内容。他们需要更简单、更可靠的方法来为其内容添加标签。《纽约时报》描述了自动化的吸引力：“从文本中提取结构化数据是《纽约时报》的常见问题，164 年来，绝大多数数据整理（例如，编目、标记、关联）都是手动完成的。但开发人员和设计人员对精细结构化数据的需求日益增加，这些数据可以为我们的数字产品提供支持，在某些时候，我们需要开发算法解决方案来帮助完成这些任务。”

人工智能的使用简化了内容项目的标记。曾经需要大量时间和注意力的任务现在有望变得容易得多。软件可以完成繁重的工作：

该软件识别内容中最重要的主题或实体
它决定如何用术语或概念标记这些实体，以便可以快速识别它们
只要软件运行准确，作者和其他支持内容操作的人员的负担就会大大减轻。

在采用任何自动标记解决方案之前，重要的是了解其工作原理、优点和缺点以及所需的前期投资。

自动标记是如何完成的
自动标记软件会根据其预期的语言、逻辑或数学资料寻找匹配项并进行识别。它可以依赖一系列技术：

机器学习(ML) 和深度神经网络，依靠数学分析来寻找与已知属性相匹配的模式
涉及文本中提到的匹配专有名词的命名实体识别
语义分析，定位内容中引用的概念
自然语言处理(NLP)，分析句子以确定其含义
一些自动标记软件将依赖于特定技术。例如，图像标记通常会利用机器学习。许多自动标记软件需要某种“训练”，即展示正确标记的内容示例，然后输入未标记的内容以查看其是否被正确标记。如果软件无法确定正确的标签，人工将通过插入缺失的标签以及删除或更改错误的标签来提供正确的标签。

文本标记可以使用各种技术，有时也会结合使用几种技术。《纽约时报》通过概率猜测来审查烹饪食谱中的文本，从中提取数据。虽然自动标记可以达到可靠的准确度，但很少完全准确。在评估自动标记解决方案的实用性时，要考虑所达到的准确度和纠正不准确所需的努力程度。

自动标记的局限性
自动标记是否适合将分类标签应用于内容项？可以。但自动标记也有局限性。

自动标记不适用于应用某些类型的分类术语。请记住，自动标记只能评估内容中的内容，例如存在的实体。如果发布商需要用内容意图的描述来标记内容，而文本或图像中没有明确说明，则不能依赖自动标记。此类外部信息可能与内容的目标受众或用户旅程的阶段有关。这些标签仍需要手动添加。

自动标记可能会受到源内容特征的限制。您的成功取决于您是否能够描述用户想要的特定信息。有时自动标记产生的内容与用户需要的内容之间存在差距。描述可能过于模糊，或者遗漏了关键要素。

自动标记的准确度通过两个维度来衡量：精确度和召回率。在《商业研究杂志》上发表的一项关于营销内容自动标记的研究中，一个全球研究小组解释了这些概念：“精确度衡量模型避免将错误的关键词分配给文章的程度；它是真正例（被正确分类的正例）的数量除以真正例和假正例（被分类为正例的负例）的总和。相反，召回率衡量模型将关键词正确分配给文章的程度；它是真正例的数量除以真正例和假负例的总和。”

简而言之，您既希望获得高精度（避免使用错误的术语进行标记），又希望获得高召回率（避免丢失正确的标记）。

自动标记软件可能会做出错误的分类，或者可能会忽略应该做出的分类。

标记错误并不总是能立即显现出来。但在某些情况下，标记错误可能非常明显，例如当早餐糕点的照片被归类为狗时。

自动标记输出的质量取决于它是否有可靠的示例可供训练，以及将来要标记的内容是否与之前的内容相似。质量将受以下因素影响：

现有标签的准确性
现有标签的完整性
标签可预测性：现有内容在细节程度和覆盖范围上是否与未来内容相似？
自动标记与手动标记的比较
自动标记在某些情况下非常有用，但在其他情况下却很吃力。

自动标记在运行良好的情况下，可以提高标记过程的效率和一致性。它可以避免手动标记带来的一些麻烦，例如员工对标记的理解或投入程度较差、标记应用不均衡以及所用标记的错误或不一致。如果手动标记内容做得不好，可能会导致依赖标记的系统变得不可靠。

请记住，没有一种标记方法能够始终 100% 准确。需要考虑的一个问题是，对于依赖标记的用例，人为错误或机器错误是否会造成更多问题。

自动标记在以下情况下具有很大的优势：

你拥有大量的内容，尤其是当这些内容的细节都是标准化的时候
你需要速度（尤其是当速度比准确性更重要时）
您需要对来自不同来源的内容进行一致的标记（因为监督大量人群的手动标记可能会更加困难）
自动标记可能是一种有效的解决方案，例如当需要迁移大量易于理解的内容项时。

当需要人工判断时，手动标记是更好的选择。

下表总结了每种方法的一些主要优点和缺点。

China Data

因为它们有助于找到支持内容生命周期任何阶段所需的正确内容

因为它们有助于找到支持内容生命周期任何阶段所需的正确内容