文本分类

#2025/12/30 #ai

目录

文本分类概述
电影评论的情感分析
使用表示模型进行文本分类
模型选择
使用特定任务模型
利用嵌入向量的分类任务
使用生成模型进行文本分类
小结

文本分类概述

文本分类是 NLP 中的一项常见任务。该任务的目标是训练一个模型，为输入的文本分配标签或类别（见图 4-1）。

从情感分析和意图识别，到实体提取和语言检测，文本分类在全球范围内被广泛应用。

表示模型和生成模型在文本分类中的重要作用不容忽视。

{%}|792

图 4-1：使用语言模型进行文本分类

本章将介绍几种使用语言模型进行文本分类的方法

我们将重点关注如何利用预训练语言模型（已经在大量数据上训练过的模型）来完成文本分类任务。

{%}|784

图 4-2：虽然表示模型和生成模型都可用于分类，但它们的方法不同

电影评论的情感分析

详见 1. 电影评论的情感分析

使用表示模型进行文本分类

详见 2. 使用表示模型进行文本分类

模型选择

详见 3. 模型选择

使用特定任务模型

详见 4. 使用特定任务模型

利用嵌入向量的分类任务

详见 5. 利用嵌入向量的分类任务
另需要补充的初高中知识点： 6. 余弦相似度如何衡量高维向量的接近度

使用生成模型进行文本分类

详见 7. 使用生成模型进行文本分类

小结

了执行各种分类任务的技术：
- 从对整个模型进行微调，到完全不进行微调。
使用生成模型和表示模型进行文本分类
两种类型的表示模型：特定任务模型和嵌入模型。
- 特定任务模型是在大型数据集上专门针对情感分析进行预训练的，
  - 它表明预训练模型对文档分类而言是一种很好的技术。
- 嵌入模型用于生成通用嵌入向量，我们将其作为训练分类器的输入。
两种类型的生成模型：
- ① 开源的编码器 - 解码器模型（FLAN-T5）
- ② 专有的仅解码器模型（GPT-3.5）。
- 我们在文本分类中使用这些生成模型时，无须在领域数据或标记数据集上进行特定的（额外）训练。