音频数据的会话情感分析--粉丝服务平台-粉丝头条-fensifuwu.com

音频数据的会话情感分析

科技 07-21 来源：芯媒

分析语音中的情绪

情感分析，也称为意见挖掘，由于其多样化的工业应用，是自然语言处理 (NLP) 中的一项流行任务。在将 NLP 技术专门应用于文本数据的上下文中，主要目标是训练一个模型，该模型可以在不同的情感类别之间对给定的文本片段进行分类。下图显示了情绪分类器的高级概述。

情绪分析模型概述（作者提供图片）

例如，三类分类问题的类可以Positive是Negative和Neutral。三类情感分析问题的一个例子是流行的Twitter 情感分析数据集，它是对 Twitter 上各种用户发布的多语言推文的实体级情感分析任务。

虽然 NLP 的大多数先前研究和开发主要集中在对文本应用情感分析，但最近，我们已经看到基于语音的交互工具在用户、转向研究人员和组织中的大量采用和流行，以构建情感分类器。演讲空间。

因此，这篇文章将演示如何使用AssemblyAI API和Python对会话数据构建情感分析系统。端到端系统在涉及严格的客户支持和反馈评估的领域具有广泛的适用性——使其成为一个需要解决的重要且有价值的问题，尤其是在语音领域。最后，我还将展示一个广泛的分析，以增强所获得结果的可解释性并从数据中得出适当的见解。

您可以在此处找到本文的代码。此外，文章的亮点如下：

对会话音频数据的情感分析情感分析结果情感分析见解

会话音频数据的情感分析

在本节中，我将演示使用 AssemblyAI API 将给定的预先录制的语音对话中的单个句子分类为三个情感类Positive：Negative和Neutral。

通过 API 概述情绪分析模型（作者提供图片）

第 1 步：安装要求

构建情感分类器的要求很少。在 python 库方面，我们requests只需要 Python 中的包。这可以按如下方式完成：

pip 安装请求

第 2 步：生成 API 令牌

下一步是在AssemblyAI网站上创建一个帐户，您可以免费进行此操作。完成后，您将获得您的私有 API 访问密钥，我们将使用它来访问语音到文本模型。

第 3 步：上传音频文件

出于本教程的目的，我将使用两个人之间预先录制的音频对话来执行情感分析。获取 API Key 后，即可对预录的音频文件进行情感分类任务。

但是，在此之前，您需要上传音频文件，以便可以通过 URL 访问它。选项包括上传到 AWS S3 存储桶、SoundCloud 之类的音频托管服务或 AssemblyAI 的自托管服务等。我已将音频文件上传到 SoundCloud，可以在下面访问。

如果您希望将音频文件直接上传到 AssemblyAI 的托管服务，您也可以这样做。我已经在下面的代码块中演示了这个分步过程。

步骤 3.1：导入要求

我们从导入项目的需求开始。

步骤 3.2：指定文件位置和 API_Key

接下来，我们需要指定音频文件在我们本地机器上的位置以及注册后获得的 API 密钥。

步骤 3.3：指定上传端点

endpoint：这指定要调用的服务，在这种情况下是“上传”服务。
headers：这包含 API 密钥和内容类型。

Step 3.4：定义上传函数

一次最多只能上传 5 MB（5,242,880 字节）的音频文件。因此，我们需要分块上传数据。然后将它们合并回服务端点。因此，您无需担心处理大量 URL。

步骤 3.5：上传

最后一步是调用 POST 请求。发布请求的响应是包含upload_url音频文件的 JSON。我将在接下来的步骤中使用这个 URL 对音频执行情感分类。

第 4 步：情绪分析

在这一步，我们已经满足了对音频文件执行情感分析任务的所有必要先决条件。现在，我们可以继续调用 API 以获取所需的结果。这是一个两步过程，将在下面的小节中进行演示。

步骤 4.1：提交文件进行转录

第一步是调用 HTTP Post 请求。这实际上将您的音频文件发送到在后台运行的 AI 模型进行转录，并指示它们对转录文本执行情感分析。

传递给POST请求的参数是：

endpoint：它指定要调用的转录服务。
jsonaudio_url：这包含作为密钥的音频文件的 URL 。由于我们希望对会话数据执行情感分析，因此将sentiment_analysis标志和speaker_labels设置为True。
headers: 这持有authorization钥匙和content-type.

在 JSON 响应中收到的 post 请求的当前状态是queued. 这表示当前正在转录音频。

此外，该sentiment_analysis标志也在TrueJSON 响应中。sentiment_analysis_results但是，与键对应的值是None，因为 status 是 current queued。

步骤 4.2：获取转录结果

要检查我们的 POST 请求的状态，我们需要使用id上面收到的 JSON 响应中的键发出 GET 请求。

接下来，我们可以继续执行 GET 请求，如下面的代码块所示。

传递给GET请求的参数是：