是否可以使用 AWS 转录将人员映射到转录本？

Posted 2023-02-22

技术标签:

【中文标题】是否可以使用 AWS 转录将人员映射到转录本？【英文标题】：is it possible to map people to transcript with AWS transcribe? 【发布时间】：2021-05-27 12:10:56 【问题描述】：

我需要使用一些转录服务来转录语音。我使用 AWS transcribe 获得了非常好的结果。但我也需要知道哪个人说了什么。这可以通过 AWS 转录吗？我找不到关于此的任何信息。

例如。我现在得到的是

演讲者 1：你好，你好吗？

演讲者2：我很好，你好吗？

演讲者 1：很好……

我想得到的是能够知道谁是扬声器 1 和扬声器 2。例如通过上传样本

鲍勃：你好，你好吗？

爱丽丝：我很好，你好吗？

鲍勃：很好……

AWS 可以做到这一点吗？

【问题讨论】：

【参考方案1】：

有两种方法：

使用多个声道（例如左右音频）来分隔扬声器。这对于具有两个不同扬声器的电话呼叫很有用。见：Transcribing multi-channel audio - Amazon Transcribe 使用 diarization 识别扬声器，请参阅：Identifying speakers (speaker diarization) - Amazon Transcribe

这些将识别单独的个发言者。但是，您不能上传“样本”然后确定特定发言人。

【讨论】：

以上是关于是否可以使用 AWS 转录将人员映射到转录本？的主要内容，如果未能解决你的问题，请参考以下文章

已知转录本的 Google 语音识别时间戳

转录组分析的正确姿势

NCBI获取基因序列以及不同转录本序列

转录组数据分析RNA-seq

无参转录组分析：使用 Trinity 进行转录本拼接（参考脚本）

单细胞转录组测序知识一隅