是否可以使用 AWS 转录将人员映射到转录本?

Posted

技术标签:

【中文标题】是否可以使用 AWS 转录将人员映射到转录本?【英文标题】:is it possible to map people to transcript with AWS transcribe? 【发布时间】:2021-05-27 12:10:56 【问题描述】:

我需要使用一些转录服务来转录语音。我使用 AWS transcribe 获得了非常好的结果。但我也需要知道哪个人说了什么。这可以通过 AWS 转录吗?我找不到关于此的任何信息。

例如。我现在得到的是

演讲者 1:你好,你好吗?

演讲者2:我很好,你好吗?

演讲者 1:很好……

我想得到的是能够知道谁是扬声器 1 和扬声器 2。例如通过上传样本

鲍勃:你好,你好吗?

爱丽丝:我很好,你好吗?

鲍勃:很好……

AWS 可以做到这一点吗?

【问题讨论】:

【参考方案1】:

有两种方法:

使用多个声道(例如左右音频)来分隔扬声器。这对于具有两个不同扬声器的电话呼叫很有用。见:Transcribing multi-channel audio - Amazon Transcribe 使用 diarization 识别扬声器,请参阅:Identifying speakers (speaker diarization) - Amazon Transcribe

这些将识别单独的个发言者。但是,您不能上传“样本”然后确定特定发言人。

【讨论】:

以上是关于是否可以使用 AWS 转录将人员映射到转录本?的主要内容,如果未能解决你的问题,请参考以下文章

已知转录本的 Google 语音识别时间戳

转录组分析的正确姿势

NCBI获取基因序列以及不同转录本序列

转录组数据分析RNA-seq

无参转录组分析:使用 Trinity 进行转录本拼接(参考脚本)

单细胞转录组测序知识一隅