是否可以使用 AWS 转录将人员映射到转录本?
Posted
技术标签:
【中文标题】是否可以使用 AWS 转录将人员映射到转录本?【英文标题】:is it possible to map people to transcript with AWS transcribe? 【发布时间】:2021-05-27 12:10:56 【问题描述】:我需要使用一些转录服务来转录语音。我使用 AWS transcribe 获得了非常好的结果。但我也需要知道哪个人说了什么。这可以通过 AWS 转录吗?我找不到关于此的任何信息。
例如。我现在得到的是
演讲者 1:你好,你好吗?
演讲者2:我很好,你好吗?
演讲者 1:很好……
我想得到的是能够知道谁是扬声器 1 和扬声器 2。例如通过上传样本
鲍勃:你好,你好吗?
爱丽丝:我很好,你好吗?
鲍勃:很好……
AWS 可以做到这一点吗?
【问题讨论】:
【参考方案1】:有两种方法:
使用多个声道(例如左右音频)来分隔扬声器。这对于具有两个不同扬声器的电话呼叫很有用。见:Transcribing multi-channel audio - Amazon Transcribe 使用 diarization 识别扬声器,请参阅:Identifying speakers (speaker diarization) - Amazon Transcribe这些将识别单独的个发言者。但是,您不能上传“样本”然后确定特定发言人。
【讨论】:
以上是关于是否可以使用 AWS 转录将人员映射到转录本?的主要内容,如果未能解决你的问题,请参考以下文章