如何从 srt 文件中提取单词并导出到 MS EXCEL

Posted

技术标签:

【中文标题】如何从 srt 文件中提取单词并导出到 MS EXCEL【英文标题】:how to extract words from srt files & export to MS EXCEL 【发布时间】:2015-03-22 12:12:36 【问题描述】:

我想知道任何特定电视剧中使用的某些词的频率。 如果我可以将 SRT 文件中的单词导出到 MS EXCEL,那将非常容易。 谢谢

【问题讨论】:

向我们展示您的尝试,并描述您遇到的问题。有关如何提出好问题的信息,请参阅帮助页面;以及如何提供一个示例来展示您的问题。 【参考方案1】:

要将 srt(读取文本文件)文件导出到 Excel,您可以使用以下内容:

Sub m_srt_2_excel(str_fullname_srt As String)
Dim fso_active As FileSystemObject
Dim text_active As TextStream
Dim str_text As String
Dim var_data As Variant
Dim lng_count As Long

    Set fso_active = New FileSystemObject
    Set text_active = fso_active.OpenTextFile(str_fullname_srt, ForReading)
    str_text = text_active.ReadAll
    var_data = Split(str_text, vbCrLf)
    lng_count = UBound(var_data)

    selection.Resize(lng_count + 1).Value = WorksheetFunction.Transpose(var_data)

    Set text_active = Nothing
    Set fso_active = Nothing

End Sub

或者您可以将 OpenTextFile 与计算出现次数的函数结合使用:

Function f_count_string(str_text As String, str_find As String) As Long
Dim lng_len As Long

    lng_len = Len(str_text) - Len(Replace(str_text, str_find, vbNullString))
    f_count_string = lng_len / Len(str_find)
End Function

【讨论】:

以上是关于如何从 srt 文件中提取单词并导出到 MS EXCEL的主要内容,如果未能解决你的问题,请参考以下文章

如何从 SubRip .srt 文件中仅提取文本(剥离时间码)?

ffmpeg 将 hdmv pgs 字幕从 mkv 提取到 srt

如何从.srt文件中获取Python中给定时间戳的文本

从 MS Access 导入数据

如何从python上的PDF文件中提取单词的多个实例?

正方体 OCR 文本位置