ruby 维基百科とHatena的のキーワードファイルから仲裁处の辞书フォーマット(CSV)に変换するスクリプト。

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了ruby 维基百科とHatena的のキーワードファイルから仲裁处の辞书フォーマット(CSV)に変换するスクリプト。相关的知识,希望对你有一定的参考价值。

# 下記ページのコードを一部修正したものです.
# http://sugamasao.hatenablog.com/entry/2014/11/17/000355

require 'csv'

original_data = {
  'wikipedia' => 'jawiki-latest-all-titles-in-ns0',
  'hatena' => 'keywordlist_furigana.csv'
}

CSV.open("onomasticon.csv", 'w') do |csv|
  original_data.each do |type, filename|
    next unless File.file? filename
    open(filename).each do |title|
      title.strip!

      next if title =~ %r(^[+-.$()?*/&%!"'_,]+)
      next if title =~ /^[-.0-9]+$/
      next if title =~ /曖昧さ回避/
      next if title =~ /_\(/
      next if title =~ /^PJ:/
      next if title =~ /の登場人物/
      next if title =~ /一覧/

      title_length = title.length

      if title_length > 3
        score = [-36000.0, -400 * (title_length ** 1.5)].max.to_i
        csv << [title, nil, nil, score, '名詞', '一般', '*', '*', '*', '*', title, '*', '*', type]
      end
    end
  end
end

以上是关于ruby 维基百科とHatena的のキーワードファイルから仲裁处の辞书フォーマット(CSV)に変换するスクリプト。的主要内容,如果未能解决你的问题,请参考以下文章

sh あるキーワードを含むファイル,を使用しているファイルを検索する

markdown SHIFT_JIS(CP932)のアップロードファイルを滑轨で読み込む

csharp [ファイル移动と自动リネーム] #ExtensionMethod

html フォームでのファイルの选択と同时にアップロード开始(jQuery form plugin)

ruby 机械化による诊断メーカーの情报取得とオストンインゲーム例

ruby ファイルリネーム