使用tohash.select时,如何用字符串替换空值?

Posted

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了使用tohash.select时,如何用字符串替换空值?相关的知识,希望对你有一定的参考价值。

如果我不清楚,请原谅我,但这很难用语言描述。我正在使用Ruby for Rails应用程序逐行从CSV文件中获取值,使用Ruby的tohash.select函数生成每行的所有键值对的哈希表,然后使用create function生成行的表。

该代码适用于从CSV创建数据库表,但CSV中的许多记录对于某些字段/列具有空值。我想在将CSV中的每一行插入哈希表时将这些空值转换为类似“null”的字符串。

我已经尝试使用正则表达式用字符串替换空值,但它没有奏效。我很可能只是做错了。

require 'csv'

fields = %w{lVoterUniqueID sAffNumber szStateVoterID sVoterTitle szNameLast szNameFirst szNameMiddle sNameSuffix sGender szSitusAddress szSitusCity sSitusState sSitusZip sHouseNum sUnitAbbr sUnitNum szStreetName sStreetSuffix sPreDir sPostDir szMailAddress1 szMailAddress2 szMailAddress3 szMailAddress4 szMailZip szPhone szEmailAddress dtBirthDate sBirthPlace dtRegDate dtOrigRegDate dtLastUpdate_dt sStatusCode szStatusReasonDesc sUserCode1 sUserCode2 iDuplicateIDFlag szLanguageName szPartyName szAVStatusAbbr szAVStatusDesc szPrecinctName sPrecinctID sPrecinctPortion sDistrictID_0 iSubDistrict_0 szDistrictName_0 sDistrictID_1 iSubDistrict_1 szDistrictName_1 sDistrictID_2 iSubDistrict_2 szDistrictName_2 sDistrictID_3 iSubDistrict_3 szDistrictName_3 sDistrictID_4 iSubDistrict_4 szDistrictName_4 sDistrictID_5 iSubDistrict_5 szDistrictName_5}

if Rails.env.production?
  CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'iso-8859-1:utf-8', headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
elsif Rails.env.development?
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
else
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
  voter_row = row.to_hash.select { |k, v| fields.include?(k)}
  Voter.create!(voter_row.to_hash.symbolize_keys)
end
end

无论我在哪里使用row.tohash.select,我都想用空字符串替换空值,这样哈希表中的每个键都有一个对应的字符串(如果没有值,则为“null”)。

答案

Hash#transform_values方法以干净和惯用的方式完成工作。我还建议使用Hash#slice而不是#select

...
CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'iso-8859-1:utf-8', headers: true) do |row|
  attrs = row.to_hash.slice(*fields).transform_values { |v| v || "null" }
  Voter.create!(attrs)
end
...

但说实话,在实践中,我会提出另一种解决方案 - 如果可能的话,使用数据库列的默认值,而不是在应用程序级别上“规范化”数据。

另一答案

您必须迭代值并在适当的位置设置它们。

if Rails.env.production?
  CSV.foreach(Dir.pwd + "/db/prod.csv", encoding: 'utf-8', headers: true) do |row|
    voter_row = row.to_hash.select { |k, v| fields.include?(k)}
    voter_row.each do |key, value|
      if value.nil?
        voter_row[key] = "null"
      end
    end
    Voter.create!(voter_row.to_hash.symbolize_keys)
  end
else
  CSV.foreach(Dir.pwd + "/db/Cntywd_020819.csv", headers: true) do |row|
  voter_row = row.to_hash.select { |k, v| fields.include?(k)}
  voter_row.each do |key, value|
    if value.nil?
      voter_row[key] = "null"
    end
  end
  Voter.create!(voter_row.to_hash.symbolize_keys)
end

我也认为你的elseif / else是多余的,除非我遗漏了什么。

另一答案

这听起来像是Hash#transform_values的工作:

h = voter_row.transform_values { |v| v.nil?? 'null' : v }

结合其他事情:

  1. 您可能想要使用Hash#slice而不是#selectvoter_row = row.to_h.slice(*fields)
  2. create对字符串键很满意,所以你不需要调用#symbolize_keys

您可以将CSV.foreach块简化为:

Voter.create!(row.to_h.slice(*fields))

你可以走得更远,写道:

opts = { headers: true }
if Rails.env.production?
  csv_file = 'db/prod.csv'
  opts[:encoding] 'iso-8859-1:utf-8'
elsif Rails.env.development?
  csv_file = 'db/Cntywd_020819.csv'
else
  csv_file = 'db/Cntywd_020819.csv'
end
CSV.foreach(Rails.root.join(csv_file), opts) do |row|
  Voter.create!(row.to_h.slice(*fields))
end

以上是关于使用tohash.select时,如何用字符串替换空值?的主要内容,如果未能解决你的问题,请参考以下文章

如何用包含空格的字符串替换列表中的项目?

如何用 Greasemonkey 的用户脚本替换 JSON 字符串中的文本

如何用C中#define宏中的字符串常量替换函数名

使用 regexp_replace 如何用异常替换字符串

如何用BAT替换文本的字符串?

字符串操作:如何用特定模式替换字符串