带有列名的 DataReader 到 .CSV

Posted

技术标签:

【中文标题】带有列名的 DataReader 到 .CSV【英文标题】:DataReader to .CSV with column names 【发布时间】:2015-06-16 04:00:42 【问题描述】:

我正在从 SqlDataReader 生成一个 csv 文件,但是它没有写入列名,我怎样才能让它写入它们?我使用的代码如下:

SqlConnection conn = new SqlConnection(myconn);
SqlCommand cmd = new SqlCommand("dbo.test", conn);
cmd.CommandType = CommandType.StoredProcedure;
conn.Open();
SqlDataReader reader = cmd.ExecuteReader();

StringBuilder sb = new StringBuilder();
StreamWriter sw = new StreamWriter(myfilePath + "testfile.csv"); 
while (reader.Read())

    for (int i = 0; i < reader.FieldCount; i++)
    
        string value = reader[i].ToString();
        if (value.Contains(","))
            value = "\"" + value + "\"";

        sb.Append(value.Replace(Environment.NewLine, " ") + ",");
    
    sb.Length--; // Remove the last comma
    sb.AppendLine();

conn.Close();
sw.Write(sb.ToString());
sw.Close();

【问题讨论】:

***.com/questions/681653/…的可能重复 【参考方案1】:

读取所有列名并将其附加到sb,然后迭代阅读器。

SqlDataReader reader = cmd.ExecuteReader();
StringBuilder sb = new StringBuilder();

//Get All column 
var columnNames = Enumerable.Range(0, reader.FieldCount)
                        .Select(reader.GetName) //OR .Select("\""+  reader.GetName"\"") 
                        .ToList();

//Create headers
sb.Append(string.Join(",", columnNames));

//Append Line
sb.AppendLine();

while (reader.Read())
....

【讨论】:

我认为如果字段名称中有逗号,这可能会出现一些问题。【参考方案2】:

使用这个solution 我创建了一个扩展。

/// <summary>
/// 
/// </summary>
/// <param name="reader"></param>
/// <param name="filename"></param>
/// <param name="path">if null/empty will use IO.Path.GetTempPath()</param>
/// <param name="extension">will use csv by default</param>
public static void ToCsv(this IDataReader reader, string filename, string path = null, string extension = "csv")

    int nextResult = 0;
    do
    
        var filePath = Path.Combine(string.IsNullOrEmpty(path) ? Path.GetTempPath() : path, string.Format("0.1", filename, extension));
        using (StreamWriter writer = new StreamWriter(filePath))
        
            writer.WriteLine(string.Join(",", Enumerable.Range(0, reader.FieldCount).Select(reader.GetName).ToList()));
            int count = 0;
            while (reader.Read())
            
                writer.WriteLine(string.Join(",", Enumerable.Range(0, reader.FieldCount).Select(reader.GetValue).ToList()));
                if (++count % 100 == 0)
                
                    writer.Flush();
                
            
        

        filename = string.Format("0-1", filename, ++nextResult);
    
    while (reader.NextResult());

【讨论】:

嗨,我已经阅读了你的函数,它对创建 csv 非常有帮助。但是,它不考虑包含 " 或 , 的行。它们会破​​坏 CSV 上的验证。【参考方案3】:

可以使用SqlDataReader.GetName获取列名

for (int i = 0; i < reader.FieldCount; i++)

    string columnName = reader.GetName(i);

您还可以创建如下扩展方法:

public static List<string> ToCSV(this IDataReader dataReader, bool includeHeaderAsFirstRow, string separator)

    List<string> csvRows = new List<string>();
    StringBuilder sb = null;

    if (includeHeaderAsFirstRow)
    
        sb = new StringBuilder();
        for (int index = 0; index < dataReader.FieldCount; index++)
        
            if (dataReader.GetName(index) != null)
                sb.Append(dataReader.GetName(index));

            if (index < dataReader.FieldCount - 1)
                sb.Append(separator);
        
        csvRows.Add(sb.ToString());
    

    while (dataReader.Read())
    
        sb = new StringBuilder();
        for (int index = 0; index < dataReader.FieldCount - 1; index++)
        
            if (!dataReader.IsDBNull(index))
            
                string value = dataReader.GetValue(index).ToString();
                if (dataReader.GetFieldType(index) == typeof(String))
                
                    //If double quotes are used in value, ensure each are replaced but 2.
                    if (value.IndexOf("\"") >= 0)
                        value = value.Replace("\"", "\"\"");

                    //If separtor are is in value, ensure it is put in double quotes.
                    if (value.IndexOf(separator) >= 0)
                        value = "\"" + value + "\"";
                
                sb.Append(value);
            

            if (index < dataReader.FieldCount - 1)
                sb.Append(separator);
        

        if (!dataReader.IsDBNull(dataReader.FieldCount - 1))
            sb.Append(dataReader.GetValue(dataReader.FieldCount - 1).ToString().Replace(separator, " "));

        csvRows.Add(sb.ToString());
    
    dataReader.Close();
    sb = null;
    return csvRows;

示例:

List<string> rows = null;
using (SqlDataReader dataReader = command.ExecuteReader())
    
        rows = dataReader.ToCSV(includeHeadersAsFirstRow, separator);
        dataReader.Close();
    

【讨论】:

我想我喜欢你的实现并且会使用一些修改(比如,返回一个字符串而不是字符串列表,并且还实现类似的扩展以直接创建文件)。您在生产环境中对这段代码的测试情况如何?【参考方案4】:

我开发了以下高性能扩展

static void Main(string[] args)
        
            SqlConnection sqlCon = new SqlConnection("Removed");
            sqlCon.Open();
            SqlCommand sqlCmd = new SqlCommand("Select * from Table", sqlCon);
            SqlDataReader reader = sqlCmd.ExecuteReader();
            string csv=reader.ToCSVHighPerformance(true);
            File.WriteAllText("Test.CSV", csv);
            reader.Close();
            sqlCon.Close();
        

扩展:

public static string ToCSVHighPerformance(this IDataReader dataReader, bool includeHeaderAsFirstRow = true,
            string separator = ",")
        
            DataTable dataTable = new DataTable();
            StringBuilder csvRows = new StringBuilder();
            string row = "";
            int columns ;
            try
            
                dataTable.Load(dataReader);
                columns= dataTable.Columns.Count;
                //Create Header
                if (includeHeaderAsFirstRow)
                
                    for (int index = 0; index < columns; index++)
                    
                        row += (dataTable.Columns[index]);
                        if (index < columns - 1)
                            row += (separator);
                    
                    row += (Environment.NewLine);
                
                csvRows.Append(row);

                //Create Rows
                for (int rowIndex = 0; rowIndex < dataTable.Rows.Count; rowIndex++)
                
                    row = "";
                    //Row
                    for (int index = 0; index < columns - 1; index++)
                    
                        string value = dataTable.Rows[rowIndex][index].ToString();

                        //If type of field is string
                        if (dataTable.Rows[rowIndex][index] is string)
                        
                            //If double quotes are used in value, ensure each are replaced by double quotes.
                            if (value.IndexOf("\"") >= 0)
                                value = value.Replace("\"", "\"\"");

                            //If separtor are is in value, ensure it is put in double quotes.
                            if (value.IndexOf(separator) >= 0)
                                value = "\"" + value + "\"";

                            //If string contain new line character
                            while (value.Contains("\r"))
                            
                                value = value.Replace("\r", "");
                            
                            while (value.Contains("\n"))
                            
                                value = value.Replace("\n", "");
                            
                        
                        row += value;
                        if (index < columns - 1)
                            row += separator;
                    
                    dataTable.Rows[rowIndex][columns - 1].ToString().ToString().Replace(separator, " ");
                    row += Environment.NewLine;
                    csvRows.Append(row);
                
            
            catch (Exception ex)
            
                throw ex;
            
            return csvRows.ToString();
        

【讨论】:

您在遍历它们时缺少最后一列。应该是 for (int index = 0; index &lt; columns; index++) 而不是 for (int index = 0; index &lt; columns - 1; index++) 抱歉,您不应将此称为高性能解决方案,因为使用 datatable.Load(IDatareader) 这消除了 DataReader 的主要优点 - DataReader 提供了一个无缓冲的数据流,允许程序逻辑来有效地按顺序处理来自数据源的结果。在检索大量数据时,DataReader 是一个不错的选择,因为数据没有缓存在内存中。 MS Docs。这个解决方案在巨大的结果集上会很慢 当你的数据库服务器和iis服务器不相同时,网络传播时间会影响你的性能。如果没有 datatable.Load,每行您只能从数据库服务器获得一行(对于 1000 行,您有 1000* 网络传播时间),但是通过 datatable.Load(IDatareader),对于每个读取请求(读取请求处理的数量由 .加载函数并取决于行大小和网络包大小)你会得到很多行,这个问题减少了网络传播时间。 @Nigje,很抱歉,@Baximilian 就在这里。而你所比较的没有意义。如果我们相信您的前提,也不能保证datatable.Load 也不会逐行获取数据。我认为您没有将 DataTable 用于它的用途:流式传输大量数据并在传入时以谨慎的数据包对其进行处理,而不是在服务器、客户端和网络上施加巨大的负载并将所有数据加载到内存,然后处理它。这可能会产生许多不良的副作用,例如资源争用、锁定、低并发、OOM 等。【参考方案5】:

您可以使用SqlDataReader.GetName 方法获取列的名称,如下所示:

for(int i = 0; i < reader.FieldCount; i++)

    string columnName = reader.GetName(i);

【讨论】:

以上是关于带有列名的 DataReader 到 .CSV的主要内容,如果未能解决你的问题,请参考以下文章

具有重复列名的 DataReader

C# 面板上带有 DataReader 和 TextBox 控件的Repeater控件

获取SqlDataReader的列名

如何正确地将 DataReader 转换为 DTO/List<DTO>? [复制]

使用 datareader 用数据库多列中的数据填充文本框

使用 bcp 实用程序和 SQL Server 2008 将表导出到带有列标题(列名)的文件