Python中将CSV文件转换为H5AD文件

Posted 刘亚军的技术基地

tags:

篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了Python中将CSV文件转换为H5AD文件相关的知识,希望对你有一定的参考价值。

将CSV文件转换为H5AD文件,可以按照以下步骤进行:

  1. 使用pandas库将CSV文件读入到Python中,并将其转换为dataframe格式:
 
import pandas as pd df = pd.read_csv(\'data.csv\')
  1. 使用anndata库将dataframe转换为AnnData对象:
 
import anndata as ad adata = ad.AnnData(df)
  1. 将AnnData对象保存为H5AD文件:
 
adata.write(\'data.h5ad\')

这样就可以将CSV文件转换为H5AD文件了。需要注意的是,在转换过程中需要确保数据格式正确,并根据实际需求对数据进行适当的预处理和清洗。

在c#中将XML文件转换为csv文件格式

【中文标题】在c#中将XML文件转换为csv文件格式【英文标题】:Convert XML file to csv file format in c# 【发布时间】:2016-06-08 07:20:57 【问题描述】:

我正在使用accord.net 鼠标手势识别示例应用程序,它以上述xml 格式保存文件。我需要帮助将上述 xml 转换为 CSV 格式,以便我可以使用accord.net 动态时间扭曲进行机器学习。我不知道如何转换成 csv 文件。

例如:261,210,261,214,261,229,261,231

<?xml version="1.0"?>
<ArrayOfSequence xmlns:xsd="http://www.w3.org/2001/XMLSchema" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance">
  <Sequence>
    
    <SourcePath>
      <Point>
        <X>261</X>
        <Y>210</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>214</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>227</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>229</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>231</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>234</Y>
      </Point>
      <Point>
        <X>261</X>
        <Y>237</Y>
      </Point>
</Sequence>
</ArrayOfSequence>

【问题讨论】:

为什么要使用 XML 序列化? 我在accord.net框架网站上找到了使用XML序列化来保存文件的源代码。 我尝试另存为 csv 但不能。 解析 XML,写入 CSV 文件。你不清楚哪一部分? 我想写入 CSV。 【参考方案1】:

将 XML 直接转换为 CSV 是一项有点复杂的任务。取而代之的是,您可以先将 XML 转换为 DataSet,然后再转换为 CSV:

    将 XML 转换为数据集:

    DataSet ds = new DataSet();
    
    ds.ReadXml(fileNamePath);
    

    将数据表转换为 CSV。

    链接:c# datatable to csv

【讨论】:

【参考方案2】:

在另一种方式中,您可以利用 XSLT 的强大功能对其进行转换,

步骤

创建一个 Xml 样式表以将 xml 转换为 csv 使用XslCompiledTransform()转换得到csv字符串 将 csv 字符串保存到文件中

你可能想出了一个像这样的 Xslt,称之为 data.xsl

<?xml version="1.0" encoding="UTF-8"?>
<xsl:stylesheet version="1.0" xmlns:xsl="http://www.w3.org/1999/XSL/Transform">
  <xsl:output method="text" version="1.0" encoding="UTF-8"/>
  <xsl:template match="/">
    <xsl:for-each select="//Point">
      <xsl:value-of select="X"/>,<xsl:value-of select="Y"/>
      <xsl:text>&#xD;&#xA;</xsl:text>
    </xsl:for-each>
  </xsl:template>
</xsl:stylesheet>

并使用以下方法

public static string ToCSV(string xmlTextDate, string xsltFile)

  string result = string.Empty;
  var xpathDoc = new XPathDocument(xmlTextDate);
  var xsltTransform = new System.Xml.Xsl.XslCompiledTransform();
  xsltTransform.Load(xsltFile);

  using (MemoryStream ms = new MemoryStream())
  
      var writer = new XmlTextWriter(ms, Encoding.UTF8);
      using (var rd = new StreamReader(ms))
      
          var argList = new System.Xml.Xsl.XsltArgumentList();
          xsltTransform.Transform(xpathDoc, argList, writer);
          ms.Position = 0;
          result = rd.ReadToEnd();
      
  
  return result;

然后这样称呼它

var csvString = ToCSV("yourfile.xml","data.xsl");

【讨论】:

【参考方案3】:
using System.IO;
using System.Xml.Serialization;

你可以这样做:

public class Sequence

    public Point[] SourcePath  get; set; 


using (FileStream fs = new FileStream(@"D:\youXMLFile.xml", FileMode.Open))

    XmlSerializer serializer = new XmlSerializer(typeof(Sequence[]));
    var data=(Sequence[]) serializer.Deserialize(fs);
    List<string> list = new List<string>();
    foreach(var item in data)
    
        List<string> ss = new List<string>();
        foreach (var point in item.SourcePath) ss.Add(point.X + "," + point.Y);
        list.Add(string.Join(",", ss));
    
    File.WriteAllLines("D:\\csvFile.csv", list);

【讨论】:

以上代码写入 csv 文件为 X=261,Y=210,X=261,Y=214,X=261,Y=227,X=261 ,Y=229。我需要我的积分为 261,210,261,214,261,227,261,229 所以这作为一个通用解决方案有点错误,因为它不会转义逗号或引号。 @Rob 这个答案是针对特定问题的,而不是针对一般问题的。【参考方案4】:

只需创建一个 XML 的 csv 文件,使用 System.IO 并确保该文件类似于

fileName = Name + ".csv"

阅读并寻找类似的东西

Path.GetTempPath(), fileName

我有点粗略,但这应该会让你走上正轨

【讨论】:

我试过了,但没用。我只需要 csv 文件中的 x 和 y 坐标。 例如:261,210,261,214,261,231,261,234 我不确定确切的语法,但它应该与此有关 这距离回答 OP 的问题还差得很远。 filename 将类似于 "Name.csv"Path.GetTempPath() 给出 返回当前用户的临时文件夹的路径,不会将 xml 转换为 csv。考虑编辑你的帖子,否则你会一直被否决。

以上是关于Python中将CSV文件转换为H5AD文件的主要内容,如果未能解决你的问题,请参考以下文章

在 Python 中将 .dbf 批量转换为 .csv

在 Python 中将 .mdb 文件转换为 .csv 时包括列名

如何在 Python 中将 Azure Blob 文件 CSV 转换为 Excel

在 Python 中将嵌套的 JSON 转换为 CSV 文件

在 python 中将多个 excel '.xlsx' 转换为 '.csv' 文件时,我得到了额外的列?

使用python在django中将数据库转换为csv