下列选择中,啥是一种高级语言windows excel
Posted
tags:
篇首语:本文由小常识网(cha138.com)小编为大家整理,主要介绍了下列选择中,啥是一种高级语言windows excel相关的知识,希望对你有一定的参考价值。
Excel文件是常见的数据文件,数据分析过程中经常会用到。有时我们需要用程序代码对 Excel 文件进行一些自动化处理,这需要程序语言能够方便地解析 Excel 数据。
可以用于解析和处理 Excel 文件的程序语言一般有以下几种:
1、 常规高级编程语言,比如 Java
2、 Excel VBA
3、 Python
4、 esProc SPL
本文依次介绍以上几种程序语言解析Excel文件的特点,重点放在如何将Excel文件读出为结构化数据,之后是用来再计算或是入库或是其它用途,就只作简单介绍。
一、 高级语言(以Java为例)
高级语言几乎都可以读取Excel数据文件,但要看有没有第三方提供专业的API来读取,若是没有,就需要程序员自己去了解Excel数据文件的结构,编写程序来读取数据,工作量非常大。幸运的是, Apache为Java提供了开源包poi用以读写Excel文件,它能读取每个单元格的数据和属性。让我们来看看用poi如何将Excel文件读成结构化的数据。
先看一个很简单的文件:第一行是列标题,第二行开始直到最后一行都是数据行。文件内容如下图:
用java调用poi读取数据,写出来的程序是这样:
DataSet ds = null; //此类用来保存从Excel中读取的数据,需要自己编写HSSFWorkbook wb = new HSSFWorkbook( new FileInputStream( "simple.xls" ) );HSSFSheet sheet = wb.getSheetAt( 0 ); //假定要读取的数据在第一个sheet中int rows = sheet.getLastRowNum();int cols = sheet.getRow(0).getLastCellNum();ds = new DataSet( rows, cols );for( int row = 0; row <= rows; row++ )
HSSFRow r = sheet.getRow( row );
for( int col = 0; col <= cols; col++ )
HSSFCell cell = r.getCell( col );
int type = cell.getCellType();
Object cellValue; //单元格数据值对象 switch( type ) //根据单元格数据类型,将格值处理成对应的Java对象 case HSSFCell.CELL_TYPE_STRING:
......
case HSSFCell.CELL_TYPE_NUMERIC:
......
......
//格值处理代码比较长,此处省略
if( row == 0 ) ds.setColTitle( col, (String)cellValue );
else ds.setCellValue( row, col, cellValue );
//如果是第一行,则将格值设成列标题,否则设成数据集单元格数据
这段代码只能读取最简单格式的Excel文件,中间还省略了很多格值处理的代码,但代码已经不短了。如果文件格式更复杂,比如有合并格、复杂的多行表头表尾、数据记录分散于多行、交叉表等,读取数据的程序代码就会变得更长更复杂。
可以看出,即使有了poi这样强大的开源包,使用Java来解析Excel仍然是非常麻烦的。
而且,高级语言只提供比较基础的底层函数,缺乏专业的结构化数据计算函数,比如数据集的过滤、排序、分组统计、连接等,都需要程序员自己去编写,因此即使数据读出来了,但要进行后续的计算,仍然有大量的工作要做。
二、 Excel VBA
VBA(Visual Basic for Applications)是Visual Basic的一种宏语言,主要能用来扩展Windows的应用程序功能,特别是Microsoft Office软件如Word、Excel、Access等。VBA用于Excel的目的是为了增强Excel的灵活性和数据处理能力。VBA可以直接获取单元格的数据,相当于天然有了解析能力,这一点比Java等高级语言方便了很多。但除此之外,它与高级语言一样,仍然缺乏专业的结构化计算函数,读取数据以后的后续计算,还是需要编写大量的程序代码。
比如写一段分组汇总(对sheet1的A列分组,对B列求和)的代码是这样的:
Public Sub test()
Dim Arr
Dim MyRng As Range
Dim i As Long
Dim Dic As Object
Set MyRng = Range("A1").CurrentRegion Set MyRng = MyRng.Offset(1).Resize(MyRng.Rows.Count - 1, 2)
Set Dic = CreateObject("Scripting.dictionary") Arr = MyRng
For i = 1 To UBound(Arr)
If Not Dic.exists(Arr(i, 1)) Then
Dic.Add Arr(i, 1), Arr(i, 2)
Else
Dic.Item(Arr(i, 1)) = Dic.Item(Arr(i, 1)) + Arr(i, 2)
End If
Next i
Sheet2.Range("A1") = "subject" Sheet2.Range("A2").Resize(Dic.Count) = Application.WorksheetFunction.Transpose(Dic.keys) Sheet2.Range("B1") = "subtotal" Sheet2.Range("B2").Resize(Dic.Count) = Application.WorksheetFunction.Transpose(Dic.items) Set Dic = NothingEnd Sub
毕竟我们解析Excel文件是为了后续计算和处理,仅仅解析本身是没有用处的。VBA能天然解析Excel文件,但后续处理能力并不方便。
三、 Python
Python pandas提供了读取Excel文件的接口,对于前述用Java读取的那个简单格式的Excel文件,用Python读取的代码如下:
import pandas as pdfile = 'simple.xls'data = pd.read_excel(file,sheet_name='Sheet1',header=0)
参数header=0表明第一行是列标题,data就是读出来的结构化数据集。
对于表头结构比较复杂的Excel,比如下图:
用Python读取这个文件的程序如下:
import pandas as pdfile = 'complex.xls'data = pd.read_excel(file,sheet_name='Sheet1',header=None,skiprows=[0,1,2,3])data.columns=['No', 'ItemCode', 'ItemName', 'Unit', 'Quantity', 'Price', 'Sum']
在读取时用参数指定没有表头且读数时跳过前面4行,从第5行数据区开始读(如果有表尾,还可以指定忽略最后几行),程序最后一行设置数据集data的列名。
Excel文件中还常有交叉表数据,例如下图:
读取这个交叉表的程序如下:
import pandas as pdfile = 'cross.xls'data = pd.read_excel(file,sheet_name='Sheet1',header=1)data = data.melt(id_vars=['Unnamed: 0'],
value_vars=['West', 'East','Center', 'North','South', 'Northwest','Southwest'],
var_name='Area',
value_name='Amount')data.rename(columns='Unnamed: 0': 'Type')
读出来的data数据如下图:
可以看出来,Python读取Excel文件的代码比较简单,比Java前进了一大步。而且pandas封装了不少结构化数据的处理函数,对于后续计算也比Java和VBA提供了较好的支持。如果是可读入内存的小文件,它可以很简单地处理。
可惜的是,pandas没有针对大文件提供直接分批处理的方法,无论读取还是运算仍然要自己写,非常麻烦。可参考Python 如何处理大文件。
四、 esProc SPL
esProc是专业的数据处理工具,提供了各种读取Excel文件的方法,其脚本语言SPL中封装了丰富的结构化数据计算函数,可以完美地支持各种后续计算、数据导出及入库等工作。
esProc读取Excel文件的程序非常简单,只要写一行代码就可以:
1、 简单格式
=file("simple.xls").xlsimport@t()
选项@t表示第一行是列标题
2、 复杂表头
=file("complex.xls"). xlsimport(;1,5).rename(#1:No,#2:ItemCode,#3:ItemName,
#4:Unit,#5:Quantity,#6:Price,#7:Sum)
参数1,5表示读第1个sheet,从第5行开始读(也可以指定结束行),读数以后再用rename修改列名
3、 交叉表
=file("cross.xls").xlsimport@t(;1,2).rename(#1:Type).pivot@r(Type;Area,Amount)
pivot函数中以Type分组对表数据进行行列转置,选项@r表示将列数据转换为行数据,转换后新的列名分别为“Area”、“Amount”。
从代码上可以看出来,对于解析Excel文件,esProc SPL比Python pandas更为简洁。事实上,SPL做后续处理计算比pandas有更大优势,具体可参考桌面轻量级数据处理脚本。
而且,esProc还可以很方便地进行大文件数据的读取和计算,它提供游标机制,允许数据分析师用类似处理小数据量的语法,直观地处理较大的数据量,程序代码和处理小文件一样简单,比如简单格式的大数据量文件,用游标读数的程序代码是:
=file("big.xlsx").xlsimport@tc()
通过比较,我们可以看到,Python pandas和esProc SPL用于解析Excel文件的代码都很简练,而且也都具备丰富的结构化计算函数,可以实现日常工作中的数据处理。两者相比,esProc SPL更为简洁,并且还能方便地处理大文件。
参考技术A 高级语言(High-level programming language)是一种独立于机器,面向过程或对象的语言。Windows是系统软件,EXCEL是应用软件,都不是高级语言。
实体类在Windows程序中的高级应用--------------------》》心境是一种境界。
一、事务
我们在大家学到这,或多或少对事务都有一些理解了。今天的我也对事务有了更深一层的理解对我来说,我想与大家一起分享一下。
解析: 1.ADO.NET提供了事务处理功能
2.C#中开启事务
3.在咱们的SQL后台就不用开启事务了
4.eg.我要在FrmSW的窗体上添加年级,我们首先在数据库中在年级表中对其GradeName设置唯一约束,如果GradeName重复则事务会将其回滚,如GradeName不重复就会输出。
string str = "data source=.;initial catalog=MySchool;uid=sa;pwd=1"; SqlConnection con = new SqlConnection(str); string sql = "insert into grade values(@gname)"; SqlParameter para = new SqlParameter("@gname", txtName.Text); SqlCommand cmd = new SqlCommand(sql, con); //1.0 必须在连接打开之后,用连接对象con.beginTransaction SqlTransaction tran = con.BeginTransaction(); cmd.Parameters.Add(para); con.Open(); //1.1 将通过con构建出的事务对象和 cmd的Transaction属性绑定 cmd.Transaction = tran; //初始值要给 int count = 0; try { count = cmd.ExecuteNonQuery(); //1.3 提交事务 tran.Commit(); } catch (Exception ex) { //1.4回滚事务 tran.Rollback(); MessageBox.Show(ex.Message); } if (count > 0) { MessageBox.Show("添加成功!"); } con.Close();
知识------------------》在我们断点时想看看它重复是否会回滚我们在数据库中写如下代码:
select * from Grade with(nolock)
二、Msgdiv组件的讲解。
1.Msgdiv类如下
using System; using System.Collections.Generic; using System.Text; using System.Windows.Forms; /// <summary> /// 消息条回调函数委托 /// </summary> public delegate void DGMsgDiv(); /// <summary> /// 消息条类 带Timer计时 /// </summary> public class MsgDiv : System.Windows.Forms.Label { private Timer timerLable = new Timer(); /// <summary> /// 消息回调 委托对象 /// </summary> private DGMsgDiv dgCallBack = null; #region 计时器 /// <summary> /// 计时器 /// </summary> public Timer TimerMsg { get { return timerLable; } set { timerLable = value; } } #endregion #region MsgDiv构造函数 /// <summary> /// MsgDiv构造函数 /// </summary> public MsgDiv() { InitallMsgDiv(7, 7); } /// <summary> /// MsgDiv构造函数 /// </summary> /// <param name="x">定位x轴坐标</param> /// <param name="y">定位y轴坐标</param> public MsgDiv(int x, int y) { InitallMsgDiv(x, y); } #endregion #region 初始化消息条 /// <summary> /// 初始化消息条 /// </summary> private void InitallMsgDiv(int x, int y) { this.AutoSize = true; this.BackColor = System.Drawing.Color.FromArgb(((int)(((byte)(255)))), ((int)(((byte)(255)))), ((int)(((byte)(192))))); this.BorderStyle = System.Windows.Forms.BorderStyle.FixedSingle; //this.ContextMenuStrip = this.cmsList; this.Font = new System.Drawing.Font("宋体", 11F, System.Drawing.FontStyle.Bold, System.Drawing.GraphicsUnit.Point, ((byte)(134))); this.ForeColor = System.Drawing.Color.Red; this.Location = new System.Drawing.Point(x, y); this.MaximumSize = new System.Drawing.Size(980, 525); this.Name = "msgDIV"; this.Padding = new System.Windows.Forms.Padding(7); this.Size = new System.Drawing.Size(71, 31); this.TabIndex = 1; this.Text = "消息条"; this.Visible = false; //给委托添加事件 this.DoubleClick += new System.EventHandler(this.msgDIV_DoubleClick); this.MouseLeave += new System.EventHandler(this.msgDIV_MouseLeave); this.MouseHover += new System.EventHandler(this.msgDIV_MouseHover); this.timerLable.Interval = 1000; this.timerLable.Tick += new System.EventHandler(this.timerLable_Tick); } #endregion #region 将消息条添加到指定容器上 /// <summary> /// 将消息条添加到指定容器上Form /// </summary> /// <param name="form"></param> public void AddToControl(Form form) { form.Controls.Add(this); } /// <summary> /// 将消息条添加到指定容器上GroupBox /// </summary> /// <param name="form"></param> public void AddToControl(GroupBox groupBox) { groupBox.Controls.Add(this); } /// <summary> /// 将消息条添加到指定容器上Panel /// </summary> /// <param name="form"></param> public void AddToControl(Panel panel) { panel.Controls.Add(this); } #endregion //--------------------------------------------------------------------------- #region 消息显示 的相关参数们 hiddenClick,countNumber,constCountNumber /// <summary> /// 当前显示了多久的秒钟数 /// </summary> int hiddenClick = 0; /// <summary> /// 要显示多久的秒钟数 可变参数 /// </summary> int countNumber = 3; /// <summary> /// 要显示多久的秒钟数 固定参数 /// </summary> int constCountNumber = 3; #endregion #region 计时器 显示countNumber秒钟后自动隐藏div -timerLable_Tick(object sender, EventArgs e) private void timerLable_Tick(object sender, EventArgs e) { if (hiddenClick > countNumber - 2) { MsgDivHidden(); } else { hiddenClick++; //RemainCount(); } } #endregion #region 隐藏消息框 并停止计时 +void MsgDivHidden() /// <summary> /// 隐藏消息框 并停止计时 /// </summary> public void MsgDivHidden() { this.Text = ""; this.Visible = false; this.hiddenClick = 0; //this.tslblRemainSecond.Text = ""; if (this.timerLable.Enabled == true) this.timerLable.Stop(); //调用 委托 然后清空委托 if (dgCallBack != null && dgCallBack.GetInvocationList().Length > 0) { dgCallBack(); dgCallBack -= dgCallBack; } } #endregion #region 在消息框中显示消息字符串 +void MsgDivShow(string msg) /// <summary> /// 在消息框中显示消息字符串 /// </summary> /// <param name="msg">要显示的字符串</param> public void MsgDivShow(string msg) { this.Text = msg; this.Visible = true; this.countNumber = constCountNumber;//默认设置显示秒数为10; this.hiddenClick = 0;//重置倒数描述 this.timerLable.Start(); } #endregion #region 在消息框中显示消息字符串 并在消息消失时 调用回调函数 +void MsgDivShow(string msg, DGMsgDiv callback) /// <summary> /// 在消息框中显示消息字符串 并在消息消失时 调用回调函数 /// </summary> /// <param name="msg">要显示的字符串</param> /// <param name="callback">回调函数</param> public void MsgDivShow(string msg, DGMsgDiv callback) { MsgDivShow(msg); dgCallBack = callback; } #endregion #region 在消息框中显示消息字符串 并在指定时间消息消失时 调用回调函数 +void MsgDivShow(string msg, int seconds, DGMsgDiv callback) /// <summary> /// 在消息框中显示消息字符串 并在消息消失时 调用回调函数 /// </summary> /// <param name="msg">要显示的字符串</param> /// <param name="seconds">消息显示时间</param> /// <param name="callback">回调函数</param> public void MsgDivShow(string msg, int seconds, DGMsgDiv callback) { MsgDivShow(msg, seconds); dgCallBack = callback; } #endregion #region 在消息框中显示消息字符串,并指定消息框显示秒数 +void MsgDivShow(string msg, int seconds) /// <summary> /// 在消息框中显示消息字符串,并指定消息框显示秒数 /// </summary> /// <param name="msg">要显示的字符串</param> /// <param name="seconds">消息框显示秒数</param> public void MsgDivShow(string msg, int seconds) { this.Text = msg; this.Visible = true; this.countNumber = seconds; this.hiddenClick = 0;//重置倒数描述 this.timerLable.Start(); } #endregion //--------------------------------------------------------------------------- #region 事件们~~~! msgDIV_MouseHover,msgDIV_MouseLeave,msgDIV_DoubleClick //当鼠标停留在div上时 停止计时 private void msgDIV_MouseHover(object sender, EventArgs e) { if (this.timerLable.Enabled == true) this.timerLable.Stop(); } //当鼠标从div上移开时 继续及时 private void msgDIV_MouseLeave(object sender, EventArgs e) { //当消息框正在显示、回复框没显示、计时器正停止的时候,重新启动计时器 if (this.Visible == true && this.timerLable.Enabled == false) this.timerLable.Start(); } //双击消息框时关闭消息框 private void msgDIV_DoubleClick(object sender, EventArgs e) { MsgDivHidden(); } #endregion }
2. 我们要将其类型放在应用窗体下,为了方便大家以后找,我们应将其新建一个文件夹把这个类放进去。
3.我们在工具类中会发现有这个控件——————————》就是你的类所生成的控件
4.我们将其窗体添加Label控件将其修改为“呵呵”,但是它的样子死板不够漂亮所以我们刚生成的控件就很绚丽我们还可以根据秒数进行更换。
private void Form1_Load(object sender, EventArgs e) { msgDiv1.MsgDivShow("嘿嘿", 3, Test); //MyTool tool = new MyTool(); //List<Grade> list = tool.DataTableToList<Grade>(dt); } public void Test() { MessageBox.Show("Test"); }
这就结束了这个控件,有没有非常的神奇********
三、DataTableToList的使用
1.将MyTool这个类放在MySchool.DAL层
using System; using System.Collections.Generic; using System.Data; using System.Data.SqlClient; using System.Linq; using System.Reflection; using System.Text; using System.Threading.Tasks; namespace MySchool.DAL { public class MyTool { /// <summary> /// DataSetToList /// </summary> /// <typeparam name="T">转换类型</typeparam> /// <param name="dataSet">数据源</param> /// <param name="tableIndex">需要转换表的索引</param> /// <returns></returns> public IList<T> DataTableToList<T>(DataTable dt) { //确认参数有效 if (dt == null ) return null; List<T> list = new List<T>(); for (int i = 0; i < dt.Rows.Count; i++) { //创建泛型对象 T _t = Activator.CreateInstance<T>(); //获取对象所有属性 PropertyInfo[] propertyInfo = _t.GetType().GetProperties(); for (int j = 0; j < dt.Columns.Count; j++) { foreach (PropertyInfo info in propertyInfo) { //属性名称和列名相同时赋值 if (dt.Columns[j].ColumnName.ToUpper().Equals(info.Name.ToUpper())) { if (dt.Rows[i][j] != DBNull.Value) { info.SetValue(_t, dt.Rows[i][j], null); } else { info.SetValue(_t, null, null); } break; } } } list.Add(_t); } return list; } } }
在MySchool.DAL层————————》这个类代替Foreach
public List<Grade> LoadAllGradeToList() { // List<Grade> list = new List<Grade>(); string sql = "select * from grade"; DataTable dt = SQLHelper.ExecuteDataTable(sql);
//代替Foreach
MyTool tool=new MyTool(); List<Grade> list=tool.DataTableToList<Grade>(dt); //将dt转成List<Student> //foreach (DataRow row in dt.Rows) //{ // //每一个row代表表中的一行 所以 一行对应一个年级对象 // Grade grade = new Grade(); // grade.GradeId = Convert.ToInt32(row["gradeid"]); // grade.GradeName = row["gradename"].ToString(); // list.Add(grade); //} return list; }
四、多表数据绑定到同一个DataGridVIew
问题:既显示学生姓名 科目姓名 成绩
解析: 在实体类里创建新的实体类studentExtends:Student科目名称、成绩
在DAL层创建一个名称为StudentDal的类,在此类中定义一个方法LoadStudentInfo()返回值类型List<StudentExtends>
在BLL层调用dal的方法
在UI层后获取到BLL返回的泛型集合
将泛型作为DGV的数据源
public class StudentExtends:Student { //一个是科目名称 public string SubjectName { get; set; } //考试时间 public DateTime ExamDate { get; set; } //成绩 public int StudentResult { get; set; } }
public List<StudentExtends> LoadStudentInfo() { List<StudentExtends> list=new List<StudentExtends>(); string sql = @"select studentname,subjectname,studentresult,examdate from student,subject,result where student.studentno=result.studentno and result.subjectid=subject.subjectid"; DataTable dt=SQLHelper.ExecuteDataTable(sql); foreach (DataRow item in dt.Rows) { //一个item就是表中的一条记录(学生名称,科目名称 ,成绩和时间) //一个游离的 学生对象 StudentExtends stu=new StudentExtends(); stu.StudentName = item["studentname"].ToString(); stu.SubjectName = item["subjectname"].ToString(); stu.StudentResult = Convert.ToInt32(item["studentresult"]); stu.ExamDate = Convert.ToDateTime(item["examdate"]); list.Add(stu); } return list; }
public List<StudentExtends> LoadStudentInfo() { return dal.LoadStudentInfo(); }
private void FrmSelectResult_Load(object sender, EventArgs e) { List<StudentExtends> list= bll.LoadStudentInfo(); dgvResult.DataSource = list; }
以上是关于下列选择中,啥是一种高级语言windows excel的主要内容,如果未能解决你的问题,请参考以下文章
面试官:啥是 YAML?和 Spring Boot 有啥关系?