使用 Modi OCR 从图像中提取文本

Posted

技术标签:

【中文标题】使用 Modi OCR 从图像中提取文本【英文标题】:Using Modi OCR To extract text from image 【发布时间】:2013-09-01 20:18:08 【问题描述】:

我计划在我的项目中使用 OCR,并搜索了更多的 OCR 方法,但我没有找到任何正确的方法。最后我听说了MODI,我试过了。但它抛出以下错误:

由于以下错误,检索具有 CLSID 40942A6C-1520-4132-BDF8-BDC1F71F547B 的组件的 COM 类工厂失败:80040154

我正在使用Microsoft Office 2013visual studio 2012

我使用的代码如下:

 private void button1_Click(object sender, EventArgs e)

    CheckFileType(@"E:\\");


public void CheckFileType(string directoryPath) 
 
    IEnumerator files = Directory.GetFiles(directoryPath).GetEnumerator(); 
    while (files.MoveNext()) 
     
    //get file extension 
    string fileExtension = Path.GetExtension(Convert.ToString(files.Current));

    //get file name without extenstion 
    string fileName=Convert.ToString(files.Current).Replace(fileExtension,string.Empty);

    //Check for JPG File Format 
    if (fileExtension == ".jpg" || fileExtension == ".JPG") // or // ImageFormat.Jpeg.ToString()
     
    try 
     
    //OCR Operations ... 
    MODI.Document md = new MODI.Document(); 
    md.Create(Convert.ToString(files.Current)); 
    md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true); 
    MODI.Image image = (MODI.Image)md.Images[0];
    //create text file with the same Image file name 
    FileStream createFile = new FileStream(fileName + ".txt",FileMode.CreateNew);

    //save the image text in the text file 
    StreamWriter writeFile = new StreamWriter(createFile); 
    writeFile.Write(image.Layout.Text); 
    writeFile.Close(); 
     
    catch (Exception) 
     
    MessageBox.Show("This Image hasn't a text or has a problem", 
    "OCR Notifications", 
    MessageBoxButtons.OK, MessageBoxIcon.Information); 
     
     
     
 

任何人都可以帮助我吗?这个问题是基于 Microsoft Office 版本还是我需要进行任何更改?这会更好吗OCRdll?谢谢..

【问题讨论】:

【参考方案1】:

错误的原因是 Microsoft Office Document Imaging(MODI) 已在 MS Office 2010 中停止使用。这是与 Office 2013 中的 OneNote 协作的。

即使我仍在寻找解决方案,或者是否有任何其他工具可以以编程方式从图像中提取文本。如果您知道或有解决方案,请分享。

【讨论】:

以上是关于使用 Modi OCR 从图像中提取文本的主要内容,如果未能解决你的问题,请参考以下文章

C#MODI错误:图像中的OCR文本

如何使用 OpenCV 从图像中提取文本行

检测具有轮廓的文本区域后从图像中提取文本

请问用啥方法单独安装MODI(不重新安装office2003),来调用MODI的OCR引擎的啊?0分

基于百度OCR提取图像中的文本

如何从图像中提取所需的文本部分,而不是使用 OCR 提取图像中的所有文本?