插入表单时如何删除 Word 标记废话?

Posted

技术标签:

【中文标题】插入表单时如何删除 Word 标记废话?【英文标题】:How do I remove Word markup crap when inserting to a form? 【发布时间】:2010-09-28 07:46:32 【问题描述】:

我正在用 php 构建一个 CMS,我担心用户必须从现有的 Word(和 Excel,但不要介意)文档中填写数据。现在,我看到了当他们不小心从 Word 复制粘贴到 textarea 时会发生什么:数据库中充满了垃圾标记。

现在,我当然可以自己剥离所有标记,但我必须先开始了解它。所以我问你:你有没有测试过一些有用的功能——常见的插件(tinyMCE、FCKeditor 等)在这里有帮助?侵入性最小的解决方案的奖励。

【问题讨论】:

【参考方案1】:

遗憾的是,我使用过的大多数 html 编辑器控件:

    有一个按钮可以去除各种标记元素(word、html、脚本等) 通过 javascript 去除粘贴时的所有标记。

如果你把它留给一个按钮,那么通常非技术用户会忘记按下它,因为他们不(有人会说“不应该”)关心它:(

稍微玩一下正则表达式(现在您遇到了另一个问题;))您可以执行类似于 2 的操作,但仅针对 word xml。

【讨论】:

【参考方案2】:

我发现 FCKEditor 可以处理从 Word 文档中拉出并扔给它的文本,比 tinyMCE 好得多。

【讨论】:

我在问题中谈到的现有网站已经使用了 FCK,尽管不是最新版本。这是最近的改进吗? @Moranar:我不能说。我使用的是 2.6.3 版。只是在使用 tinyMCE 时,我发现很难正确编辑从 Word 文档中复制的文本。相比之下,FCKEditor 没有任何这些问题。 从 Word 粘贴功能已经有一段时间了。不知道要多久。当用户使用浏览器 Edit->Paste 或 Ctrl+V 时,它还会自动执行 Word 粘贴。【参考方案3】:

好的,我发现 a plugin for TinyMCE 显然符合我的要求。尽管如此,这仍要求用户按下按钮进行粘贴,这有点不太理想。有更好的吗?

【讨论】:

【参考方案4】:

ASP.NET? Telerik 的 RadEditor 对我来说效果很好

【讨论】:

以上是关于插入表单时如何删除 Word 标记废话?的主要内容,如果未能解决你的问题,请参考以下文章

word怎么删除回车符号 word如何删除回车符号

如何删除word最后一页空白页?

Mathtype6.7在word2003中公式自动编号,目录中出现标记如何删除,Equation Chapter 1 Section 1

Word打印预览时出现空白页怎么回事、如何删除?

Word宏用于仅从某些表格单元格中删除颜色

word 前两页和后面格式不一样