插入表单时如何删除 Word 标记废话?
Posted
技术标签:
【中文标题】插入表单时如何删除 Word 标记废话?【英文标题】:How do I remove Word markup crap when inserting to a form? 【发布时间】:2010-09-28 07:46:32 【问题描述】:我正在用 php 构建一个 CMS,我担心用户必须从现有的 Word(和 Excel,但不要介意)文档中填写数据。现在,我看到了当他们不小心从 Word 复制粘贴到 textarea 时会发生什么:数据库中充满了垃圾标记。
现在,我当然可以自己剥离所有标记,但我必须先开始了解它。所以我问你:你有没有测试过一些有用的功能——常见的插件(tinyMCE、FCKeditor 等)在这里有帮助?侵入性最小的解决方案的奖励。
【问题讨论】:
【参考方案1】:遗憾的是,我使用过的大多数 html 编辑器控件:
-
有一个按钮可以去除各种标记元素(word、html、脚本等)
通过 javascript 去除粘贴时的所有标记。
如果你把它留给一个按钮,那么通常非技术用户会忘记按下它,因为他们不(有人会说“不应该”)关心它:(
稍微玩一下正则表达式(现在您遇到了另一个问题;))您可以执行类似于 2 的操作,但仅针对 word xml。
【讨论】:
【参考方案2】:我发现 FCKEditor 可以处理从 Word 文档中拉出并扔给它的文本,比 tinyMCE 好得多。
【讨论】:
我在问题中谈到的现有网站已经使用了 FCK,尽管不是最新版本。这是最近的改进吗? @Moranar:我不能说。我使用的是 2.6.3 版。只是在使用 tinyMCE 时,我发现很难正确编辑从 Word 文档中复制的文本。相比之下,FCKEditor 没有任何这些问题。 从 Word 粘贴功能已经有一段时间了。不知道要多久。当用户使用浏览器 Edit->Paste 或 Ctrl+V 时,它还会自动执行 Word 粘贴。【参考方案3】:好的,我发现 a plugin for TinyMCE 显然符合我的要求。尽管如此,这仍要求用户按下按钮进行粘贴,这有点不太理想。有更好的吗?
【讨论】:
【参考方案4】:ASP.NET? Telerik 的 RadEditor 对我来说效果很好
【讨论】:
以上是关于插入表单时如何删除 Word 标记废话?的主要内容,如果未能解决你的问题,请参考以下文章
Mathtype6.7在word2003中公式自动编号,目录中出现标记如何删除,Equation Chapter 1 Section 1