設(shè)為首頁收藏本站Access中國

Office中國論壇/Access中國論壇

 找回密碼
 注冊(cè)

QQ登錄

只需一步,快速開始

把Word轉(zhuǎn)為簡(jiǎn)潔的html的若干種方法

2007-8-10 10:07| 發(fā)布者: admin| 查看: 1191| 評(píng)論: 0

        Word可以直接另存為 htm,但即使是 另存為 Html 也會(huì)有大量的廢代碼。以前我一般用 dreamweaver 的 clean up html 來處理,先處理 word 特有標(biāo)簽,然后刪除一些 font,b,span 等。進(jìn)一步,在 editplus 里面用正則進(jìn)行處理,最后得到我想要的干凈的html 代碼。當(dāng)然最完美的辦法就是拷貝文字出來,自己用文本編輯器書寫htm標(biāo)簽,:)

今天又看到lifehacker這幾種word 2 clean htm方法:

1.使用這個(gè)HTML Tidy Library Project開源軟件來處理。

2.微軟官方站點(diǎn)也有個(gè)Office 2000 HTML Filter 2.0工具,可以用來處理掉word2000轉(zhuǎn)html時(shí)出現(xiàn)的多余代碼。

3.使用這個(gè)Word HTML Cleaner 在線工具來處理。只能處理word2000以下版本。

4.有人給出了正則表達(dá)式(其實(shí),上面的各種軟件也都是用正則來解決的)

刪除不需要的標(biāo)簽

<[/]?(fontspanXML[ovwXP]:w+)[^>]*?>
- replace any matches with the empty string

刪除class,style...等不需要的屬性

<([^>]*)(?:classlangstylesizeface[ovwxp]:w+)=(?:'[^']*'""[^""]*""[^>]+)([^>]*)>
- replace any matches with <$1$2>

 

最新評(píng)論

相關(guān)分類

QQ|站長(zhǎng)郵箱|小黑屋|手機(jī)版|Office中國/Access中國 ( 粵ICP備10043721號(hào)-1 )  

GMT+8, 2025-7-13 08:33 , Processed in 0.078422 second(s), 16 queries .

Powered by Discuz! X3.3

© 2001-2017 Comsenz Inc.

返回頂部