大家在看到好的网页时,一定会想办法把它保存下来。通常我们都是利用IE本身的保存功能。在IE“文件/另存为”对话框的“保存类型”中,一共为我们提供了四种选择:“网页,全部(*.htm,*html)”、“Web档案,单一文件(*.mht)”、“网页,仅html(*.htm,*html)”以及“文本文件(*.txt)”。但在很多时候,我们使用IE的网页保存功能保存网页时总会出现这样或那样的错误。或是长时间显示“正在保存……”却久无进展;或是表面上好像保存成功了,但当你想脱机浏览时,才发现得到的是无效或错误网页。那么除了IE之外,还有没有其他的方法保存网页呢?嘿嘿,别急,最近小弟就发现了一种非常方便的网页保存方法,一起分享一下吧…
其实,我所说的方法就是利用文通鉴中的paperport软件来抓取网页。paperport还能抓取网页?没错,作为一款文档管理软件,paperport为用户提供了丰富的功能,而网页快照无疑是其中最实用的功能之一。
打开paperport,点击“工具栏”中的网页快照,这时在屏幕的任务栏中就会出现网页快照的图标,这时你就可以抓取网页喽

打开浏览器,找到自己喜欢的网页,然后点击“网页快照”的图标,这时,系统会自动提示“抓取整个网页”,还是“抓取可见部分”,你可以根据自己需要进行选择,并点击相应的选项。顷刻之间,网页就自动保存在paperport文件夹中了。
需要说明的是,利用这种方式保存的网页并不是传统的htm格式,而是paperport的MAX图形格式,这种格式除了能够很好的再现网页原貌之外,还能自动保存原始链接,也就是说用户在希望浏览网页链接的时候,只要单击屏幕上方的 按钮,系统就会自动跳转到IE浏览器,打开网页的原始界面。

而除了MAX格式之外,用户还可以通过选项设置,将存储格式设定为PDF格式或双层PDF格式。

相信PDF格式大家都知道,而双层PDF就是利用OCR识别技术,在原有图像层的下面增加相应的文字层。因此,对于一些不让用户复制文字的网页,保存成双层PDF格式则最方便不过了。而提取文本的的方式非常简单,只要点击“文件属性”――“查看文本”就能查看和复制了。
查看“双层PDF格式”的文本

说了这么多,相信大家一定觉得paperport保存网页的功能很神奇吧~~,如果你厌烦了IE传统的保存方式,如果你希望追求更高效的网页管理方式,就不妨体验一下文通鉴的paperport,也许会给你带来不少惊喜呢!