将HTML文档转换成文本文档
如果想将HTML 文档转换成文本文档,下面有两种方法供大家参考。
操作方法
- 01
(一) 使用浏览器转换HTML文件 如果是在Netscape浏览器浏览网上文件过程中,可以在浏览器File 菜单中选择Save As ,在“存为类型”下拉框中选择“Plain Text (*.txt)”,可以将HTML 文件直接存为TXT文件。注意:如果“文件名”中不加入.TXT 后缀的话,Netscape 4.0以前的版本中将不会自动加*.TXT 后缀,也就是说下载后的文件并不标识为TXT文件。对于已经下载的文件,可以从浏览器的“File”菜单中选择“Ope n page”,打开硬盘上的HTML文件后,选择“FILE”菜单中的“SAVE AS”,将其另存为文本文件。用 IE转换文件的过程与上相类似。
- 02
(二)用HTMASC进行HTML到TXT文件的转换 运行HTMASC(笔者使用的是HTMASC32,版本2.2),在 “FILE” 菜单中选定“Ope n”打开单个要转换的HTML文件,再选定“CONVERT”或在“FILE” 菜单中选择“Multiple Co nvert… …”,选定相应的目录和文件即可进行转换(用相应的图标选择亦可)。 选项Options简单说明:Word Wrap:使单词自动换行;Show Lights:显示配置灯(灯绿表示选中该项 ); Configure Lights:对HTMASC 进行简单配置;Hints:是否随鼠标的移动而在鼠标下方显示图标的有关信息;Links: 是否在转换文件中保存链接信息;SD:是否将转换文件保存在原文件路径下;ST:显示标题;COMP:在转换文件中略去空行)。建议一般应用选中以上几项。也可以直接在Option s菜单中选择More… …,指定Output directory(输出文件路径)及上述设置。