淘客熙熙

主题:多少西河精华贴,尽入谁家囊中 -- 苦夜

共:💬18 🌺58
全看分页树展 · 主题
家园 多少西河精华贴,尽入谁家囊中

网络文摘程序ScrapBook操作(入门篇)

【引子】

受taso河友善举虽远必诛医学系列帖子pdf版下载(2008-12-05)感召,也有应于河里【求助】哪位朋友能推荐一款好用的网页文字抓取工具?(2008-02-23)【求助】请问,西西河的页面为什么无法保存?(2008-10-02) 的问题,俺打算整整关于网络文摘方面的应用心得。屋外天寒地冻,屋里下河找宝,这么休年假似乎也是不错选择。

花顶钦佩河友taso善举之余,感慨同生。用网页快照来收集整理虽远的西河大作,估计工作量不会太少。真希望虽远兄弟能有机会见到这般代表西河沉默大多数态度的善举,当然也奢望河中他日还会有虽远兄弟的文字再现。

为寻找适合自己收集西河精华文章的软件,俺花费过半个月以上时间,来摸索学习(过去工作中不太注意知识管理)。等俺这边刚理点头绪来,虽远兄弟那边就已经一堆"del"甩出去了,俺硬盘里的只存着关于电脑坐姿方面的一幅小图。心里的那个可惜劲,现在还能体会到。(勤做笔记才是好习惯啊!)

【前注】

入门教程的阅读对象:

(1) 有FireFox经验者;(试过FF后还继续用IE的,估计不满足下一条)

(2) 有FirFox插件经验者;(啥子add-ons,俺可不是IT的)

(3) ScrapBook经验比俺少的。(河里有那么多位熟手,斧头不能多耍)

【目录】

1. ScrapBook插件安装

2. 网络文摘实践

2.2 获取整个页面(点一下,网页内容全存至根文件夹)

2.3 获取网页局部内容(选一下、点一下,选取的内容存至根文件夹)

2.4 制作文章合集(拖两下,文摘合并成文集)

【正文】

1. ScrapBook插件(附加组件)安装

既然是入门篇,那就从门外开始。

1.1 点击菜单“工具”→“附加组件(A)”

点看全图

外链图片需谨慎,可能会被源头改

(注:附加组件=插件)

1.2 在“获取附加组件”选项输入栏中输入“scrapbook”,搜索结果如图

点看全图

外链图片需谨慎,可能会被源头改

1.3 点击“添加至 Firefox (A)”按钮,安装附加组件”ScrapBook”,成功安装、重新启动后结果如下图:

点看全图

外链图片需谨慎,可能会被源头改

此时,FireFox菜单栏中增加“ScrapBook”选项,如下图所示:

点看全图

外链图片需谨慎,可能会被源头改

FireFox右下角(底部状态栏)中增加图标点看全图

外链图片需谨慎,可能会被源头改

恭喜!附加组件(插件)”ScrapBook”安装成功,你的FireFox开始步入DIY行列。

2. 网络文摘实践

2.1 打开”ScrapBook侧栏”,便于检视操作结果,如下图:

点看全图

外链图片需谨慎,可能会被源头改

(网页为示例老马丁:【原创】感谢保罗.密尔格姆 (一)背景

2.2 获取整个页面(三种操作方式)

2.2.1A 鼠标操作方式:在鼠标右键弹出窗口内依次选择“ScrapBook” →“获取页面”→“根文件夹”,

则整个页面内容将被摘录保存,左侧栏里将自动增添一个文件名,代表保存到电脑上的网页(网摘)内容。

点看全图

外链图片需谨慎,可能会被源头改

豆知识:左侧栏就是一个资源管理器的文件夹窗口。

2.2.1B 菜单操作方式:点击FireFox的菜单项“ScrapBook” →“获取页面 Ctrl+Shift+L”

点看全图

外链图片需谨慎,可能会被源头改

2.2.1C 键盘操作方式: “Ctrl+Shift+L”

2.2.3 阅读已保存的网摘

点击左侧栏中的存档名“老马丁:【原创】感谢保罗.密尔格姆 (一)背景,第1页-西西河”,看看保存在硬盘中的网摘内容质量如何。

点看全图

外链图片需谨慎,可能会被源头改

看看地址栏(网摘的硬盘保存目录):

点看全图

外链图片需谨慎,可能会被源头改

文章窗口底部出现所摘录的网页链接地址信息“http://www.ccthere.com/thread/1914184”。你可以点一下试试看。

点看全图

外链图片需谨慎,可能会被源头改

注:“获取整个网页”的文摘方式,用得并不多,那如何摘取网页的精华内容呢?慢慢看下面步骤。

2.3 获取网页局部内容

2.3.1 用鼠标选择欲摘录的网页局部内容(你习惯用键盘光标选也成)

示例中选择的是楼主贴“感谢保罗.密尔格姆 (一)背景”中的内容。

2.3.2A 鼠标操作方式:在鼠标右键弹出窗口内依次选择“ScrapBook” →“获取所选内容”→“根文件夹”,

则已选择的网页局部内容将被保存,并在左侧栏里自动增添名称。

点看全图

外链图片需谨慎,可能会被源头改

豆知识:在左侧栏中增添的文件名称为所选局部内容的首行内容,你可以试试把首行的1和笑脸都选上会是啥结果。

2.3.2B 菜单操作方式:点击FireFox的菜单项“ScrapBook” →“获取所选内容 Ctrl+Shift+L”

点看全图

外链图片需谨慎,可能会被源头改

2.3.2C 键盘操作方式: “Ctrl+Shift+L”

2.3.3 重复运用上述步骤,你可以将老马丁的后续帖子“(二)拍卖”、“(三)前车”分别摘录保存到根文件夹(以获取网页局部内容的方式)。

点看全图

外链图片需谨慎,可能会被源头改

2.4 制作文章合集

老马丁“感谢保罗.密尔格姆”的三篇帖子分别保存在硬盘,怎么处理一下?

2.4.1 点击“工具”→“合并向导”

点看全图

外链图片需谨慎,可能会被源头改

2.4.2 在弹出的“管理项目”窗中,将三篇帖子由左侧文件夹窗口拖至右侧的合并向导窗口,点按钮“下一步”、“合并”,则三篇帖子将被合并为一篇,文件名字以蓝色字体表示,类型为“combine”。

点看全图

外链图片需谨慎,可能会被源头改

豆知识:若选择“合并完成后删除原始页面”,则合并后将从硬盘上删除这三篇帖子。(可以节省硬盘空间)。

点看全图

外链图片需谨慎,可能会被源头改

点看全图

外链图片需谨慎,可能会被源头改

2.4.3 回到FireFox,感受一下自己编辑帖子合集的乐趣吧。

点看全图

外链图片需谨慎,可能会被源头改

豆知识:合集中每篇帖子的链接地址就隐藏在黄色底框的小标题中,点点看。

【结束语】

ScrapBook插件,绿色免费、简便好用,实在是上网抓字、下河捉虾的必备工具。(“含笑半步颠”?)

入门篇至此,相信可以据此开始简单编辑一些西河精华贴的合集了,保存到自己硬盘上,感觉要踏实一些。

自打学习了如何做网摘之后,俺用得最多的就是ScrapBook,虽然操作非常简单,但至今也还未用尽全部功能。

关于“ScrapBook操作的提高篇”留待下回书再表。

(Google Picasa的图片外链有宽度尺寸限制,帖子来回改动数次不得要领,唯有现学如何将图片改存windows live。)

关键词(Tags): #ScrapBook#戏水西河

本帖一共被 1 帖 引用 (帖内工具实现)
全看分页树展 · 主题


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河