论文部分内容阅读
电脑端的采集
网站和微信公众号是大家浏览文章经常去的地方,下面分别介绍相应的采集方法。
1.采集网站中的文章
对于普通网页中的文章,我们可以使用“水淼万能文章采集器”来采集(https://www.shuimiao.net/ArticleCollection/,支持免费试用,每次可采集20篇文章)。比如现在需要采集与“人工智能算法”有关的文章,启动该软件后在搜索框中输入关键词“人工智能算法”,“搜索引擎”选择“百度网页”,然后点击“开始采集”按钮(图1),稍后它就会将包含该关键词的页面下载到本地保存(正文为空,或者不足200字的页面会自动跳过)。
以后我们只要打开默认的保存位置“C:\关键词采集\指定关键字”,就能在其中看到所采集的文章了。这些页面是离线保存的,大家可以根据自己的实际需要慢慢地进行整理(图2)。
2.采集微信公众号内的文章
现在有很多高质量的文章保存在微信公众号内,如果想采集其中的文章,我们可以借助WeChatDownload这款工具(https://priapus.lanzoui.com/i6Szeipeure)来完成,这里以采集“电脑爱好者”微信公众号内的全部文章为例进行说明。启动WeChatDownload后切换到“设置中心”选项卡,勾选“微信文章全部下载”选项,“下载范围”选择“全部”。其他的选项,如是否下载音频文件、是否下载为Word文档(方便后续编辑)等按需选择即可。设置完后点击“应用配置”按钮(图3)。
接着关闭该软件并重新启动它,在弹出安装证书提示时点击“是”。进入程序的主界面后启动电脑版微信,打开“电脑爱好者”公众号的历史文章界面,这时WeChatDownload会自动读取历史文章列表,读取完后就会自动开始采集文章了(图4)。
采集到的文章默认保存在“WeChatDownload的安装目录\application\电脑爱好者”中(图5),以后可以随时打开该目录查看它们。
手机端的采集
现在手机的性能非常强大,有很多朋友经常使用手机浏览文章,同样有不少APP能帮助我们快速完成采集工作。
1.网页文章的采集
如果需要采集网页中的文章,可以使用手机端Edge浏览器来离线保存页面。比如现在需要将电脑爱好者网站中的某篇文章保存到手机中,在手机浏览器中打开该文章的页面后,用手指在页面的任意位置处下滑,接着点击“下载网页”按钮(图6)。
这样当前页面中的内容会自动保存为离线副本,以后如果需要查看下载到的文章,点击图6所示窗口中的“下载内容”,然后点击下载列表中的文章名称即可(图7)。
2. 采集微信公众号或微博中的文章
如果需要采集微信公众号或微博中的文章,可以借助“印象笔记”APP来完成,以采集微信公众号中的文章为例。在公众号中打开一篇文章后依次点击右上角的“…→复制链接”。接着启动“印象笔记”APP,它会自动从剪贴板中读取复制到的链接,之后点击页面中的“保存”按钮,即可将保存的链接转换为笔记(图8)。
转换后的笔记默认保存在“我的笔记→笔记本→我的剪贴板”中,打开该目录即可进行浏览、编辑和分类等操作(图9)。此外,我们还可以使用“印象笔记”的归档(对文章进行分类)、编辑、搜索等功能进一步管理采集到的文章。
全平台收藏文章
在不同的时间段我们往往会使用不同的设备来阅读文章,比如在公司时用电脑,而通勤时用手机等。另外,手机平台又有Android和iOS之分。因此为了更方便大家采集文章,最后笔者再介绍一些支持全平台的收藏方法。
1.利用微信收藏文章
微信现在已经成为很多人必装的一款工具,当我们浏览网页时,如果需要收藏文章,依次点击“分享→添加到微信收藏”即可(图10)。这样以后无论是在手机中还是电脑中,只要登录自己的微信账号就能在“收藏”中找到保存的文章链接,之后再参照上文介绍的方法进行采集即可(图11)。
2.利用Automate自动收藏文章
Automate是一个支持自动化操作的手机APP,我们可以通过设置一个自动收藏文章的脚本来实现文章的自动收藏。以将文章自动收藏在“https://www.instapaper.com”网站为例,我们先登录该网站并注册一个新用户,接着启动Automate,点击界面中的“+”新建一个工作流,依次添加“flow beginning→getc l i p b o a r d c h a n g e →f o r k→f x函数[具体代码为:ma tc h e s (s h a r e _t e x t , " ( ? m s ) . * h t t p s ? : / / w w w .instapaper.com/api/add)]”,输入完后进行保存(图12)。
这样,以后需要在浏览器、微信公众号或其他APP中收藏文章时,只需在对应的功能菜单中选择“复制链接”,文章链接就会自动保存在“ht t p s: //www.instapaper.com”网站中了。同理,再通过电脑或手机访问該网站并进行采集即可。