常用网络资源下载方法与策略

时间:2022-10-13 11:48:15

常用网络资源下载方法与策略

21世纪是一个网络时代,网络已经无可争议地成为大家生活的一部分。查资料,看新闻,发微信……几乎衣食住行等等列一不用到和依赖网络。因此,本文不妨结合个人的体会谈谈网络资源的下载的一些方法和策略。

一、什么是网络资源

办公电脑作为办公室的标准配置,可以让我们打字、听歌、看电影、玩游戏等;实现对文本、图片、音视频、动画等多种媒体的处理,极大地提升了我们的工作效率。这些不同的媒体数据,都是以计算机可理解和接受的二进制的数字化的形式,并以文件的形态存储于计算机的硬盘、U盘、光盘等存储介质。网页是一种特殊的文件,它本质上是一个包含了各种HTML标签的纯文本文件。正是这些不同的标签,使得网页的内容不但有普通的文本内容,还能描述出网页所包含的图片、音频、视频、动画等其它媒体文件的信息,甚至以超链接的形式,与其它的文件起来。为区别于传统的文本文件,称网页为超文本文件(Htm)。网页里的图片、音频、视频、动画等媒体内容都是以文件的形式单独存放。通过网页中的超链接,可以将一台或者多台计算机主机(服务器)的不同文件内容组织起来,形成一个蜘蛛网一样的网页文件的链接――网站(Web)。要能让自己的网站内容能够通过Internet被其他人访问,还必须进行网站的。

从硬件的角度看,网络就是多台计算机通过网线、交换机等各种网络设备联接在一起的集合。不同范围的、不同功能的计算机的集合构成不同的或公用或私用的计算机网络,而Internet则是目前大家用得最多的一种公众计算机网络。Internet中计算机上的Web资源就形成庞大的遍布全球的网络资源(WWW:World Wide Web),一个海量的信息集合。因此,网络资源就是存储于Internet中计算机服务器(Web Server)上的多媒体文件。从软件的构成来看,WWW分为Web客户端程序(浏览器)和Web服务器程序。制作好Web网站后,在计算机上的Web服务器程序进行设置,就完成了网站的,这就是网络的WWW服务。我们上网,访问最多的就是WWW服务中的Web信息资源,所以网址里总有WWW。

当然,Internet呈现给我们的功能除了WWW,还有远程登录服务Telnet(Remote Login)、文件传送服务FTP(File Transfer Protocol)、电子邮件服务E-mail(Electronic Mail)、电子公告板系统BBS(Bulletin Board System)。但它把Internet上所有的超文本媒体资源统统连接起来,只要网络畅通,全球的信息就可方便获取,使得WWW几乎成了Internet的代名词。

二、下载方法

根据原理的不同,现在网上流行的下载方式主要有WEB、BT两种下载方式。根据数据传输规则的不同,WEB下载方式分为HTTP与FTP两种类型,也是两种最经典的下载方式。HTTP下载就是通过浏览器进行下载:这是大家最熟悉的日常上网的情况,在浏览器中输入某个网址,打开相应网页,通过简单的鼠标操作就可保存网页及其中的文字、图片等资源。毫无疑问,使用浏览器进行下载是最为简便的方法。FTP下载可以通过浏览器进行下载,也可以通过专门的FTP软件进行下载。在这种方式下,使用已知的FTP帐号登录FTP服务器,然后操作FTP上的文件就和操作“我的电脑”中的文件一样,通过简单的“复制”、“粘贴”就可完成从远程FTP服务器到本地的数据下载。因为WWW依循的是客户端/服务器端模式,基于Web下载的工作原理,都是通过所使用的本地K端(客户端)程序发出申请,访问相应网络地址的服务器(Server)资源,并将远程服务器资源存放于本地终端的过程,客户端与服务器之间存在着一对多的关系(P2S:Peer to Server),若同时下载的人数过多,也由于服务器的带宽问题,下载速度会减慢许多。具体的星形拓扑结构如图1所示。

BT(BitTorrent)就是比特流,是基于P2P传输协议的一种下载方法,BT下载也称为P2P下载。与Web下载不同,它要通过一个专门的P2P下载软件来实现,可以克服了传统Web下载方式中下载客户端较多时,单一的服务器端负荷重的局限性。P2P下载不需要专门的服务器,而是在各个用户的终端设备之间同时进行数据上传和下载。每个人使用的终端既是提供资源的服务器端,也是下载资源的客户端,是一种对等的关系(P2P:peer-to-peer)。每个客户在将其它客户端上的资源下载到自己终端设备的同时,还起着被其它客户端下载的作用。所以使用该种下载方式的用户越多,其可提供下载资源的端点数就越多,下载速度就越快。当然,缺点就是硬盘长期处于读写状态,可能更容易损坏。所以,BT下载是一种多对多的网状拓扑关系,其拓扑结构如图2所示。

P2SP(Peer to Server&Peer)下载方式实际上是对P2P技术的拓展,它不但支持P2P技术,同时还通过多媒体检索数据库这个桥梁把原本孤立的服务器资源和P2P资源整合到了一起,用户下载某一个文件的时候,会自动搜索其他资源,选择合适的资源进行加速,这样下载速度更快,同时下载资源更丰富,下载稳定性更强。

三、下载策略

浏览器是获取网络资源的门户,大多的网络访问都是在浏览器里面完成的,浏览器也是大家使用最频繁最熟悉的软件之一。因此,一般的网络资源下载大家更习惯通过浏览器进行HTTP下载。本文将基于浏览器的网络资源下载作进一步的策略阐述。由于浏览器的功能不同,具体下载时可采取不同的下载策略。

1. 直接下载

前面已经提及网页是一个纯文本文件,网页内容可能有文本、图片、音频、视频、动画等多种媒体。通过不同的标签,浏览器在按照HTTP协议打开网页时,就会智能地识别这些超媒体并将这些文本、图片、动画等不同媒体呈现在屏幕上。

因此,通过简单的保存当前网页,或者复制粘贴当前网页的内容,或者通过“图片另存为”、“目标另存为”等操作,就可以实现基本的网络资源的直接下载。

一种可能的情况是当前网页屏蔽了相关的鼠标命令,上述的操作不能完成,这时可以通过截屏操作获取相应的文本和图片信息。

也可以通过“查看网页源代码”的方式自动调用记事本打开当前网页的源代码,就可以看到需要的文本内容,这时就可完成“复制”、“粘贴”操作了。

或者打开“Internet选项”菜单,进入“安全”标签页,单击“自定义级别”按钮,在打开的“安全设置”对话框中,将所有“脚本”选项禁用,确定后按F5键刷新网页,你就会发现那些无法选取的文字可以选取了。好的习惯是完成了所需要的信息资源后,记得给脚本解禁,恢复“Internet选项”中的“安全设置”,否则会影响浏览其它网页,甚至带来真正的安全隐患。

2. 缓存提取

其实任何网页显示的内容,都从远程的服务器端,通过网络传输到本地,保存在一个叫做“缓存目录”里的,然后根据对数据加密的不同,有的加密不能直接打开,有的切割成很多片断,有的直接删除,很多根本就不做加密处理。因此,只要我们打开所用浏览器的缓存目录,就能看到里面的文件就是我们所打开的网页内容。这些文本的、图片的、音频的、视频的、动画的甚至应用程序等各种文件对象,很可能就是我们所需要下载的网络资源。

这种情况一般适用于音频、视频和动画等资源对象的获取。考虑到其文件大小不会很小,常用的技巧是根据时间排序,根据大小排序等,就可以迅速而方便地识别出自己所需要的网络资源。或者先全部删除该缓存目录内容,然后重新打开相应网页,这时缓存目录内的文件对象就全部是与当前打开的网页相关的内容,更方便网络资源的识别与获取。

缓存目录内的文件对象可能文件名是一串意义不明确的符号,有的甚至连后缀都没有,但我们不妨从大小或者时间判断,直接将怀疑的文件对象复制到另外的位置(比如桌面),然后直接媒体播放器来打开这个文件对象,就可确认是否是需要的资源。

不同的浏览器,打开其缓存目录的方法也不一样,比如IE浏览器,选择“工具”“Internet选项”“浏览历史记录”“设置”“查看文件”,就可以打开其缓存目录“C:\Documents and Settings\Administrator\Local Settings\ Temporary Internet Files”,或者修改该位置。

而对于QQ浏览器,通过点击窗口右上角的“菜单按钮”“设置”“下载设置”,可以修改其缓存目录的位置(比如修改为桌面),方便打开和操作。(下转15页)

(上接13页)

3. 媒体嗅探

既然浏览器能够智能地识别纯文本的网页中各种标签标识的超媒体对象,并将其从远程服务器传输至本地计算机的缓存目录中。那就说明浏览器能够知道当前网页内的所有媒体对象,可作为网络资源下载者,在打开相应的网页时,怎么知道浏览器已经识别出当前网页所包含的媒体对象呢?

这就要用到一些非IE浏览器所具有的“媒体嗅探”功能了。

比如QQ浏览器,通过点击窗口右上角的“菜单按钮”“应用中心”;在“应用中心”窗口的搜索栏搜索“视频”;安装“视频下载助手”;搜索“media”;可安装Media Downloader,Any Media Downloader,Flash Video Downloader;搜索video,可安装FVD Video Downloader,FLV Video Downloader,Video Downloader All、GetThemAll Video Downloader等。QQ浏览器就会安装相应的具有“媒体嗅探”功能的“应用程序”,其窗口右上角会出现相应的按钮;然后再刷新之前的页面,看看这些按钮有什么变化;我们会发现,随着当前页面中文本、图片、音频、视频、动画等媒体内容的逐次呈现在屏幕上,右上角相应的按钮会慢慢由灰变亮,表明这些按钮代表的“应用程序”已经“嗅探”到当前页面的媒体。这时我们只需要简单地点击这些按钮,就可以保存所需要的音频、视频或者动画等网络资源了。

从网络传输的原理上讲,网络资源看得到听得到就能下载得到,因为这些资源都已经从远程服务器传输到了本地服务器。只不过我们能否具有一双慧眼,能够在恰当的地方把这些网络资源找出来。当然,网络资源的下载还有一个前提,那就是必须遵纪守法,下载可以免费下载的资源,而不能通过自己的技术手段强行下载不允许的加密收费的网络资源。■

【参考文献】

[1] 杜云. 网络资源与网络资源管理[M]. 北京:中国财政经济出版社,2006.

[2] 陈晓露. 网络资源下载[M]. 北京:中国社会出版社,2010.

[3] 华师傅资讯. 电脑网络、资源、设备共享全攻略[M]. 汕头:汕头大学出版社,2005.

上一篇:大数据背景下企业管理创新的必要性探析 下一篇:新事业单位会计制度下加强高职院校固定资产管...