【ChinaByte 综合消息】引言:网络管理是一个网站公司运营的基础,是一项非常艰辛的工作。而面对越来越多的网站公司将自己的业务平台以主机托管的方式设置到ISP的IDC(Internet Data Center),由此而引发诸多问题,谨以此文做抛砖引玉,望各位同仁批评指正。

  概述 网络管理的概念存在着较大的歧义,各人理解都会有所差异,现仅就此做一说明。

  传统的网络管理强调的是网络流量的管理和监控,其对象是各型网络中(不仅指计算机网络)各个网络协议、信令的运行情况,其目的是对有限的网络资源做合理的运用。

  现代网络管理,尤其是计算机网络的管理,由于多年的发展和技术方面的提高,其对象逐渐转向网络上的每个通信节点,使得网络管理的对象从协议、信令的管理走向融合了设备管理的网络交通(Network Traffic)管理的新领域。

  我们现在的网络管理概念中,不仅有现代网络管理的部分,而且更有着系统管理、系统支持,甚至包括数据库管理的诸多方面内容;在托管条件下,对这几方面同时进行管理确实存在相当难度。

  一、网络管理任务划分

  网站的网络管理首先要考虑QoS(服务质量)的控制和安全策略的实施。可将这两项目标分解为四项基本操作任务:

  1、数据采集和分析:这包括网站流量分析和预测和用户访问的分析,籍以提升服务质量。

  2、应用服务管理:对于WWW服务,FTP服务等应用层服务的设置、添加、改变及对数据库的管理、配置、优化都是应用服务管理的内容,其中有些部分会对安全策略具有相当影响。

  3、网络设备管理:网络设备典型地包括路由器、交换机、防火墙等网络设备的管理、配置、维护、监控,逐渐成为安全策略实施的主要对象。

  4、系统设备管理:系统设备有主机系统(包括OS)及其外围设备组成。主机系统的健康情况对服务质量的保证有决定性意义;另外,安全策略的最后屏障也要靠系统设备的管理加以实现,不仅包括用户帐号管理等一般内容,还应该考虑到备份策略及容灾、容错、灾难恢复的实施等一系列问题。

  二、托管策略与IDC的服务

  

  在托管条件下,网络管理任务的实施与IDC的配合是密不可分的。IDC提供什么样的服务内容,用户又会选择怎样的服务,需要有完整的托管策略,明确哪些网管任务由IDC完成,哪些会用自己的维护力量。 对于网络设备管理和应用服务管理,由于较多的涉及特别的操作系统、主机设备及网络设备, IDC的技术力量及其服务内容很难涵盖绝大部分的用户需求,故我认为还是应该尽量使用自己的维护力量。 对于数据采集与分析及系统设备要依据实际情况。一般要求IDC提供的服务包括:网站流量分析、备份策略实施、意外系统错误恢复及灾难恢复的现场部分,或许还可以包括带宽的调整、网站访问加速等服务项目。

  

  在确定服务项目之后,需要向IDC维护人员提供每项服务的具体方案和操作办法、相应的维护日志样本;明确要求IDC维护人员按照日志文档的说明填写维护日志;定期核查维护日志及其记录的真实性。

  三、托管中涉及等特殊问题

  采用托管服务时,会涉及两个特殊问题。

  1)网站的维护方式;

  2)流量分析报告的使用

  1、网站的维护方式

  被托管方采用何种手段使自己的维护力量介入网络管理,涉及到网站维护工作量的大小、自己的实力、人员的配置。

  如果维护量很大,实力强且人员多时,不妨采用高密度现场维护的方式,每天派员工去IDC,就地解决各个网络管理任务;否则,就应该采取远程维护手段。远程维护工具/平台一般有PC Anywhere, OpenView, Tivoli等等,需要根据自身的设备情况选用。但需提醒一点,一般不要让管理连接通过公网进行(即通过Internet 或拨号接入方式),尽量在自己的系统的后端用专线方式连至远端网管中心。

  2、流量分析报告的使用

  带宽的使用情况对用户访问的服务质量产生较大的影响。现在用户对于网站响应的速度提出的要求越来越苛刻。一般美国Internet 用户可容忍的最高连接响应时间只有12秒,而韩国年轻一代的网民,可忍受的时间只有4秒。即使你的网站内容十分丰富,非常有意义,但若响应速度太慢,而导致用户的大量流失,也会带来惨重的损失。以现在中国Internet发展的实际情况,并综合Internet 发展的过程而言,一个网站的完全响应时间不应该超过42秒,即用户丛输入一个URL到其浏览到全部页面信息,其时间上限是42秒。对这一时间有直接影响的就是网站到CHINANET或其它Internet的出口带宽。 出口带宽过窄会引发极严重的延时和丢包。一般情况下,出口带宽利用率的峰值算术平均不应该超过70%,而考虑到用户访问离散性,如果使带宽足以应付访问高峰时段的可靠响应,则带宽利用率的峰值算术平均不应该超过40%。实际情况比理论值的简单计算更加复杂。一般情况下,系统容量均由带宽及用户访问量决定,通常系统容量的设定会比实际访问量的均值多20%,这样的线性关系固然保持了系统的性价比保持较优的状态,但在访问量的增加十分迅速的情况下,想在短时间内适应这变化将很困难;加之带宽的增长亦需一定的保证,且必须放在系统扩容之后(保证系统容量不因带宽增长带来访问增加引起系统崩溃)进行,则反应时间会比这种快速增长滞后许多,从而在业务增长最关键的时候造成服务质量急剧下降。为防止这种情况发生,在带宽利用率均值达到35%到40%时,网站升级必须完成。在此前提下,我们必须在带宽利用率达到25%到30%,既开始准备系统的升级。而在此前,如有一段时间带维护期,则理想的带宽利用率应该尽量控制在15%左右,并在达到20%时,分析并预测访问量增加的趋势,对新兴的网站服务质量的保证十分重要。

  如果实施托管的IDC有能力以较细的粒度实现带宽的增加是比较理想的托管环境。这样,我们可以在观察判断期以较小的带宽增加幅度减少这种风险,并会为分析、判断赢得一定的时间。

  总之,选择能够提供基本的维护服务的IDC,并与之协调,制定完善的维护计划,实施严格的维护、核查手段,且充分利用IDC提供的各个服务,是解决托管网络管理问题的基本思路。