近日中国社科院发布了一个名为《2003年中国12城市互联网在中国的使用及影响调查研究》的研究报告(以下简称《12城市互联网调查》),这应该算是每年两次的CNNIC调查之外比较大型的对于上网人群的调查研究。
许是CNNIC的调查已经取消了十大网站的评比,而此次的《12城市互联网调查》恰好有一个"网民经常访问的网站",许在这个调查中新浪以十多个百分点的优势领先于紧追不舍的搜狐,所以新浪立刻把这个报告放在了新浪科技频道的头条上。
把对于自己有利的调查拿出来宣扬一下是人之常情,笔者没有任何的异议,事实上我也是首选新浪科技频道的拥护者。但是作为一个对于社会调查有一点爱好的研究者,在阅读《12城市互联网调查》报告之前,习惯性的观察了一下整个调查进行的方法说明部分,因为笔者始终相信如果没有正确的方法,任何一个权威机构做出的调查报告都是不可信的。
看完了关于此次调查的方法说明,笔者心中有许多疑惑,怎么此次社科院进行的此次调查竟然在方法上会有如此大的纰漏,在这里,不得不提出几个问题,与报告的执行和撰写者商榷。
《12城市互联网调查》报告的全名我们也看到了,强调的是关于互联网在中国的调查研究,而此次调查的对象集中在12个城市,显然这是一个抽样调查的过程。对于一个全国性的调查,采用抽样而不是普查的方法本来就是很正常的事情,但是抽样是一把双刃剑,抽样抽得好,可以省时省力,可是如果抽样方案出现问题,那么得出的结果可就一钱不值了。在抽样方案上,笔者认为社科院的做法有以下几点可能影响抽样精度:
(1) "本次调查的访问对象设定为调查城市常住人口中年龄为17岁-60岁的男女居民。"这是报告中对于抽样对象的一个界定,看到这个结果我下意识的怀疑就是,那么17岁以下的和60岁以上的互联网使用者呢?难道他们的意见就可以忽略不计吗?任何一个对于中国互联网发展有些了解的人都明白,在中国青少年是上网人群中一个不可忽视的群体,可是一旦把抽样对象局限在17岁以上,那么是会有相当部门的人群被故意遗漏的。这个人群会有多少?笔者当然没有准确的数字,但是有一个数字可以参考。CNNIC《中国互联网发展状况统计》2003年7月的调查显示,中国的上网人群中年龄低于18岁以下的占总上网人口的17.1%,虽然两个报告一个是17岁以上,一个谈的是18岁以下,两者并非完全重叠,但世界此我们也可以估算《12城市互联网调查》中遗漏的这个17岁以下上网者的数量,虽然没有整体17.1%那么夸张,但肯定也是一个绝对不可忽略的一个数字。而在过往的一些研究中,我们也发现青少年的上网行为和上网喜好和成年人并不是完全一致的,如此一来,将17岁以下上网者忽略没有放入抽样对象,将可能导致调查的结果与实际的情况存在显著误差的。
(2) "考虑到中国各地区互联网发展不平衡,今年的调查采用分大都市、省会城市和小城市3层,多阶抽样的方案,主要从城市规模、地理位置和经济发展水平以及实际操作的可能性等因素出发,选定12个城市作为调查市。这些城市中的大都市为:北京、上海、广州;省会城市为成都、长沙、西安和沈阳;小城市为广东南海、河南义马、山东即墨、湖北广水和河北丰南。被选调查市涵盖两个直辖市(北京和上海)及广东、四川、湖南、湖北、河南、河北、山东和陕西8个省。大都市、省会城市和小城市三层的样本量分别为600×3=1800,300×4=1200和200×5=1000。样本设计总量为4000份(1800+1200+1000)"上述文字是《12城市互联网调查》报告中对于分城市分层抽样方案的一个说明。的确,由于各个城市互联网接入条件的发展不同,特别是宽带发展的不同,是会大大影响不同城市上网者的上网行为和上网喜好的。





