【ChinaByte 综合消息】近日,北京网景时代网络技术有限公司(www.webcate.net)推出了面向商业网站的内容采集软件—―Webcate CPS(Content Parsing System),中文名称“摘星”内容采集系统。
该软件是一个实时站点内容采集系统,它用于对Internet上某个特定领域(如商品价格信息、MP3信息、招聘信息或新闻)的所有站点进行内容分析和分类整理,以得到该特定领域的绝大部分内容。和网页提取或者搜索引擎不同,该软件可以直接深入到站点及其网页的所有内容,将网页中的有效数据提取出来,并保持数据之间的逻辑关系,例如,对一个做在线零售的站点,“摘星”可以将其所有正在出售商品的分类、名称、价格、商品介绍及付款方式全部提取出来,即使商品的详细介绍和商品的价格不在同一个页面,“摘星”也能正确地对应每个商品和它的详细介绍。




