基于关联规则的Web使用挖掘

来源 :对外经济贸易大学 | 被引量 : 0次 | 上传用户:qq20881010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘就是从大量的数据中提取隐含的、未知的、具有潜在价值的有用信息。Web使用挖掘就是运用数据挖掘的思想来对Web服务器日志进行分析处理。Web使用挖掘在电子商务和Web个性化等方面有着广泛的应用。通过挖掘Web使用挖掘可以改善网站的组织结构,监控服务器的工作情况,改善Web应用的系统设计,为用户提供个性化服务。   数据挖掘主要的算法有分类模式、关联规则、决策树、序列模式、聚类模式、神经网络等等。关联规则是数据挖掘领域中一个非常重要的研究课题,Apriori算法是关联规则最经典的算法。   数据预处理是数据挖掘非常关键的环节,其好坏直接影响到后续工作是否能得到理想的结果,同时也决定了最终挖掘出的知识的可信度。Web使用挖掘数据预处理包括四个步骤:数据清理、用户识别、会话识别、路径补全。   本文研究了Web使用挖掘的特点、方法和相关技术,讨论了数据预处理的过程和有效的数据预处理方法。运用Apriori算法、Clementine数据挖掘工具对中俄经贸合作网Web使用日志进行挖掘,详细给出Web使用日志数据预处理的方法、对挖掘结果进行分析。
其他文献
从2006年开始,我国寿险业第二张经验生命表正式启用,而已经使用尽十年的第一张经验生命表由于已不符合我国现阶段人口生存状况而被取代。新旧生命表在许多方面存在差异,本文鉴于
描述了由以水为基础的有机和无机组分构成的溶胶凝胶溶液Sila-Coat的特性与应用.溶胶凝胶溶液采用浸轧法与喷涂法涂在非织造布上.给出了获得的表面过滤材料的功能性涂层的测
在全球化的经济背景下,中小企业在国民经济的地位不断提高,同时,中小制造企业为我国的出口所做的贡献也在逐年递增,中小企业的国际化已经是全球经济的发展趋势。然而,中小企
银行保险在目前市场看来就是保险公司与银行、邮政和其他金融机构实施相互渗透和融合的战略,并通过资产的连接、客户资源的整合与销售渠道的共享,提供银行保险产品及服务的一种
对基于案例知识的系统安全风险模型进行了研究。首先,建立了系统安全事件案例知识表达模型。其次,研究了系统知识表达的不确定性问题,以及安全风险决策者的决策类型对度量不
近年来,涉烟违法犯罪分子为逃避烟草专卖部门的打击,采取化整为零等形式贩运贩卖假私非烟的现象日益突出,已成为涉烟犯罪网络案件中销售环节所存在的常态,给我们打假破网提供
1月9—10日,北国边陲寒风彻骨,中国联通集团公司董事长王晓初率集团公司综合、人力、党群、市场、工会等部门领导一行5人深入黑龙江联通省公司及哈尔滨、绥化分公司调研,慰问
期刊
近年来,自然界中的极端事件时有发生.例如,2004年的印度洋海啸,2005年的Katrina飓风,2008年的汶川大地震,2010年的海地地震,2010年的智利地震,2015年的美国洪水等.这些极端事件往往会给保险公司带来巨额理赔.虽然它们发生的概率很小,但往往只要发生就会给保险公司带来非常大的冲击,甚至导致公司破产.历史数据表明,经典的轻尾分布用于刻画这种极端理赔存在着明显的偏差.应用概率学者研
吴昊 华为消费者业务应用市场业务部部长rn创新突破开启互联网应用转型之门,分两个方面:共建生态和创新未来.构建生态底座来支持创新领域.在未来相当长的一段时间星,手机是未
期刊
学位