|
|
基于Apriori算法的高校Web日志挖掘系统构建 |
王春玲, 李川, 李想 |
北京林业大学信息学院, 北京 100083 |
|
|
摘要 伴随高校信息化建设工作的深入推进,网站已成为学校管理人员与师生交流沟通的有力媒介,也是外部人员全面了解学校情况的关键平台。鉴于部分高校网站结构复杂、页面链接设计不够合理,导致高校师生获取相关资源效率下降、浏览兴趣匮乏等问题,设计并实现了基于Apriori算法的高校Web日志挖掘系统。同时,通过挖掘原始Web日志,得到高校师生频繁访问路径信息,明确网站内页面间呈现的潜在关联关系,进而掌握高校师生的浏览习惯和站点整体访问情况,为站点结构调整及页面链接优化提供依据,为后续网站构建和优化提供有效的信息参照。
|
|
关键词 :
Web日志挖掘,
Apriori算法,
关联规则,
数据预处理
|
|
基金资助:北京林业大学教育教学研究项目——面向创新型人才培养的"计算机算法设计与实践"课程建设,项目编号BJFU2018JY087。 |
[2] |
郑庆华.Web知识挖掘:理论、方法与应用[M].北京:科学出版社,2010:237-240.
|
[4] |
柳炳祥,李海林.一种基于粗糙集和信息论的Web日志挖掘方法[J].情报杂志,2008,27(3):90-92.
|
[5] |
王锐,李晶,熊海蕴,等.基于关联规则的Apriori算法的可视化实现方法[J].计算机工程与设计,2007,28(4):757-759.
|
[3] |
ETZIONI O.The world-wide web:quagmire or gold mine[J].Communications of the Acm,1996,39(11):65-68.
|
[1] |
阳小兰,钱程,赵海廷.Web日志分析系统研究[J].计算机技术与发展,2011,21(9):211-215.
|
[6] |
陈文臣.Web日志挖掘技术的研究与应用[D].北京:中国科学院研究生院计算技术研究所,2005:29-30.
|
|
|
|