找论文网 > 计算机论文 > 计算机应用 >

Web日志挖掘在网络远程教学中的应用(2)

4 基于Web Mining的网络远程教学网站
       Web Mining指在WWW上挖掘有趣的、潜在的、有用的模式和信息的过程。 其主要目标则是从Web网站的访问日志记录中获取感兴趣的模式,每个Web服务器都能有访问日志文件,它记录了访问者的访问和交互的信息。通过分析这些数据可以帮助网站管理者理解用户的行为和Web结构,了解用户的浏览习惯,调整从而改进站点的设计。
4.1 Web日志信息
      对于一个特定的网络远程教学网站来说,其拓扑结构是已知的,虽然不同的学习者可能有不同的访问浏览模式,但从长期统计趋势上说他们是稳定的,所以经过一段时间后会在网站上积累大量有用的信息(如用户的访问日志、注册信息、需求信息、定单信息、交流信息等),如果不加以有效利用,会造成了资源的极大浪费。如果采用Web Mining技术就可以充分利用这些有用信息,从而建立一个集智能化与个性化为一体的远程教学平台。这些数据信息包含在以下几种类型的日志文件中。
①Server log:
格式如下:
描述
日期
用户请求页面的日期
时间
用户请求页面的具体时间
用户IP
客户端主机IP地址或DNS入口
用户名
客户端的用户名
字节数
传输的字节数(发送或接受)
服务器名
服务器名称、IP地址和端口号
方法
用户请求的方法
协议状态
返回HTTP的状态标识
URL
用户请求的页面
所花时间
完成浏览所花时间
协议版本
传输所用的协议版本
用户代理
服务器提供
Cookie
Cookie 标志号
参照
用户浏览的上一面   
表1 服务器日志文件中的数据格式
②Error log:
存取请求失败的数据,如:丢失连接,授权失败,或超时。
③Cookie:
由Web server产生的记号并由客户端持有,用于表示学习者和学习者的会话,Cookie是一种标记,用于自动标记和跟踪站点的访问者。
4.2 网络远程教学网站Web日志挖掘数据的预处理
      从学习者的访问日志中得到的原始日志记录并不适于挖掘,必须进行适当的处理才能进行挖掘。因此,需要通过日志清理,去除无用的记录;对于某些记录,我们还需要通过站点结构信息,把URL路径补充成完整的访问序列;然后划分学习者,并把学习者的会话划分成多个事务。
4.3网络远程教学网站Web日志数据挖掘的模式发现
       一旦学习者会话和事务识别完成,就可以采用下面的技术进行模式发现。
① 路径分析
     它可以被用于判定在一个站点中最频繁访问的路径,还有一些其它的有关路径的信息通过路径分析可以得出。例如:70% 的学习者在访问/ E-Business /M2时,是从/EB开始,经过/ E-Business /SimpleDescription,/ E-Business /M1;65%的学习者在浏览4个或更少的页面内容后就离开了。利用这些信息就可以改进站点的设计结构。
② 关联规则
    使用关联规则发现方法,可以从Web的访问事务中找到如下的相关性:40%的学习者访问页面/ E-Business /M2时,也访问了/ E-Business /M7;30%的用户在访/ E-Business /
SimpleDescription时,同时也访问了/ E-Business /reference。利用这些相关性,可以更好的组织站点的Web空间,实行有效的教学策略。
③ 序列模式
    在时间戳有序的事务集中,序列模式的发现就是指那些如“一些项跟随另一个项”这样的内部事务模式。例如:在访问/E-Business /M2的用户中,有80%的人曾在过去的一个星期里用关键字“液晶显示器”在baidu上作过查询。发现序列模式,能够便于预测学习者的访问模式,有助于针对这种模式,开展有针对性的教学。
④ 分类和聚类
    发现分类规则可以给出识别一个特殊群体的公共属性的描述,这种描述可以用于分类学习者。例如:在/ E-Business /M4学习过的学习者中有40%是20左右的女大学生。聚类分析可以从Web访问信息数据中聚类出具有相似特性的学习者。在Web事务日志中,聚类学习者信息或数据项能够便于开发和设计未来的教学模式和学习群体。
4.4  网络远程教学网站中Web日志数据挖掘的模式分析
      模式分析是Web日志挖掘中最后一项重要步骤。其通过选择和观察把发现的规则、模式和统计值转换为知识,再经过模式分析得到有价值的模式,即我们感兴趣的规则、模式,采用可视化技术,以图形界面的方式提供给使用者。
5 结束语 
      进一步的工作我们可以将Web访问日志的挖掘和其他的Web内容和Web链接结构挖掘结合起来用于Web页面的等级划分、Web文档的分类和多层次Web信息库的构造等方面,总之对Web数据进行进一步的数据挖掘是非常有意义的。当然,数据挖掘所带来的好处,是与用户的需求及数据挖掘技术本身的发展相关的。在充分了解学习者的爱好、需求的基础上。利用各种Web挖掘技术,设计出能满足不同用户群体需要的个性化网络远程教学网站,从而提供给学习者更加满意的服务。
参考文献
1 韩家炜,孟小峰,王静,李盛恩Web挖掘研究.计算机研究与发展,2001,4:405~414.
2 Ha H S,Bae S M,Park S C.Web mining for distance education.IEEE,2000,2:715~719.
3 王玉珍. Web使用模式挖掘在电子商务中的应用[J].计算机应用研究,2003,10:155-157
4 宋擒豹,沈钧毅.Web日志的高效多能挖掘算法.计算机与发展,2001,3:328~333

共2页: 上一页 [1] 2


多媒体农业专家系统构建平台的实现与研究
基于网页结构挖掘算法研究
工商管理 | 工科论文 | 财务管理 | 管理学 | 公共管理 | 财政税收 | 证券金融 | 会计审计 | 计算机 | 法律论文 | 医药学 | 汉语言文学
社会论文 | 工科论文 | 理科论文 | 文化论文 | 艺术论文 | 文学论文 | 哲学论文 | 政治论文 | 英语论文 | 写作指导 | 计算机应用
www.zlunwen.com 找论文网 ® 版权所有 网站地图