admin管理员组

文章数量:1531339

2024年6月30日发(作者:)

第23卷第2期 

2013年4月 

北华航天工业学院学报 

Journal of North China Institute of Aerospace Engineering 

Vo1.23 NO.2 

Apr.2013 

美家365网上商城智能推荐系统研究与设计 

戚永军 翟智平 

(1.北华航天工业学院网管中心,河北廊坊065000;2.北华航天工业学院图书馆,河北廊坊065000) 

摘要:智能推荐系统作为一种信息过滤的重要手段,是当前解决信息超载问题的重要途径,能有效解决电子 

商务网站中用户找不到满意商品,商家找不到正确促销对象的问题。本文介绍了美家365网上商城智能推荐系 

统的功能需求和系统架构,探讨了数据搜集、数据清理、数据预处理的过程,不仅满足了用户提出的需求,还 

对类似系统的开发有一定的参考价值。 

关键词:网上商城;智能推荐;研究;设计 

中图分类号:TP393 文献标识码:A 文章编号:1673—7938(2013)02—0001—03 

0引 言 

信息。 

香河家具城以家具品种品牌多、产品规格全、质 

量信誉好,被国内业界人士和新闻媒体誉为“中国最 

具发展潜力和活力的家具市场”。近年来,电子商务 

的兴起,传统实体店的经营模式受到极大挑战,为适 

应潮流、拓宽销售渠道,香河家具城推出了家具电子 

2系统设计 

2.1 系统结构 

该系统由数据搜集、数据清理、数据预处理、商 

品推荐等模块组成,系统结构如图l所示。 

商务平台——美家365网上商城。本文为该平台设 

计了一套智能推荐系统,以便提高销售额,发现潜在 

客户,增加商品促销响应率。 

1 功能需求 

网站页面I I商品推荐页面llj 

申 

协同过滤l l序列模式分析l 

聚类分析l I商品关注度排序l 

+ 

智能推荐系统应具备如下所示的功能: 

(1)分析用户的购买习惯提供个性化服务。通 

过大量数据挖掘,分析用户消费习惯,有针对性提供 

其感兴趣的商品,同一页面不同用户打开,显示不同 

商品列表,实现个性化服务。 

(2)访问页面时自动推荐感兴趣的商品。用户 

在打开网站或使用搜索功能时,能呈现该用户最感 

(:差堕清理后的 干鸿 

原 

 

兴趣的商品,商品按关注度降序排列。 

(3)购买时自动推荐有价值的商品。在用户付 

款前后,自动推荐其在购买过程中没有想到但确实 

需要的商品。 

(4)将用户消费习惯分类,发现用户特征,为广 

告和销售提供支持。 

图1智能推荐系统结构图 

2.2数据搜集 

(5)只推荐本站商品,不爬取其他网站商品 

基金项目:廊坊市科技局科技支撑计划项目(201201 101 1) 

收稿日期:2013一Ol—O8 

作者简介:戚永军(1976一),男,硕士,工程师,河北唐山人,从 

数据搜集是将用户访问网站的各种信息记录下 

来供数据挖掘使用,数据存人数据库中。数据表结 

构及其关系如图2所示。 

用户信息表:记录注册用户的信息,为商品推荐 

的协同过滤算法提供依据。尽量要求用户提供真 

实、详细的个人信息,这些信息越准确、越详细,商品 

推荐的质量越高。 

事计算机网络技术和软件开发研究。 

2013年4月 北华航天工业学院学报 第23卷 

商品评论表:记录用户对商品的评论信息,该表中 

商品的评级可分为l一5分,分值越高说明对商品的关 

注度越高,同时分值也为协同过滤算法提供依据。 

用户购买记录表:记录用户购买商品的信息,购 

买某一商品表示对该商品关注度较高。 

搜索记录表:该表记录用户搜索商品的相关信 

息,通过搜索关键字可推测商品的关注度。 

相关的记录。 

删除请求样式表的记录。 

删除访问错误的页面,即属性Status中代码值 

小于200或大于299的13志记录。 

常见页面请求方法包括GET、POST和HEAD, 

由于只有GET方法反映了用户的访问行为,所以只 

保留GET方式的记录。 

用户浏览13志表:记录用户点击网站的动作,其 

中“当前页面地址”、“浏览时长”、“下一个页面地址” 

等信息可为序列模式分析、聚类分析提供依据,有助 

于挖掘用户的习惯,提供个性化服务。 

商品表:记录商品的细节,为推荐页面提供数 

据。 

用户信息表 

保留URI中含有id参数的记录,由于该网站 

的商品页面含有id参数。 

(2)识别用户或会话:获取Web 13志中的IP地 

址、浏览器、操作系统,分别和用户表、商品评论表、 

用户购买记录表、用户浏览13志表中的记录比对,识 

别出注册用户,无法识别的保留Session id值。 

商品评论表 

评论表主键<pk> 

登记名 <fk> 

商家ID 

评论标题 

评论内容 

评论13期 

评级 

是否审核 

IP地址 

浏览器 

操作系统 

用户购买记录表 

购买记录表主键<pk> 

登记名 <fkl> 

家具编号<fk2> 

商品名称 

成交13期 

成交量 

成交价格 

IP地址 

浏览器 

操作系统 

商品表 

(3)补充路径:由于浏览器存在缓存,一些用户 

的操作并不能记录到Web 13志中,从而导致13志中 

鋈黍鲁码<pk> 

用户姓名 

性别 

年龄 

所在地 

工作单位 

从事的工作 

所学专业 

学历 

收入 

婚否 

联系电话 

Ip地址 

浏览器 

操作系统 

的记录路径信息不完整,通过分析将操作路径信息 

补充完整。 

2.4数据预处理 

该模块是系统的核心,包括一系列算法,最终生 

成商品推荐结果集。 

(1)商品关注度的几项指标 

商品关注度是商品推荐的主要指标,生成商品 

家具编号<pk> 

家具名称 

型号 

所属类别 

材质 

风格 

颜色 

推荐页面时按该用户对商品的关注度降序取出。表 

1是优先级从高到低的影响商品关注度的几项 

指标。 

表1 商品关注度的几项指标 

指标名称 关注度 

是否购买 购买该商品越多关注度越高。 

所在地域 用户和商家的地域越近,商品关注度越高。 

用户浏览13志表 

3志表主键 1<pk> 

登录名( ̄sessionlD)<fk> 

当前页面地址 

对页面的操作 

谁入当前页时间 

谁入下一页时间 

下一页地址 

用户登录时间 

退出登录时间 

开始会话时间 

退出会话时间 

IP地址 

市场价格 

会员价格 

促销价 

批发价 

品牌 

家具图片 

详细描述 

上传时间 

上传人 

所属商家 

配送地区 

浏览次数 

折扣 

商品评分 对商品评分越高,关注度越高。 

浏览次数 浏览商品次数越多,关注度越高。 

搜索商品 塞鲁 数越多,搜索关键字和商品月接近,关 

浏览时长 浏览该商品次数越多,关注度越高。 

浏览器 

操作系统 

图2原始数据源 

吴主 和其他用户越相似,和该用户商品关注度越接近。 

(2)协同过滤算法 

协同过滤推荐技术是推荐系统中最为成功的技 

2.3数据清理 

本系统数据大部分由网站程序采集。此外,服 

务器会自动采集一些信息存入Web日志中。由于 

Web 13志是以文本的形式存储,是半结构化数据且 

术之一,它始于20世纪90年代。其基本思想是:找 

存在许多无关信息,使用前需进行预处理。其步骤 

包括:清理数据、识别用户或会话、补充路径。 

(1)清理数据:是删除不相关的记录,主要包括 

以下几类: 

到与当前用户% 相似的其他用户ci,计算对象s对 

于用户的效用值u(c;,s),利用效用值对所有S进行 

排序或者加权等操作,找到最适合C。 的对象S 。 

其思想在13常生活中也有体现,例如,对一个人M 

不太了解,但对M的朋友F很熟悉,可通过F可推 

删除URI中后缀名为gif、jpg等图片或音视频 

2一 

第2期 戚永军等:美家365网上商城智能推荐系统研究与设计 2013年4月 

断出M的一些信息。在本系统中可以根据用户信 

出与其相似的用户,从预处理结果表中,按照商品的 

息表、商品评论表的信息推算出和其他用户的相似 

度,进而查询出相似用户的商品关注度。 

(3)序列模式分析 

序列模式是从序列数据库中发现相对时间或者 

关注度从高到低,取一定数量的商品,生成商品推荐 

页面呈现出来。 

3结语 

本文讨论了美家365网站商品智能推荐系统的 

系统需求和框架设计,该系统使网站具备一定的智 

能性,不仅能提供个性化服务,还能有效解决用户找 

不到满意商品,商家找不到正确促销对象的问题,防 

止顾客流失。系统不仅能满足美家365网站的业务 

需求,还对类似的系统开发有一定的参考价值。 

参考文献: 

[1]夏明波,王晓川.序列模式挖掘算法[J].计算机技术与 

发展,2006,16(4):4—6. 

其他顺序所出现的高频率子序列。目的是通过在带 

有交易时间属性的交易数据库中发现频繁项目序列 

以发现一时间段客户的购买活动规律。本系统中可 

根据用户购买记录表、用户搜索记录表、用户浏览日 

志表、web日志表的相关信息推算出用户对商品的 

感兴趣程度。 

(4)聚类分析 

聚类是将一个数据集中在某些方面相似的数据 

成员进行分类组织的过程。一个聚类就是一些数据 

[2]李燕,冯博琴,鲁晓锋.Web日志挖掘中的数据预处理技 

术[J].计算机工程,2009,35(22):44—46. 

[3]李晓明.搜索引擎:原理、技术与系统[M].北京:科学出 

版社,2005. 

实例的集合,这个集合中的元素彼此相似,但它们都 

与其他聚类中的元素不同。本系统通过聚类算法将 

用户分组从而定位一组用户对某类商品的关注度。 

经过以上算法,得出商品推荐结果集,存入预处 

理结果表中,该表结构比较简单分别为:表主键、用 

户登录名或Session id、商品表主键、关注度。 

2.5商品推荐 

[4]邱哲,符滔滔.开发自己的搜索引擎一一Lucene 2.0+ 

Heritrix[M].北京:人民邮电出版社,2007. 

[5]许海玲,吴潇,李晓东.互联网推荐系统比较研究[J].软 

件学报,2009,20(2):350—359. 

[6]张晗,潘正运,张燕玲.旅游服务只能推荐系统的研究与 

设计[J].微计算机信息,2006,22(5):170—172. 

用户访问该网站时取Session id和登录名,推算 

Intelligent Recommendation System in Meij ia 365 Online Shopping Mall 

Q I Yong-jun ZHAI Zhi-ping 

(1.Administration Center of Networks,North China Institute of Aerospace Engineeirng,Langfang 065000,China; 

2.Library,North China Institute of Aerospace Engineering,Langfang 065000,China) 

Abstract:Intelligent recommendation system,which is a important means of information filter,is an important way to solve the prob— 

lem of information overload.It can solve the issues of electronic commerce effectively.For example,users can not find satisfaction 

goods or businesses,nor can they find the irght promotional objects.In the paper,the intelligent recommendation system of Meijia 

365 online shopping mall is introduced from functional requirements to system architecture.Also the data collection process,data 

cleaning,data preprocessing re diascussed.In short,the system not only meets the demand of the users,but also has certain reference 

value for the similar system. 

Key words:online shopping mall;intelligent recommended;study;design 

3一 

本文标签: 用户商品推荐系统信息