ComputerEngineeringandApplications计算机工程与应用2016,52(5)1引言随着移动通信技术的发展和智能设备的普及,越来越多的人倾向于通过智能手机、平板来获取信息和服务[1]。与此同时,在移动互联网环境中,信息资源的获取和推送可以不受时间、地点和方式的限制,为用户提供无处不在的信息资源已成为可能,用户可以通过手机浏览新闻,欣赏音乐或电影,使用微博、微信等[2]。但是移动互联网服务和信息内容的日益增长将逐渐超出人们所能接受的范围,为用户带来沉重的“信息过载”问题,导致网络资源利用率和用户体验受到严重影响。推荐系统通过建立用户与项目之间的二元关系,利用已有的选择过程或相似性关系挖掘每个用户潜在感兴趣的对象,进而进行个性化推荐,从而可以有效缓解信息过载的问题[3]。目前推荐系统主要分为基于协同过滤推荐,基于内容的推荐,混合推荐三种推荐技术[4]。但对移动通信环境下用户信任研究涉及较少,另外传统推荐算法忽视了用户通信上下文等信息[5-7]。本文针对传统协同过滤在移动通信环境中存在的弊端,利用移动通信上下文信一种基于信任的协同过滤推荐模型郑孝遥1,2,鲍煜1,孙忠宝2,罗永龙1ZHENGXiaoyao1,2,BAOYu1,SUNZhongbao2,LUOYonglong11.安徽师范大学数学计算机科学学院,安徽芜湖2410032.安徽师范大学国土资源与旅游学院,安徽芜湖2410031.SchoolofMathematicsandComputerScience,AnhuiNormalUniversity,Wuhu,Anhui241003,China2.CollegeofTerritorialResourcesandTourism,AnhuiNormalUniversity,Wuhu,Anhui241003,ChinaZHENGXiaoyao,BAOYu,SUNZhongbao,etal.Collaborativefilteringrecommendationmodelbasedontrust.ComputerEngineeringandApplications,2016,52(5):50-54.Abstract:Thetraditionalcollaborativefilteringtechnologycarriesontherecommendationmainlybasedonuser-itemdataset,andcannotefficientlyusethecontextualinformationofusercommunication,therebytherecommendedaccuracyisfur-therconstrained.Aimingattheshortcomingsoftraditionalcollaborativefilteringrecommendationalgorithm,inthispaper,itfusescommunicationcontextualinformationintothecollaborativefilteringalgorithm,andintroducesthreetypestrustincludingcommunicationtrust,similaritytrustandtransmissiontrust,andatrust-basedcollaborativefilteringrecom-mendationmodelisalsoproposed.Experimentsonthepublicdatasetdemonstratethattherecommendationalgorithmout-performsthetraditionalcollaborativealgorithm.Keywords:collaborativefiltering;trust;recommendation;mobilecommunication摘要:传统的协同过滤推荐技术主要基于用户-项目评价数据集进行挖掘推荐,没有有效地利用用户通信上下文信息,从而制约其进一步提高推荐的精确性。针对传统协同过滤推荐算法存在的推荐精度不高的弊端,在协同过滤算法中融入通信上下文信息,引入了通信信任、相似信任和传递信任三个信任度,并提出了一种基于信任的协同过滤推荐模型。通过公开数据集验证测试,证明提出的推荐算法较传统的协同过滤推荐技术在推荐准确性上有较大提高。关键词:协同过滤;信任;推荐;移动通信文献标志码:A中图分类号:TP391doi:10.3778/j.issn.1002-8331.1507-0016基金项目:国家自然科学基金(No.61370050);安徽高校自然科学研究项目(No.KJ2015A067,No.KJ2014A088);芜湖市科技计划重点项目(No.2015cxy10);安徽师范大学校创新基金项目(No.2015cxjj10)。作者简介:郑孝遥(1981—),男,在读博士,研究领域为信息安全与个性化推荐,E-mail:zxiaoyao_2000@163.com;鲍煜(1993—),男,研究领域为个性化推荐;孙忠宝(1980—),男,在读博士,研究领域为区域资源开发与环境保护;罗永龙(1972—),男,博士,教授,博士生导师,研究领域为可信计算、安全计算、空间数据处理。收稿日期:2015-07-01修回日期:2015-10-16文章编号:1002-8331(2016)05-0050-05CNKI网络优先出版:2015-10-28,http://www.cnki.net/kcms/detail/11.2127.TP.20151028.1526.012.html50
2016,52(5)息,引入了通信信任、相似度信任和传递信任的三个信任度计算方法,并提出了一种基于移动通信信任的协同过滤推荐模型(MobileTrustCF),最后通过与传统协同过滤推荐模型的比较,表明该模型在推荐准确性上有较大提高。本文旨在从信任的角度去优化推荐算法来提高推荐的准确性。2相关工作2.1协同过滤基于协同过滤(CollaborativeFiltering,CF)的推荐是根据其他相似用户对某个条目的评价,以及这些用户和目标用户的相似度,来预测目标用户对该条目的喜好程度[8]。其中相似性度量方法是协同过滤推荐的关键因素[9]。相似性的度量方法主要包括3种:余弦相似性、Pearson相关系数和斯皮尔曼等级相关(Spearman’sRankCorrelation)[10]。其中Pearson相关系数计算方法是最常用的一种,具体计算方法如下:sim(xy)=åsÎSxy(rxs-rˉx)(rys-rˉy)åsÎSxy(rxs-rˉx)2´åsÎSxy(rys-rˉy)2(1)其中Sxy=SxSy表示用户ux和用户uy评分项目的交集;rxs表示用户ux对项目s的评分;rˉx表示用户ux的平均评分。因此,传统的CF推荐可以通过相似度度量计算出用户ux对项目s预测评分,如式(2)。r̂xs=rˉx+åujÎNxsim(xj)(rjs-rˉj)åujÎNxsim(xj)(2)其中Nx表示用户ux的邻居用户集合。2.2基于信任的协同过滤推荐文献[11]在传统的协同过滤推荐基础上引入了信任,实验结果表明基于信任的协同过滤推荐算法要比单纯的协同过滤效果更好。文献[12-15]也表明引入信任机制的推荐系统的准确度更高。式(3)给出了基于信任的协同过滤推荐计算方法。r̂xs=rˉx+åujÎUTxTxj(rjs-rˉj)åujÎUTxTxj(3)其中Txj表示用户ux对用户uj的信任度,UTx表示用户ux的信任用户集。由于文献[11]中的信任度的定义是基于传统P2P网络的,没能应用移动通信网中丰富的上下文信息,不能很好地适应移动通信环境[16]。本文针对上述2种协同过滤模型存在的弊端,提出一种基于移动通信信任的协同过滤推荐模型。3基于移动通信信任的推荐方法3.1信任度定义定义1(通话信任)设被推荐用户ui与其邻居用户uj的通话频次为kijNi表示与用户ui通话的用户集,本文称为用户ui的邻居用户,则用户ui与用户uj通话信任定义为:TCij=kij´æèçöø÷åtÎNikit-1(4)定义2(短信信任)设被推荐用户ui与用户uj的短信通话频次为k′ij则用户ui与用户uj短信信任定义为:TMij=k′ij´æèçöø÷åtÎNik′ij-1(5)定义3(信任等级)被推荐用户ui根据通讯录分组以及最近通信详情将通信用户uj动态生成信任等级评分Rij(RijÎ[01])。本文根据通话频次动态调整用户的信任等级,其默认值设置如表1。定义4(通信信任)则根据上述定义,被推荐用户ui与其邻居用户uj之间的通信信任值定义为:TPij=Rij´(α´TCij+(1-α)TMij)(6)其中0α1。定义5(相似度信任)假设用户ui和用户uj有1个共同通信用户集UC={uk1uk2ukn}则被推荐用户ui与通信用户集UC之间的通信信任向量为X(TPi);用户uj与所述通信用户集UC之间的通信信任向量X(TPj);则推荐用户ui和用户uj之间的评价相似度信任值定义通话信息短信信息社交关系广告新闻景点推荐影响移动上下文移动通信用户推荐项目图1移动通信推荐示意图通讯录分组家人朋友同学同事陌生人信任等级0.80.60.40.40.2表1信任等级默认值郑孝遥,鲍煜,孙忠宝,等:一种基于信任的协同过滤推荐模型51
ComputerEngineeringandApplications计算机工程与应用2016,52(5)为式(7),图2给出了相似度信任的示意图。TSij=ål=1nTPikl´TPjklål=1n(TPikl)2´ål=1n(TPjkl)2(7)定义6(传递信任)现实移动通信环境中,用户uj并不是ui的邻居用户,但是他们有共同的朋友,因而他们之间通过朋友间的信任传递也存在一定的信任度,本文将其定义为传递信任,图3给出传递信任的示意图。其数学描述如下:TTij=1lål=1nTPikl´TPklj(8)定义7(综合信任)根据上述三种信任得出用户ui和用户uj之间的综合信任值,其数学描述如下:Tij=β1´TPij+β2´TSij+β3´TTij(9)其中β1+β2+β3=1。3.2推荐模型及算法根据上述3.1节中信任度的定义,本文将其应用于协同过滤推荐算法,构建一种基于移动通信信任的协同过滤推荐模型,具体过程如下:(1)根据用户的移动通信上下文信息构建用户间通信信任。(2)根据用户社交关系及通信信任计算用户间的传递信任、相似度信任。(3)根据上述的三种信任以及信任等级计算用户综合信任并构建用户综合信任矩阵。(4)推荐系统获取被推荐用户的邻居集,并根据用户-项目历史评分数据集计算出被推荐项目的预测评分r̂ij。设项目集为S={s1s2sn}则r̂ij定义为如下:r̂ij=rˉi+åukÎNiTik(rkj-rˉk)åukÎNiTik(10)算法1基于移动通信信任的推荐算法输入kijk′ijRijαβ1β2β3输出r̂ij1:For"ujÎNiDO2:caculateTCijTMij3:TPij¬Rij´(α´TCij+(1-α)TMij)4:For"uKlÎUCDo5:caculateTSijTTij6:EndFor7:Tij¬β1´TPij+β2´TSij+β3´TTij8:EndFor9:For"ukÎNiDO10:caculaterˉkTik11:EndFor12:r̂ij¬rˉi+åukÎNiTik(rkj-rˉk)/åukÎNiTik4实验4.1仿真数据集本文采用MovieLens、Last.FM和Jester三个公开数据集,其中MovieLens数据集是由GroupLens项目组收集的用户-项目评分数据集,该数据集包含943个用户对1682部电影的100000条评级信息;Last.FM数据集收集自Last.FM在线音乐系统,该数据集包含1892个相互关注的用户对17632张音乐专辑的92834条收听信息,在本实验中,将用户对某专辑的收听次数量化为该用户对专辑的评分;Jester数据集是2006年11月到2009年5月间收集的包含59132个用户对150个笑话的评分,其中每个用户至少评价了36条笑话。4.2实验分析(1)敏感性分析该实验主要分析参数α、用户数及β1、β2和β3的信uk1uk2uknujuiTPik1TPik2TPiknTPjknTPjk2TPjk1TSij图2相似信任示意图uk1uk2uknTPik1TPik2TPiknTPk1jTPk2jTPknjTTijujui图3传递信任示意图通信信任传递信任相似信任信任等级信任计算综合信任预测评分选择最优项目用户-项目评分集综合信任邻居集待预测项目评分集图4基于信任的推荐示意图52
2016,52(5)任权衡系数对本文提出的MobileTrustCF推荐精度的影响,本文中首先在MoiveLens数据集上进行敏感性分析,然后选择最优参数与其他几个模型进行比较,图5和图6分别给出了不同α取值对MobileTrustCF的RMSE和MAE两个指标影响。由图5~6可以得出,当α取0.5时,MobileTrustCF具有最优性能。本文在下面的实验中取α=0.5进行实验分析。图7给出了不同用户规模下MobileTrustCF模型的RMSE值随用户数变化的趋势。可以看出,RMSE的值随网络用户数的增大而减小并且逐渐趋于稳定。在其他参数默认设置下,表3给出了不同信任权衡系统组合对MobileTrustCF的影响。实验表明,相对于其他信任权衡系数组合,在β1=0.5β2=0.3β3=0.2时,本文提出的MobileTrustCF最优。(2)性能对比分析为了验证MobileTrustCF的推荐精度,本文将其与TraditionalCF[9],TrustCF[11]两种经典的协同过滤推荐模型在三个数据集上进行性能对比分析,图8~13分别给出了推荐数在[1,10]区间的Precision和Recall两个性能指标的对比。总体上,由图8至图13的数据显示,三种算法的Precision值随着推荐项目数的增大而减小,且推荐精00.20.40.60.81.01.021.011.000.990.980.970.96αRMSE图5α对RMSE的影响00.20.40.60.81.00.920.900.880.860.840.820.800.780.760.74αMAE图6α对MAE的影响020040060080010003.53.02.52.01.51.00.5用户数RMSE图7用户数对RSME的影响02468100.650.600.550.500.450.400.350.30推荐数PrecisionMobileTrustCFTraditionalCFTrustCF图8MovieLens数据集的Precision2468100.90.80.70.60.50.40.30.20.1推荐数RecallMobileTrustCFTraditionalCFTrustCF0图9MovieLens数据集的Recall02468100.650.600.550.500.450.400.350.30推荐数PrecisionMobileTrustCFTraditionalCFTrustCF图10Jester数据集的Precision参数β1β2β3组合β1=0.9β2=0.1β3=0.0β1=0.8β2=0.1β3=0.1β1=0.7β2=0.2β3=0.1β1=0.6β2=0.2β3=0.2β1=0.5β2=0.3β3=0.2β1=0.4β2=0.3β3=0.3β1=0.3β2=0.4β3=0.3β1=0.2β2=0.4β3=0.4β1=0.1β2=0.5β3=0.4MAE0.8320.8080.7930.7810.7740.7950.8250.8530.871RMSE1.1061.0631.0300.9980.9701.0471.0891.1471.152表2信任权衡系数对推荐精度的影响郑孝遥,鲍煜,孙忠宝,等:一种基于信任的协同过滤推荐模型53
ComputerEngineeringandApplications计算机工程与应用2016,52(5)度差距逐渐缩小,而Recall值随着推荐项目数的增多而增大;其中,MobileTrustCF的precision值和Recall指标在Top-1至Top-10的推荐区间内优于TrustCF和TraditionalCF。表2~4给出了在推荐数为1(TOP-1)时的Precision、Recall、MAE和RMSE四个性能指标的具体数值,该实验进一步的分析和验证了三种推荐算法的性能特性。由表3~5可知,MobileTrustCF的推荐精度相较于基于信任的协同过滤推荐算法(TrustCF)和传统的协同过滤推荐算法(TraditionalCF)有较大改进,而在Precision和Recall两个指标上也有较高的提升。对比实验表明MobileTrustCF具有较强的适应性和较好的推荐准确性。图14给出了三种算法在不同邻居数下的MAE值。从图中可以看出每种算法的MAE值随着邻居数的增长而逐渐减小。与TraditionalCF和TrustCF相比,本文提出的MobileTrustCF具有更好的推荐精度。5结束语本文提出了一种移动通信网中基于信任的协同过滤推荐模型,并在推荐算法中融入了通信上下文信息,引入通信信任、相似信任和传递信任三种信任组成的综合信任,从而提高了推荐的准确率。在公开数据集中的实验表明,本文提出的推荐模型相比传统的协同过滤推荐模型有更好的推荐精度。下一步将引入移动通信环境中的位置信息来进行基于位置服务的具有当地特色的个性化服务推荐。参考文献:[1]孟祥武,胡勋,王立才,等.移动推荐系统及其应用[J].软件学报,2013,24(1):91-108.[2]孟祥武,王凡,史艳翠,等.移动用户需求获取技术及其应用[J].软件学报,2014,25(3):439-456.[3]刘建国,周涛,汪秉宏.个性化推荐系统的研究进展[J].自然科学进展,2009,19(1):1-15.02468100.650.600.550.500.450.400.350.30推荐数PrecisionMobileTrustCFTraditionalCFTrustCF图12Last.FM数据集的Precision2468100.90.80.70.60.50.40.30.20.1推荐数RecallMobileTrustCFTraditionalCFTrustCF0图13Last.FM数据集的Recall2468100.90.80.70.60.50.40.30.20.1推荐数RecallMobileTrustCFTraditionalCFTrustCF0图11Jester数据集的Recall指标MAERMSEPrecisionRecallTraditionalCF0.8431.2100.3250.122TrustCF0.7821.1500.5230.230MobileTrustCF0.7720.9300.5980.263表4Jester数据集推荐精度比较指标MAERMSEPrecisionRecallTraditionalCF0.8101.3100.3980.130TrustCF0.7751.0200.5120.211MobileTrustCF0.7600.9100.6130.268表5Last.FM数据集推荐精度比较指标MAERMSEPrecisionRecallTraditionalCF0.8051.3400.3410.112TrustCF0.7781.1600.4980.190MobileTrustCF0.7740.9700.6110.250表3MovieLens数据集推荐精度比较0510152025300.830.820.810.800.790.780.77邻居数MAEMobileTrustCFTraditionalCFTrustCF图14三种算法推荐精度对比(下转60页)54
ComputerEngineeringandApplications计算机工程与应用2016,52(5)了系统的优化研究,采用了指数平滑预测机制进行负载检测,提前整合虚拟机;着重设计了感知能耗的BFD-SA算法,利用BFD局部搜索算法得到的解作为SA的初始解,并改进SA算法以找到使得系统能耗增量最小的虚拟机重分配方案;综合考虑整合力度和SLA满足率之间的制约关系,选用ESV指标评价算法性能。仿真结果表明,该算法可以在降低系统能耗的同时减少SLA违约率。今后的工作将继续针对变化的负载和异构的云数据中心进行研究,从提高负载预测精度和减少分配完成时间的角度优化整合算法,进一步减少系统总能耗。参考文献:[1]田贺喆.数据中心能耗和能效现状[EB/OL].[2015-03-10].http://tech.idcquan.com/pro/63329.shtml.[2]叶可江,吴朝晖,姜晓红,等.虚拟化云计算平台的能耗管理[J].计算机学报,2012,35(6):1262-1285.[3]何丽,饶俊,赵富强.一种基于能耗优化的云计算系统任务调度方法[J].计算机工程与应用,2013,49(20):19-22.[4]VilaplanaJ,MateoJ,TeixidóI,etal.AnSLAandpower-savingschedulingconsolidationstrategyforsharedandheterogeneousclouds[J].TheJournalofSupercomputing,2015,71(5):1817-1832.[5]HosseinimotlaghS,KhunjushF,SamadzadehR.SEATS:smartenergy-awaretaskschedulinginreal-timecloudcomputing[J].TheJournalofSupercomputing,2015,71(1):45-66.[6]许波,陈珂,朱兴统,等.云计算中基于能耗优化的虚拟机多目标放置算法[J].小型微型计算机系统,2014(6).[7]孙冬冬,柳青,武旖旎.面向负载均衡的自主式虚拟机动态迁移框架[J].计算机科学,2014(4):80-85.[8]魏亮,黄韬,陈建亚,等.基于工作负载预测的虚拟机整合算法[J].电子与信息学报,2013(6):1271-1276.[9]KusicD,KephartJO,HansonJE,etal.Powerandper-formancemanagementofvirtualizedcomputingenviron-mentsvialookaheadcontrol[J].ClusterComputing,2009,12(1):1-15.[10]BeloglazovA,AbawajyJ,BuyyaR.Energy-awareresourceallocationheuristicsforefficientmanagementofdatacentersforcloudcomputing[J].FutureGenerationCom-puterSystems,2012,28(5):755-768.[11]MetropolisN,RosenbluthAW,RosenbluthMN,etal.Equationofstatecalculationsbyfastcomputingma-chines[J].JournalofChemicalPhysics,1953,21(6):1087-1092.[12]王凌.智能优化算法及其应用[M].北京:清华大学出版社,2001.[13]CalheirosRN,RanjanR,BeloglazovA,etal.Cloud-Sim:atoolkitformodelingandsimulationofcloudcomputingenvironmentsandevaluationofresourceprovisioningalgorithms[J].Software:Practice&Experi-ence,2011,41(1).[14]BeloglazovA,BuyyaR.Optimalonlinedeterministicalgo-rithmsandadaptiveheuristicsforenergyandperfor-manceefficientdynamicconsolidationofvirtualmachinesinclouddatacenters[J].ConcurrencyandComputation:PracticeandExperience,2012,24(13):1397-1420.[15]张亮,王凌,郑大钟.有限计算量下模拟退火算法的参数序优化[J].控制与决策,2004(2):226-229.[4]AdomaviciusG,TuzhilinA.Towardthenextgenerationofrecommendersystems:asurveyofthestate-of-the-artandpossibleextensions[J].IEEETransactionsonKnow-ledgeandDataEngineering,2005,17(6):734-749.[5]YuanW,ShuL,ChaoHC,etal.ITARS:trust-awarere-commendersystemusingimplicittrustnetworks[J].IETCommunications,2010,14(4):1709-1721.[6]JamaliM,EsterM.Amatrixfactorizationtechniquewithtrustpropagationforrecommendationinsocialnetworks[C]//Proceedingsofthe4thACMConferenceonRecom-menderSystems,2010:135-142.[7]LiuQ,XiongY,HuangW.Combininguser-basedanditem-basedmodelsforcollaborativefilteringusingstackedregression[J].ChineseJournalofElectronics,2014,23(4):712-717.[8]SarwarB,KarypisG,KonstanJ,etal.Item-basedcolla-borativefilteringrecommendationalgorithms[C]//Proceed-ingsofthe10thACMInternationalConferenceonWorldWideWeb,2001:285-295.[9]GoldbergD,NicholsD,OkiBM,etal.Usingcollabora-tivefilteringtoweaveaninformationtapestry[J].Com-municationsoftheACM,1992,35(12):61-70.[10]许海玲,吴潇,李晓东,等.互联网推荐系统比较研究[J].软件学报,2009,20(2):350-362.[11]MassaP,AvesaniP.Trust-awarerecommendersystems[C]//Proceedingsofthe2007ACMConferenceonRecom-menderSystems,2007:17-24.[12]ChenCC,WanYH,ChungMC,etal.Aneffectiverecommendationmethodforcoldstartnewusersusingtrustanddistrustnetworks[J].InformationSciences,2013,224:19-36.[13]朱强,孙玉强.一种基于信任度的协同过滤推荐方法[J].清华大学学报:自然科学版,2014(3):360-365.[14]黄武汉,孟祥武,王立才.移动通信网中基于用户社会化关系挖掘的协同过滤算法[J].电子与信息学报,2011,33(12):3002-3007.[15]乔秀全,杨春,李晓峰,等.社交网络服务中一种基于用户上下文的信任度计算方法[J].计算机学报,2011,34(12):2403-2413.[16]王玉祥,乔秀全,李晓峰,等.上下文感知的移动社交网络服务选择机制研究[J].计算机学报,2010,33(11):2126-2135.(上接54页)60