logo资料库

2017年高教杯全国大学生数学建模B题“拍照赚钱”的任务定价论文(山东省二等奖).pdf

第1页 / 共24页
第2页 / 共24页
第3页 / 共24页
第4页 / 共24页
第5页 / 共24页
第6页 / 共24页
第7页 / 共24页
第8页 / 共24页
资料共24页,剩余部分请下载后查看
一、问题重述
二、问题分析
三、模型假设
四、符号说明
五、模型的建立与求解
5.1问题一模型的建立与求解
5.2问题二模型的建立与求解
5.3问题三模型的建立与求解
5.4问题四模型的建立与求解
六、灵敏度分析
七、模型评价与推广
7.1模型的优点
7.2模型的缺点
7.3模型的推广
八、参考文献
九、附录
项目定价规律在生活中的运用 摘要 随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代飞速到来, 人们开始新的生活方式。同时软件开发模式带来了革新的机遇,通过拍照赚钱来 完成任务赚取酬金的自助服务模式的 APP,其核心要素是任务定价。 针对问题一,我们使用 BDP(商业数据平台)对附件一中的各个变量进行了绘 图,定位,进行数据预处理去除异常数据,发现未完成区域多集中在广州市的白 云区,佛山市和深圳市。衡量数据点间的相似性,采用数据挖掘中最远距离函数 进行相似性度量,通过任务执行情况和任务标价的之间的关联图采用R型聚类分 析的方法,得到任务未完成是任务价格,天气原因,地理位置,人口密度,突发 状况为辅的五个因素所决定的。 针对问题二,影响定价的因素是多样的,总结了九个因素,更全面的分析问 题,据此来制定新的定价方案。因此采用了层次分析法来构建数学模型,对找到 的因素进行了层次分析,得到了其在新的定价方案中的权重。最后将新的方案和 原方案进行比较,虽存在着误差,可以增加会员的任务完成度。 针对问题三,随机抽取某段交通网络系统,并在附件二数据中随机抽取 20 名会员,根据其到任务点的实际距离建立模型,通过对模型的求解得出最优调度。 据此,可以在任务打包分配的时候使用该模型,减少了任务时间,提高了效率, 增加任务完成的成功率。 针对问题四,采用了层次分析法数学模型得到的新定价方案,对附件三中的 部分数据进行了处理将得到的数据与附件一中提供的真实数据进行了比较,发现 该方案实施效果较好。未完成任务较多的区域的价格稍高,一定程度上可以增加 任务的完成率。 局部灵敏度分析法对其进行分析,发现虽然经过改进,但任务复杂状况依然 影响任务的完成度,虽然灵敏度与地理位置有较大关系,但是当任务复杂度较低 时,地理位置对任务完成度的影响较大,而其他因素对任务完成度的影响不大。 关键词:互联网+ 软件众包 聚类分析 动态规划 层次分析法 数据挖掘
一、问题重述 随着信息技术与智能移动终端的飞速发展和普及,“互联网+”时代飞速到来, 人们开始新的生活方式。同时也为软件开发模式带来了革新的机遇,本文中提到 的是一款通过拍照赚钱来完成任务赚取酬金的自助服务模式,平台的运行核心为 APP, 不同于传统的市场调查方式,APP 中的核心要素是任务定价。当此任务的 任务定价相对较高时,会员会更倾向于进行该任务的调查,因此,我们对定价因 素与会员完成情况进行了分析,从而更加节约总任务成本,又使不同地区会员倾 向于接取发布的任务。 1.1 问题一 分析附件一,通过各个变量间的关系得到项目的任务定价规律,对任务未完 成原因进行分析。 1.2 问题二 设定新的任务定价方案从而制定新的评价指标体系,与原方案比较,分析与 原方案相比有哪些改进。 1.3 问题三 在多个任务可能因为位置比较集中导致用户会争相选择的实际情况下,将这 些任务联合在一起打包发布。如何修改定价模型,并分析对最后任务完成情况影 响。 1.4 问题四 对附件三中的项目使用制定的任务定价方案,评价任务定价方案的实施效果。 二、问题分析 2.1 问题一的分析 通过附录一中的数据,我们使用GPS(全球定位系统)对其进行了定位分析, 得到了大概的地理位置,对数据进行并且进行了数据预处理,发现未完成区域集 中分布,从用最远距离函数进行变量间的相似性度量,分析变量间的相似度,分 析了任务执行情况、任务标价分别在地图上的分布情况的形成原因,通过任务执 行情况和任务标价的之间的关联图采用R型聚类法,发现任务未完成和任务标价
之间的关系,从而根据任务的定价规律,得到任务未完成的原因由任务价格,天 气原因,地理位置,人口密度,突发状况为辅的五个因素所决定。 2.2 问题二的分析 制定新的定价方案,并且还要和原方案进行比较。制定新的定价方案,需要 考虑多方面的因素,我们分别对任务点的社会状况、交通状况和突发状况进行数 据查找,总结了九个影响任务定价方案的因素,分别是:地形地貌、节假日、人 口密度、店家拒访、交通便捷、任务复杂状况、恶劣天气、易发堵车还有就是经 济发展。影响任务定价的原因虽然很多,但是影响效果大小不一。因此我们采用 层次分析法建立数学模型,分别确认了各个因素所占的权重,据此制定了新的定 价方案。和原方案相比,在某种程度上,我们新的方案更为精确。 2.3 问题三的分析 任务集中时,用户之间会产生竞争,而距离最近的用户完成任务的概率最大, 因此我们对会员所在位置与任务点的距离进行了分析。 我们根据经纬度找了会员相对集中的的位置,取附件二数据中取例测试,在 该地区有 20 名会员,根据其到任务点的实际距离建立模型,通过对模型的求解 得出最优调度。根据实际情况,首先要对数据进行预处理,我们利用 Flod 算法 求解出他们之间的实际最短路程。然后得到每个会员范围内所能收到的任务。据 此,我们可以在任务打包分配的时候使用该模型,增加任务完成的成功率。 2.4 问题四的分析 我们采用了层次分析法数学模型得到的新定价方案,对附件三中的部分数据 进行了处理,并将得到的数据与附件一中提供的真实数据进行了比较,发现该方 案实施效果较好。未完成任务较多的区域的价格稍高,一定程度上可以增加任务 的完成率。 三、模型假设 1.每个市的会员只能在本区内完成任务; 2.会员接到任务不考虑其反应时间; 3.假设数据的微小差距是误差允许的;
4.认为问题中的给出的数据能客观反映现实情况,值得相信; 四、符号说明 含义 目标层 准则层 ( =i 1,2,3) 方案层 ( =i 1,2,3...9) 社会状况 交通状况 突发状况 地形地貌 节假日 人口密度 店家拒访 经济发展 任务复杂状况 交通便捷 易发堵车 恶劣天气 最大特征值 权重向量 符号 M iC iP 1C 2C 3C 1P 2P 3P 4P 5P 6P 7P 8P 9P maxλ ω
五、模型的建立与求解 5.1 问题一模型的建立与求解 首先我们使用 MATLAB 以经纬度为坐标轴来分析任务执行情况,得到图 1(完 成任务情况图)。并观察图 1(完成任务情况图)发现任务完成情况呈现聚集分布。 图 1 完成任务情况图 首先通过图片我们可以清晰的看出不能完成任务的数据分布较集中,所以采 用聚类分析的方法,其次数据中存在孤立点,孤立点经常会导致有偏差的聚类结 果,所以对其进行数据预处理。但由于该图像所表达出客观因素不明显,对任务 完成因素及其任务定价的展示较弱,所以我们使用 BDP 软件对附件一中的 GPS 信息进行了处理,分析了得到了每个点的任务执行情况,如图 2(任务完成情况 在地图上的分布)所示。
图 2 任务完成情况在地图上的分布 通过图 2(任务完成情况在地图上的分布),可以得到任务未完成区域多集 中在广东省的广州市的白云区,佛山市和深圳市以及周边乡镇,我们设想是任务 定价过低所以由于这些地区任务完成情况较弱,所以我们对每个点的任务定价做 了热力图,如图 3(任务定价在地图上的分布)所示。 图 3 任务定价在地图上的分布
通过附录一中的数据,我们使用GPS对其进行了定位分析,对数据进行并 且进行了数据预处理,发现未完成区域集中分布,用最远距离函数进行变量间的 相似性度量分析了任务执行情况、任务标价分别在地图上的分布情况的形成原因, 通过任务执行情况和任务标价的之间的关联图采用R型聚类法[1]。 首先用变量相似性度量。在对比变量进行聚类分析时,确定变量的相似度量,采 取相似性度量为相关系数,方法如下: 记变量 mx 的取值 ( x m 1 , x 2 m ,  x nm T ) ∈ i R m ( = 1,2,3  ) r n r (1) ( ! ) ! n ! − 则可以用两变量 mx 与 zx 的样本相关系数作为它们的相似性度量,为 n ∑ i 1 = (x im − x m )(x iz − x z ) (x im − x m 2 ) (2) (x iz − x z 2 ) 1 2    n ∑ i 1 = r mz =    n ∑ i 1 = 其次用变量聚类法将以上影响因素分类。这里,我们采取最长距离法解决变 量聚类问题,具体过程如下: 在最长举距离法中,定义两类变量的距离为 R G G ( 2 , 1 ) = d max { ∈ x G x G ∈ m 2 1 , z } mz (3) 其中, d mz 1= − r (4) mz d 2 mz 1= − 2 r (5) mz 此时, 1 2 R G G 与两类中相似性最小的两变量间的相似性度量值有关。 ( ) , 将各影响因素之间的关联系数矩阵作为输入参数,经过聚类分析将相关程度 较大的影响因素作为输出。从而得到任务未完成的影响因素。 通过 SPSS 进行聚类分析,得到的聚类表,截取部分内容如图 4:
图 4 各个变量之间的聚类表 总共 1862 组据,在 1843 开始出现了阶群集,系数也在不断增大,而且某些 变量是具有相关性的,同时进行聚类分析,就相当于他们所代表的这一因素的权 重较大。将出现阶群集的数据整理发现,这些数据具有集中性,间接表明了聚类 的稳定性。将数据所在点进行对比,通过图表及数据总结任务未完成区域任务未 完成的主要原因如下: 深圳市虽定价相对较高,会员相对集中,但是人均消费水平高、人群生活节 奏快、台风暴雨等恶劣天气普遍,不仅影响店铺的营业,甚至引起交通堵塞影响 人们的出行,因此深圳市任务未完成的多。 广州市的白云区定价相对较高,会员相对集中,但是聚集着大型商业广场,
分享到:
收藏