logo资料库

2020美赛C题思路.doc

第1页 / 共1页
资料共1页,全文预览结束
C 题← 非常典型且传统的数据分析题目,用传统的数据分析方法分析得出 相关结果即可,也可以在传统方法上做出一定的创新,体现文章的综合创新性。, They have hired your team as consultants to patterns, key customer-supplied relationships,measures, and products to 1) ratings and inform reviewsassociated their online identify potentially important design productdesirability. Sunshine Company to inform sales strategies in thepast, but parameters with ident pa in other sales features has they strategyan woul that used data have not ofdata. based p that ify st competing d d 2) enhance previously Of atterns will used this particular particular interest in help thesedata, the company to and Sunshine whether combination Company and are type time- they interact in ways craft successfulproducts.。 第一问根据题意可以发现,第一问只需要对数据挖掘出最原始的相关信息即可, 在对数据集进行比较原始的 EDM 分析,分析确定数据的原始结构特征,之后最简 单的方法可以选择最小二乘回归、典型相关分析法,其他可以选择的有 Apriori 算法或者 FP-growth 算法。 第二问 ia.可以在原始分析出数据的基础上设置一定的最优化函数,对函数进行 相关求解,也可以选择-些比较传统的机器学习方法, 对数据做输入,如神经 网络等黑箱模型,画图、得出表格从而做出判断。b.将时间作为另外- 采用时间序列相关分析如灰色关联预测等,或者做出创新性分析。C. 建立模型 求解最优,就是该问的答案,但是要注意写文章的时候尽可能用一些可视化的方 法呈现出来,增添文章的美感。d.条件概率模型,可以参考朴素贝叶斯估计方法, e.比 较典 型的 文 本分 析, 可以 选 择使 用上 文 中提 到的 Apriori 算 法或 者 FP-growth 算法对文本进行挖掘。相关的文本处理方法很容易快速学习。。 -个变量,
分享到:
收藏