首要届太普华南杯数据挖掘竞赛


题目说明:1、参赛运动员可从下述试题中任选一题作答,并在舆论报告中标明
2、舆论等级会综合考虑论文质量和零度系数


题目一 飞行客运信息挖掘(零度系数:1.0)
众多人口都听说过俄的北美航空、摩洛哥的西北航空等企业的大名。那些企业中标之门槛就是擅于增强劳动生产率。为了争到客源,一部分商家甚至提出了与长途巴士进行价格竞争之口号。如此看来,境内航空公司并不是把其他航空公司当作主要竞争对象,重要对手应当是火车或汽车。方便的低票价,名将使航空资源得到充分运用,如果空座率居高不下,哪怕票价卖得很高,自身就已经出现了主题性亏损。
基金例就是希望从股份公司感兴趣的主题,例如流失预测、他家细分和用户价值评估等方面,穿过数据挖掘技术,落实提升航空客运的上镜率目标。
公报数据集来自国内某种子公司的议员数据,共有62988个样本,每个样本有63个属性,各属性说明见“总量含义”Sheet页。除了每个用户的核心资料外,该数据集还包含了一番观测窗(2年)内8个季度的客户飞行数据,包括乘机次数、里程、等级分等。参赛者可尽量使用任何的数据挖掘技术来发现尽可能多之胆识,提议的数据挖掘主题包括但不限于建立客户流失模型、他家细分和用户价值评估。


题目一数目下载:题目一数目集


题目二 道路缺陷自动识别(零度系数:1.0)
都市道路是都市建设之重要品种之一,水利建设涉及面较广,水利条件较复杂,是由多项目、多工序彼此交错和相互制约所构成的线形工程,影响工程质量的要素较多,施工中不可避免地会出现不同档次的质问题,表面 1列入了根本的征途缺陷类型,如龟裂,裂痕,网裂,坑槽,剥落等,详细图像数据见附件。请采用图像处理技术,对不同缺陷类型进行特征提取,并利用数据挖掘技术进行模式识别,落实不同道路缺陷类型的机关识别。

表面一.jpg


题目二数目下载:题目二道路缺陷图像


题目三 肝癌手术治疗作用评价(零度系数:0.7)
分选某医院10年来肝癌病例总共4860例,每个病例有病人近80个信息,其中包括患者病历号、性别、年龄、学历、工作、住址、基本病史、医疗体征、恶性肿瘤分类、办公室检验指标、影像学检查等,途经数据预处理,分选其中20个有决定性的样本,分选对预后有影响之l0个指标如表2。

表面二.jpg

各指标项说明见表3。

表面三.jpg

请以预后影响作为评价标准,成立数据挖掘模型,对针灸的诊治作用和方案之高低进行预测,为患者规划最佳的针灸和诊治方案。


题目三数目下载:题目三数目集

     本届大赛吸引了全国近二十所高等院校相关专业的学童参加,竞技于2013年3月9日正式开始,2013年4月21日参赛者提交作品,比赛结束。开赛总共收到56份优秀数据挖掘论文,途经威尼斯网站技术有限公司、港澳师范大学历时半月的评审,最终决出特等奖作品一份、二等奖作品三份、一等奖作品三份、一等奖作品五份、优质论文奖作品十六份、成功入围奖作品十九份。评说结果考虑到了不同题目的灵敏度系数。出于研究生队伍的舆论质量大面积高于本科生队伍,二等奖及一、二、一等奖中,舆论质量接近的,本科生队伍排名在未来。

 
获奖者名单:

二等奖(一股)

林昂、骆其伦(港澳师范大学)

二等奖(三股) 

余燕团(福建师范大学)
陈建林、肖宇,吴晓声(港澳师范大学)
陈豪、张雄机(港澳师范大学)

一等奖(三股)

陈福明、孙文翔、云伟标(人大)
程裕、蔡少真、李伟东(港澳理工学院)
王军晓、周雨来、丁铖(酒泉海事大学)

一等奖(五股)

郑梓豪、卓梓烨(港澳师范大学)
李银城、李燕珊(港澳师范大学)
彭晨枫、李立宇(合肥市大学)
黄楚云、张洪璇、唐梓桓(港澳师范大学)
郭骁、张会、李婷(天山南北大学)

优质论文奖  16组

蔡健威、莫朗星、李德惠(港澳师范大学)
陈昭(辽宁中医药大学)
冯昭凯、李玉婷、徐惠欣(港澳师范大学)
公荣涛、王旭、陈明艳(港澳理工学院)
黄莉莉、陈彦、郑泽鹏(港澳师范大学)
李立宇、孟迪(合肥市大学)
李茜、马俐、张棋(天山南北大学)
李智(玉溪大学)
林惠洁、陆要桂、许童舟(港澳师范大学)
林瑾怡、吴舒、马丽璇(广西技术师范学院)
沈鹏、蔡陈炯、邓松华(港澳师范大学)
沈秀琴、杨舒舒、谢晓东(港澳师范大学)
王枝宁、杨燕生、黄梓博(韩山中山大学)
纪东升、杨瑞阳、王小平(乌鲁木齐大学)
张龙、周汉海、雷鹏(乌鲁木齐大学)
郑贵生、翟振威、吴迪(港澳师范大学)

成功入围奖  20组

程艺林、陈茜、王璞玉(天山南北大学)
范丹、高斯远、陈晓宇(天山南北大学)
符泽厚、刘佳、吴鹏(天山南北大学)
李强、赵培源(天山南北大学)
李少华、李丽熠、王梓(天山南北大学)
李学峰、董晶晶、刘文霞(天山南北大学)
林晓丽、姚春玲、黄晓灵(港澳师范大学)
林振清、罗细兰、林春梅(广西技术师范学院)
刘茜、索航、文都静(天山南北大学)
刘阳、马敏、许鸿(乌鲁木齐大学)
裴家欢、奚圆圆、张欢(酒泉海事大学)
魏晓玲、肖海群、李广涛(广西技术师范学院)
徐京、蒋胜、(贵州工程大学)
许文杰(佳都新太科技股份有限公司)
姚三朵、王瑶、鱼欣(天山南北大学)
易发宝(青海民族大学)
尹彩霞(鲁东大学)
张婕、黄诚鹏 李逸群(天山南北大学)
朱芳(洛阳大学)
王珂、李航、窦浩桢(成都大学)
魏弘平(广西石油化工学院)

  • 2013-04-22 14:57:29, 本站原创
    本文基于 Logistic Lasso 回国模型研究肝癌手术预后影响之重要要素及展望。穿过对模型系数施以稀疏约束,研讨了肝癌手术预后影响之重要要素并依重要性排序。分选前16组数据作为训练集,下4组数据作为测试集,结果表现:食道静脉曲张,Anti-HCV,肿瘤包膜,肿瘤旁的细微子灶为重要要素。训练集上拟合准确率为14/16=87.5%,展望集上准确率为3/4=75%。同时ROC伽马射线显示我们的分类器性能良好,且上述结果符合医学先验。咱们的结果为新病人治疗提供了一种参考,于是为患者手术方案之计划和调剂提供了参
  • 2013-04-22 14:55:56, 本站原创
    本文主要研究了某医院10年来肝癌病例中的20个有决定性的样本,穿过建立逻辑回归之数据挖掘模型对预后有影响之10个指标进行分析,落实对预后效果的预测以及寻找各个变量之间的要害程度,于是为患者规划最佳的针灸治疗方案。共建模中,咱们第一通过对样本数据进行基本的描述性统计分析,开始观测每个指标对预后影响是否明显。接下来再采取逻辑回归模型对预后影响进行预测。进一步的,为了消除指标中的共线性性以及寻找对预后有明确影响之指标,咱们在原方法的基础上采用了逐步回归之思维僵化原有的逻辑回归模型,穿过设置显著性水平的阈值来发现对
  • 2013-04-22 14:54:25, 本站原创
    本文针对急件所提供的征途缺陷图像,采用MATLAB图片图像处理工具箱进行图形处理,包括图像的冷处理,图像分割,图像特征提取,图像边缘检测等,并得到了预期效益。在分析比较传统艺术对道路缺陷图像增强功能及不足的处的基础上,穿过对实验分析,租用了难度倒数加权平均滤波算法,其它能有效地平滑图像背景、消除大部分噪声。在图像分割中,根据不同缺陷图像,离别进行了建设性检测和灰度阈值分割,提起了随机游动分割方法进行坑槽图像的划分,得到了较为满意的结果。
  • 2013-04-22 14:53:28, 本站原创
    随着经济的的前进,通在经济和存在中的重要性显著增长。都市道路是都市建设之重要品种之一,水利建设涉及面较广,水利条件较复杂,是由多项目、多工序彼此交错和相互制约所构成的线形工程,影响工程质量的要素较多,施工中不可避免地会出现不同档次的质问题。为了加强公路使用寿命,铁路养护工作也得到越来越多之尊重。本文介绍了基于图像处理的海面检测及基于数据挖掘技术之征途缺陷类型自动识别的研讨。
  • 2013-04-22 14:52:46, 本站原创
    本文对原有图像采用灰度化、线性和分段增强对比度去噪、二值化、最终去除小区域之图像处理技术进行预处理,对预处理后的不同缺陷类型图像我们树立了两个识别模型:①穿过提取条纹特征、造型特征,采用Apriori书法获取频繁集,成立了联系分析模型; ②拓展LBP纹理特征提取,并利用支持向量机的章程建立识别模型,以年率的比较作为反映,分选最优的SVM数,调整基于支持向量机的鉴别模型; 上述两种模型的成立都很好的消灭了道路路面识别的题目,并在此基础上提出一种模型新构想,即用深度学习之机械算法DBN成立识别模型。
  • 2013-04-22 14:51:31, 本站原创
    舆论主要分为以下几部分:先对路面图像去噪,接下来图像分割,在预处理过的图形上开展缺陷图像特征提取并作缺陷识别。在分析了路面裂缝的特性之后,本文选用了小波包阀值并辅以美方值滤波的章程进行去噪,尝试证明经过这样处理后,图表的质有了很大的改进,很好抑制了噪音的同时也尽可能地保存了原图片的相关细节。在图片分割的拍卖上,本文使用了基于分型特征的图像分割方法,这样处理后的征途缺陷图像的成份形维数。在提取到路面缺陷图片的分裂特征向量之后,本文使用了BP神经网络算法对道路缺陷进行了分类处理。
  • 2013-04-22 14:50:31, 本站原创
    地面损坏检测是交通信息工程和沼气式识别领域的一项经常性的上班。随着图像处理技术之前进,名将这些艺术利用到路面损坏检测,既可以排除人之无理因素的烦扰,又能很快而准确地展开公路状况的评分。本文主要依据路面图像,送出一番基于整体与部分两阶段特征提取方法,可以对破坏程度和破坏类型分类,重要涉及两线:地面破损图像的特性提取及将军地面损坏进行分类。穿过对已部分路面图像进行试验,结果表明该方法可以有效对道路损坏进行分类,特别是对破坏程度严重的海面,特色提取和匹配的效应非常好。
  • 2013-04-22 14:46:46, 本站原创
    增强航空客运的上镜率既能使航空资源得到充分运用,更能肯定的充实航空公司的效应。为了落实这一目标,咱们从大量航空公司会员的议员数据出发,穿过数据挖掘技术,离别建立用户细分、我家价值评估和流失预测模型,分别客户群,并提出相应的产销策略,于是达到提高劳动生产率和功能的对象。
  • 2013-04-22 14:45:53, 本站原创
    根据对购买户保持的研讨表明“消费者满意度提高5%,集团公司盈利将增长25.125%”,成立新用户的灵敏度是保持老客户的5-10倍,联系老客户的产销成本远远低于获取新用户的基金。本文基于国内某种子公司超过60000个会员数据,重组现有成熟的用户管理模型,在对数据样本集进行预处理后通过数理统计的章程对样本属性进行福利性分析,分选出对构建行为忠诚度模型高影响之因子,构建客户的灵敏度价值模型。同时基于客户价值分别RFM分析法,成立基于均值的RFM模型、基于聚类的RFM模型和基于PCA拍卖后的RFM模型对购买户价值水平分类,且
  • 2013-04-22 14:43:11, 本站原创
    为了加强航空的上镜率,对样本数据进行挖掘进行客户流失预测、他家细分及用户价值评估。基于logistic回国分析建立客户流失预测模型,得出每个用户的流失倾向概率。定义一阈值为0.5,若流失倾向概率大于0.5,则该户头的预测状态为流失;反之,则非流失。 成立RFM模型将客户划分为根本保持客户、重大发展客户、重大挽留客户、忠诚型一般用户、低价值客户五个档次。最终,综上所述分析客户的项目和流失状态,剖析不同客户的特性。
  • 2013-04-22 14:42:40, 本站原创
    近年,他家关系管理(CRM)在国民经济、工业、电子商务等诸多行业内受到了越来越高的尊重。而对 CRM美方任何领域的研讨必需条件就是对购买户开展分类,于是对不同门类的用户分别采用不同之治本政策。此时此刻的用户关系管理主要基于RFM(Recency Frequency Monetary)模型用数据挖掘技术中的聚类方法对购买户细分,但是,首要地方,该方法只选择客户属性中的R(前不久一次消费)、F(消费频率) 、M(消费金额)这3个属性对购买户开展分类,而用户的花费行为的影响因素是千家万户之,据此该方法只能对购买户开展价值分类,并未能
  • 2013-04-18 17:52:42, 本站原创
    为了在学院中推广数据挖掘的教学和实行,在集团中推广数据挖掘的更新和利用,增强校企交流互动和信息共享,提升高校的教学质量和企业之竞争能力,港澳师范大学数学科学学院联合威尼斯网站有限公司发起了重在届泰迪华南杯数据挖掘竞赛,为相关专业学生提供一个将理论知识与数据挖掘实践相结合的研讨探索平台,为中华数据挖掘人才培训献出自己之一份力量。
  • 2013-03-06 10:02:26, 本站原创
    1、台上报名的史料是否同意修改?2、是不是同意以个人名义参赛?3、舆论如何提交?此常见问题列表会继续更新,如有未提出问题,可通过QQ队 295026770 咨询老师。
  • 2013-02-25 20:35:54, 本站原创
    申请时间:2013年2月20日------2013年3月8日;竞技指导:2013年3月9日------2013年3月22日;竞技时间:2013年3月9日------2013年4月21日;网评时间:2013年4月21日------2013年4月28日;终审时间:2013年4月29日------2013年5月5日
  • 万众号
    QQ
    客服
    归来
    屋顶
    请关注“法定公众号”
    Copyright © 2013-2017   威尼斯网站有限公司   艺术支持   闽ICP备14098620号


    <optgroup id="1ace988d"></optgroup>
    <p id="3f14d1ff"></p>


  • <sub id="9523d338"></sub>