本文共 1981 字,大约阅读时间需要 6 分钟。
目前互联网领域有很多公司都在做APP领域的“用户行为分析”产品,与Web时代的行为分析相类似,其目的都是帮助公司的运营、产品等部门更好地优化自家产品,比如查看日活和月活,查看渠道来源,提高留存、转化、活跃度等等。 在这个研发过程中,有个比较核心的需求,叫做“有序漏斗”。“有序漏斗”问题定义比较简单,但计算过程比较复杂。市面上现有的解决方案在数据量较大的情况下,计算效率较低。 为了更好的提升产品体验,易观决定将此需求作为比赛题目,广招各路大牛,共同解决。大赛分为2组,开源组和商业组。开源组设置奖金池和排行榜,商业组最后设置排行榜。
根据提供的应用转化和OLAP场景,给出具体的方案,先利用测试数据集在指定测试集群上运行给出测试结果, 最终易观会用实际测试数据在测试集群上跑整体数据并给出用时排名。
开源排行榜,第1名现金人民币10万(税前)奖励, 前3名易观证书
商业排行榜,前3名易观证书链接: 密码: z3m8
数据为文本文件格式,具体包含字段有:
(1)用户ID,字符串类型 (2)时间戳,毫秒级别,Long类型 (3)事件ID,Int类型,包含10001到10010十个事件 (4)事件名称,字符串类型,包含启动、登陆、搜索商品等十个事件 (5)事件属性,Json串格式 (6)日期,字符串类型 数据总条数6亿左右,日期范围:2017/01/01到2017/02/28。转载地址:http://qxqya.baihongyu.com/