统计学习

统计学知识大梳理

道德经云:”道生一,一生二,二生三,三生万物“。学习知识亦是如此,一个概念衍生出两个概念,两个概念演 ...

算法

随机森林,GBDT,XGBoost的对比

随机森林、GBDT、XGboost模型对比,注意xgboost的并行不是tree粒度的并行,xgboost也是一次迭代完才能进行下一次迭代的(第t次迭代的代价函数里包含了前面t-1次迭代的预测值),xgboost的并行是在特征粒度上的。

 

算法

维度归因算法

定基法,全称定基替代法,用于解决变化分解问题,即:一个维度下的所有维值一起变,导致了总指标的变化,如何计算每个维值对该变化的贡献。其核心思想是,假设其他维值保持不变,只有一个维值发生变化,这时给总指标带来的变化,就是这个维值的贡献。

软件

Navicate for Mac

文件损坏处理。

算法

数据挖掘建模全流程(TAL)

内部资料,勿转载!

小工具

PDF文件合并

PDF文件处理,希望大家能够理解Python办公自动化的一个核心就是批量操作-解放双手,让复杂的工作自动化!

算法

美团第二届商分比赛视频

"美团商业分析精英大赛"是互联网行业第一个商业分析类学科竞赛,由美团主办、狗熊会承办、全国青年统计学家协会协办。 大赛面向海内外高校在读学生征集案例报告,重点考察参赛选手包括理论落地、商业分析、对业务场景的理解和团队等复合能力。

业务

商业分析为何超有用

一提到“分析”两个字,人们往往会产生很多不切实际的想象。一个羽扇纶巾,仙风鹤骨的老神仙,闭着眼睛掐指一算,就上知天下知地了。任何工具总是有自己的适用范围的,今天我们正本清源,来科普下到底商业分析有什么用。顺便也看看商业分析的局限性。

 

统计学习

探索金庸小说世界

今天给大家分享用Python探索金庸笔下的江湖!带你用python看小说,娱乐学习两不误。本文从传统匹配逻辑分析过渡到机器学习的词向量,全方位进行文本分析,值得学习,干货满满。

Python

提高数据科学效率的 8 个Python神库!

提高数据科学效率的 8 个Python神库!在进行数据科学时,可能会浪费大量时间编码并等待计算机运行某些东西。所以我选择了一些 Python 库,可以帮助你节省宝贵的时间。