首页
关于
论坛
R会
投稿
搜索
统计应用
最近更新于2023-02-25
2 / 7
统计应用
十行代码预测插旗西雅图
侯澄钧
/
2017-05-19
我错了,我承认我是标题党,怎么可能用十行代码完成 Dota2 信仰2 比赛数据的抓取, 清洗与预测建模呢。 不过为了发扬继承郎大为“十行代码”系列的优良传统,我决定沿用这个名字,希望能把品牌做大做强,走出亚洲,面向世界。。。 事情的起因是这样的:上周与同为信仰粉的大为接上头之后,被安利了一个叫 RDota2 的 R pacakge。 这个工具包使用 Steam API,可以让 R……
统计计算
谷歌为什么创造了幽灵广告?
陈丽云
/
2017-04-27
说起广告大家肯定都知道,可是什么是幽灵广告?其实幽灵广告的英文是ghost ads,源自Google的一篇论文,Johnson, Garrett A., Randall A. Lewis, and Elmar I. Nubbemeyer. “Ghost Ads: Improving the Economics of Measuring Online Ad……
统计应用
聊聊美国保险业
侯澄钧
/
2017-03-18
作者简介:侯澄钧,俄亥俄州立大学运筹学博士, 目前在美国从事财产事故险(Property & Casualty)领域的保险产品开发,涉及数据分析、统计建模和产品算法优化等方面的工作。 只有想不到,没有保不了。这就是我对美国保险行业最深刻的认识。 大到地震,小到球票,加上平时开车,租房,看病,旅游,保险无时不刻的出现在了美国人生活工作的方方面面。 除了没有住所,没有工作,没有任何财产的流浪人……
统计模型
假新闻引发的愤怒——非算法视角对自我学习的搜索排序算法和选择偏差的一些解读
陈丽云
/
2017-01-16
本文作者陈丽云,落园园主。 声明:本文与作者工作单位及工作内容无关,完全出于个人兴趣爱好。 最近有条很火的新闻。美国大选刚刚落下帷幕,却余波不断。其中一条新闻就是,Google被指责利用搜索结果(假新闻)左右民意。可是事情到底是怎么回事呢? […] SAN, FRANCISCO/WASHINGTON – Google’s search engine is highlighting……
统计应用
利用R语言对用户进行深度挖掘
谢佳标
/
2017-01-13
作者简介:谢佳标 乐逗游戏高级数据分析师,负责大数据挖掘及可视化。资深R语言用户,有九年以上数据挖掘工作实战经验,多次在中国R语言大会上作主题演讲。与张良均老师、杨坦老师合著的《R语言与数据挖掘》一书已在2016年7月出版,新书《R语言游戏数据分析》一书也即将于2017年初出版。 随着游戏市场竞争的日趋激烈,在如何获得更大收益延长游戏周期的问题上,越来越多的手机游戏开发公司开始选择借助大数据,以便……
统计应用
降维攻击:目标,比率指标
陈丽云
/
2016-11-28
作者简介:陈丽云,在eBay从事 Experimentation Analytics Research。网络上素来自黑为“落园园主”。 […] 在这个互联网数据唾手可得的时代,但凡有数据的地方,就有战争。一场战役,有人登高摇旗呐喊,有人趁夜暗度陈仓。在以浩瀚数据为目标的战场上,大家费尽心思用尽招数,各种降维攻击,只是没有《三体》里面的体外文明那种强行把三维生物体打击到二维空间的那么残……
统计应用
热门数据挖掘模型应用入门(一): LASSO回归
侯澄钧
/
2016-10-10
Kaggle网站(https://www.kaggle.com/)成立于2010年,是当下最流行的进行数据发掘和预测模型竞赛的在线平台。 与Kaggle合作的公司可以在网站上提出一个问题或者目标,同时提供相关数据,来自世界各地的计算机科学家、统计学家和建模爱好者, 将受领任务,通过比较模型的某些性能参数,角逐出优胜者。 通过大量的比赛,一系列优秀的数据挖掘模型脱颖而出,受到广大建模者的认同,被普遍……
推荐文章
中药、西药及统计学
李舰
/
2016-08-04
作者简介: 李舰,现任九峰移动医疗 CTO,曾任 Mango Solutions 中国区数据总监。专注于数据科学在行业里的应用。 擅长R语言的工程开发与分析建模,是 Rweibo、Rwordseg、tmcn 等 R 包的作者。与肖凯合著了《数据科学中的R语言》, 参与翻译了《R语言核心技术手册》、《机器学习与R语言》。 这篇文章本来是从屠呦呦得诺奖的时候开始写的,作为一个拖延症晚期患者,直到今天才……
统计应用
互联网金融中的数据科学
张云松
/
2016-08-01
作者简介: 张云松,毕业于中科院,多年咨询公司和互联网公司从事数据算法、决策分析、风险管理和产品设计的工作,目前是融360风控总监,负责纯线上小额微贷信用贷款产品。 最近几年,这波在资本撬动的互联网金融的浪潮极大地提升了数据科学的行业应用价值,数据分析师不再是苦逼的跑数的,摇身一变成了风控模型专家、数据科学家。 尤其是大数据风控、大数据征信领域一片火热的场景,数据挖掘、机器学习相关专业同学的数量也……
统计应用
有效统计实践的十项简明原则
Robert E. Kass / Brian S. Caffo / Marie Davidian / 孟晓犁 / 郁彬 / Nancy Reid
/
2016-07-26
原文作者:Robert E. Kass; Brian S. Caffo; Marie Davidian; Xiao-Li Meng; Bin Yu; Nancy Reid 原文出处: Ten Simple Rules for Effective Statistical Practice. Kass RE, Caffo BS, Davidian M, Meng X-L, Yu B, Reid N……
统计应用
股市稳赚不亏?标普500的40年的投资回报
覃文锋
/
2016-07-03
本文翻译自 GitHub 项目 zonination/investing 的描述文件 README.md。译者对原文顺序有所改动。 […] 原文以 MIT 协议发布,已征得作者 Zoni Nation 许可进行翻译。译文版权归统计之都所有,转载请注明出处。 […] 很多人是从 Reddit 上的 “个人理财”(/r/personalfinance)板块的贴子和评论里认识……
统计应用
标题党统计学
邱怡轩
/
2016-07-02
如果你是被这个标题骗进来的,那么说明标题党的存在的确是有原因的。 在网络高度发达(以及“大数据”泛滥)的今天,数据动不动就是以 GB 和 TB 的级别存储,然而相比之下,人类接受信息的速度却慢得可怕(参见大刘《乡村教师》)。 试想一下,你一分钟能阅读多少文字?一千?五千?总之是在 KB 的量级。 所以可以说,人们对文字的“下载速度”基本上就是 1~10KB/min。如果拿这个速度去上网的话你还能……
««
«
1
2
3
4
5
»
»»