首页
关于
论坛
R会
投稿
搜索
统计应用
最近更新于2023-02-25
5 / 7
统计应用
微博名人那些事儿
朱雪宁
/
2013-08-22
微博,这一新生代大规模杀伤性社交武器近年来迅速在国内走红,其来势之汹,范围之广,威力之猛当不可小觑。通过它,我们不仅能第一时间八卦到身边柴米油盐、鸡毛蒜皮的小事儿,而诸如家国天下、业内前沿的大事记也难以逃过公众的法眼。 这样迅捷高效的信息传播是怎样做到的呢?相信每一个微博控都能如数家珍的道出自己心仪的几位微博名人们,不妨就从那些微博名人们入手,看看这些名人们身边的故事。 […] 信息……
统计应用
使用R语言构造投资组合的有效前沿
邓一硕
/
2013-08-20
构造投资组合是金融投资分析中历久弥新的问题。多年以来,学界、业界提出诸多对投资组合进行优化的方法。比如,最经典的基于收益率均值和收益率波动性进行组合优化,由于马克维滋提出用收益率方差表示收益率的波动性,所以,这种方法又称为的 M-V 方法,即Mean-Variance 方法的缩写;后来,又衍生出基于夏普比率(Sharp Ratio)的投资组合优化方法;近年来,随着VaR (Value at……
统计应用
医学统计学系列
冯国双
/
2013-08-15
非常感谢统计之都盛情邀请在卫生统计方面撰写系列文章,虽然我已经在自己的博客“卫生统计空间”写了百余篇统计文章,不过那些都是兴之所至,随手即兴而做,并无什么系统性。这次既然专门写这方面,我想尽量写得系统一些,所以这一次是第一次写,先不写具体方法什么的,而是写点学习统计最重要的东西,也就是医学统计学的重要性。 很多卫生统计学老师上课从不讲医学统计学是干什么的,有什么重要性,以至于好多学生毕业后依然不知……
统计应用
RHadoop实践系列之三 R实现MapReduce的协同过滤算法
张丹
/
2013-04-09
Author:张丹(Conan) Date: 2013-04-07 Weibo: @Conan_Z Email: bsspirit@gmail.com Blog: http://www.fens.me/blog APPs: @晒粉丝 http://www.fens.me @每日中国天气 http://apps.weibo.com/chinaweatherapp […] RHadoop……
统计应用
微博用户影响力评价的H-Index指数
陈丽云
/
2013-04-02
H-index其实更广泛的应用于学术论文评价,其定义为: […] h代表“高引用次数”(high citations),一名科研人员的h指数是指他至多有h篇论文分别被引用了至少h次。 […] 约在半年前,小编就和一位老师打趣地说这东西能不能用于评价微博用户的影响力。定义相应可以改为: […] 一名微博用户的h指数是指他至多有h个粉丝数超过h的粉丝。……
统计应用
LDA-math-LDA 文本建模
靳志辉
/
2013-03-07
对于上述的 PLSA 模型,贝叶斯学派显然是有意见的,doc-topic 骰子$\overrightarrow{\theta}_m$和 topic-word 骰子$\overrightarrow{\varphi}_k$都是模型中的参数,参数都是随机变量,怎么能没有先验分布呢?于是,类似于对 Unigram Model 的贝叶斯改造, 我们也可以如下在两个骰子参数前加上先验分布从而把 PLSA 对应……
统计应用
LDA-math-文本建模
靳志辉
/
2013-03-07
我们日常生活中总是产生大量的文本,如果每一个文本存储为一篇文档,那每篇文档从人的观察来说就是有序的词的序列$d=(w_1, w_2, \cdots, w_n)$。 包含$M$篇文档的语料库 统计文本建模的目的就是追问这些观察到语料库中的的词序列是如何生成的。统计学被人们描述为猜测上帝的游戏,人类产生的所有的语料文本我们都可以看成是一个伟大的上帝在天堂中抛掷骰子生成的,我们观察到的只是上帝玩这个游戏……
统计应用
COS每周精选:随机试验处处坑
潘岚锋
/
2013-02-17
By 陈丽云 自从Fisher大神种地种出心得来,搞出了随机对照试验,这样的简单有效方法就如春风一般席卷了五湖四海。很多时候,你不整出来个控制的分毫不差的随机试验,再好的契合直觉的结果也没人相信。人们对于因果关系的定义,好像一瞬间都集中在了统计分析的一致性上…显著吗?亲,几个星号?^[注:Fisher的炫目人生和随机试验的来龙去脉,请参见书籍《女士品茶》(《The Lady Tasting……
统计应用
新浪微博文本分析初探v0.1
郝智恒
/
2013-01-13
v0.1版本说明:本文发在主站上之后,站友们经常评论代码跑着有问题。经过和lijian大哥等人进行咨询,自己也摸索了一些之后,发现了之前代码非常多的漏洞。因此,给广大站友带来了困扰。在这里我表示万分的抱歉。最近邮箱中收到让我整理代码的需求越来越多。我也非常想整理下,但是由于工作也非常繁忙,所以很难抽出时间。前两天说5.1期间会整理一下代码发出来。但是事实上因为5.1小长假期间我可能无法上网,导致无……
统计应用
复合泊松过程模型的推广和在R语言环境下的随机模拟
叶钫
/
2012-08-12
本文作者:叶钫,南京大学数学系 […] 对保险人而言,资产和负债是影响保险人稳定经营至关重要的因素。资产和负债的差额称为盈余,简记作: $$U(t)=A(t)-L(t),t>0$$ 其中$A(t)$表示时刻$t$的资产,$L(t)$表示时刻$t$的负债,$t=0$时刻的盈余被称为初始盈余,简记为$u$,即$U(0)=u$。对这个初步的理论模型进行简化并根据实际情况设置一些假定情……
统计应用
统计词话(二)
邱怡轩
/
2012-03-21
[…] 抬头,他们看到了诗云。 […] 诗云处于已消失的太阳系所在的位置,是一片直径为一百个天文单位的旋涡状星云,形状很像银河系。空心地球处于诗云边缘,与原来太阳在银河系中的位置也很相似,不同的是地球的轨道与诗云不在同一平面,这就使得从地球上可以看到诗云的一面,而不是像银河系那样只能看到截面。 […] ——刘慈欣 《诗云》 […] 时光荏……
统计应用
需要相亲几次才能找到靠谱的对象?
肖凯
/
2012-03-11
谈到相亲就不得不提到著名的麦穗问题。说有一天,苏格拉底带领几个弟子来到一块成熟的麦地边。他对弟子们说:“你们去麦地里摘一个最大的麦穗,但要求只能摘一次,只许进不许退,我在麦地的尽头等你们。”可以看得出,相亲这种活动就有点类似于摘麦穗,在等待和决断之间达成平衡是解决问题的重点。 将上述的麦穗问题进一步抽象就是一个经典的概率问题。若一个袋子里有100个不同的球。每个球上标明了其尺寸大小。我们每次随机……
««
«
3
4
5
6
7
»
»»