期刊简介:本刊是中国人民大学统计学院研究生会的学术类期刊,一年出版一期。其目的是为统计学院各专业的硕士博士生提供一个学术交流和展示的平台,同时也为本科生提供一个学习的机会。本刊收录的文章全部是由统计学院各级研究生自主撰写,其中也包括一些专业课的作业。现应允发表其摘要于统计之都,以供广大统计人士学习、指点与探讨。
一、第二届首都高校统计学研究生论坛论文选登
多重假设检验方法及其在经济计量中的应用
天津财经大学统计学院 刘乐平 中国人民大学统计学院 张龙 蔡正高
摘要:复杂数据和复杂模型的统计推断问题现已成为国内外统计学研究的重要问题。本文以高维复杂数据为研究对象,以多重假设检验的错误控制为主线,对多重假设检验问题的错误控制理论、方法和过程及最新进展进行综述,并对多重假设检验方法在经济计量研究中的应用进行展望。
关键词:多重假设检验,错误发现率,经济计量学,q-值
捕获记忆呈指数消退的捕获反应模型
北京大学概率论与数理统计系 丁丹丹 摘要:本文提出了一个直接估计模型,主要想法是假设动物对陷阱的记忆只与距离最近一次被捕获的时间间隔有关,不同时间间隔代表了动物对陷阱记忆的不同状态,我们假定同一状态的动物具有相同的再捕获概率,并用似然函数求解参数的估计。当假定动物具有永久记忆时,得到传统Mb模型;当假定动物同时具有长期和短期记忆时,得到MM2(B)模型;当假定动物只具有短期记忆时,得到MM1(B)模型。除此之外,该模型还可以描述动物具有更复杂的捕获记忆的情况,本文对其两种扩展模型——中长期记忆模型和中短期记忆模型作了详细讨论。本文同时还提出了动物的捕获记忆呈指数消退的捕获反应模型,用来详细刻画动物的捕获反应。该模型假设动物对于陷阱的记忆随时间的增长呈指数消退,基于这种思想建立参数模型,用最大似然函数方法求解。最后本文对各种模型做随机模拟,并比较其结果,同时根据AIC准则做模型选择,讨论如何挑选最适合的模型。
关键词:中长期记忆模型,中短期记忆模型,指数消退的捕获反应模型,随机模拟
统计数据质量的综合评价
首都经济贸易大学统计学院统计学专业 胡迪
摘要:本文在建立数据质量评价指标体系的基础上,通过层次分析法和模糊综合评判对我国统计数据质量进行了系统分析,以提高我国统计数据质量管理水平及其评估体系的科学性。
关键词:数据质量,层次分析法,模糊综合评价
二、数据挖掘小组研究报告选登
基于贝叶斯分类的保险赔付问题研究
中国人民大学统计学院 王旭 刘冬 石磊 朱建旭
摘要:在理财意识和自我保护意识不断提高的今天,保险业已经收到了越来越多人的关注,成为21世纪的朝阳产业。对保险行业而言,如何通过特定的人群属性来辨别高赔付风险的人群,其意义不言而喻。从而,本文的目的是根据相应的人群属性来对保险赔付情况进行研究。由于贝叶斯分类法具有坚实的数学理论基础,是公认的较为有效和常用的一种分类方法,所以,本文在充分考虑了数据自身的特点之后,将贝叶斯分类器作为主要的分析工具。结合保险行业1981年至2002年的实际赔付数据,本文首先尝试了朴素贝叶斯方法,分析了多个人群属性特征变量对赔付概率的影响,进而利用Cooper和Herskovits在1992年提出的K2算法训练贝叶斯网络模型,并将模型预测结果与传统分类器(如cart、logistic回归等)及朴素贝叶斯进行比较。鉴于K2算法自身存在的一些缺陷,本文进一步提出了基于关联规则的贝叶斯网络模型,并通过学习得到了预测能力良好且较为鲁棒的保险赔付测算模型。
关键词:保险业,数据挖掘,赔付,贝叶斯网络
健康食品消费人群细分与广告营销模式探讨
中国人民大学统计学院 杨晨 钱政超 苏晶晶 程冬旭
摘要:近年来,随着经济发展和人们生活水平的提高,越来越多的人开始关注健康、投资健康,健康消费已经成为一种时尚。在这种大环境下,不少厂商开始试图拓展健康食品的市场。本研究报告时受某健康食品厂委托,针对现有健康食品消费者进行特征分析,考察其潜在客户,预测市场份额并试图提出合适且有针对性的营销策略。
关键词:健康食品,人群细分,营销模式
数据挖掘技术在信用卡违约风险中的应用
中国人民大学统计学院 冯靓
摘要:随着世界经济的不断增长和信息技术的迅猛发展,全球的信用卡使用量持续上升,信用卡已经成为支付领域的主要媒介。信用卡的消费信贷功能具有解决持卡人临时资金短缺、提高即时购买力、满足大众消费信贷等优势,同时还有利于调整和改善银行资产结构。但与此同时,高风险用户也随着信用卡业务量的不断扩大不断积累,给银行带来极大的经济损失。本文力图运用数据挖掘技术中的决策树、Logistic Regression方法从现有数据库中提取出潜在的有效分类信息,为甄别高风险用户提供决策依据。
关键词:信用卡,数据挖掘,决策树模型,Logistic Regression模型
三、我们的功课
稀有事件变点问题的Bayes分析
中国人民大学统计学院 钟颖
摘要:本文针对稀有事件的变点问题,根据Bayes发建立了判断变点是否存在、计算变点位置的合理模型,并利用基于Gibbs抽样的MCMC模拟抽样,估计出变点和分布参数之值。然后引用美国煤矿灾难和我国关中地区干旱灾害的实际数据,检验了文中提出方法的可行性。
关键词:稀有事件,变点,Bayes法,Gibbs抽样
分层抽样下的西蒙斯随机化回答模型
中国人民大学统计学院 谢佳斌
摘要:本文通过结合分层抽样技术和西蒙斯模型,提出了分层抽样下奈曼分配时的西蒙斯随机化回答模型。该模型在应用于总体为分层总体的时候比简单随机抽样下的西蒙斯模型有着更高的精度,在实际的调查操作中也有着更强的可行性。此外,本文还探讨了受访者在不完全真实回答情况下的情形,并对模型进行了改进。
关键词:分层抽样,西蒙斯模型,随机化回答技术
煤炭价格波动对新疆工业的影响——基于CGE模型的分析
中国人民大学统计学院 邢瑞军
摘要:本文通过建立可计算一般均衡(CGE)模型,模拟了宏观经济的运行情况。并在假定其它因素不变的情况下,分析煤炭价格的波动对新疆工业的影响,对政府部门的宏观经济政策提供了决策上的支持。
关键词:可计算一般均衡,宏观经济模拟,煤炭价格
发表/查看评论