推荐语:shiny 现在有 Python 版本了,这是一篇 Python 中使用 shiny 的教程

推荐人:孔令仁

链接:https://appsilon.com/shiny-for-python-introduction/


推荐语:和机器人聊聊天活就干了。

推荐人:任焱

链接:https://github.com/isinaltinkaya/gptchatteR


推荐语:介绍条形图和箱线图的种种替代,在描述数据分布方面,数据量少时可以考虑展示原始数据,在数据量多时,可以考虑岭线图、提琴图等,ggdist 包提供许多一步到位的函数实现。Cédric Scherer(https://www.cedricscherer.com/)的这篇文章质量非常高,值得一读,还有配套的幻灯片和讲解视频。

推荐人:黄湘云

链接: https://z3tt.github.io/beyond-bar-and-box-plots/


推荐语:lterpalettefinder 包提供从给定图片中提取颜色的功能,可用于构造与已有的颜色风格相统一的统计图形。

推荐人:宋文轩

链接:https://cran.r-project.org/web/packages/lterpalettefinder/index.html


推荐语:一篇很有深度的短文,讲解了Python中 NotImplemented和NotImpementedError使用的场景和区别。

推荐人:孔令仁

链接:https://s16h.medium.com/pythons-notimplemented-type-2d720137bf41


推荐语:这篇经典文献是合成控制方法的开山之作。为研究巴斯克地区的恐怖活动对经济的影响,Abadie and Gardeazabal (2003)提出通过选取适当的权重,对其他地区进行线性组合,来合成一个在各经济特征上与巴斯克地区更为相似的“合成控制地区”作为对照,从而对恐怖活动对巴斯克经济的影响进行统计推断。结果表明,在20世纪60年代末恐怖主义爆发后,巴斯克的人均GDP相对于没有恐怖主义的合成控制地区下降了约10个百分点。

推荐人:朱书慧

文章信息:Abadie, A. and Gardeazabal, J. 2003. Economic Costs of Conflict: A Case Study of the Basque Country. American Economic Review 链接:https://xueshu.baidu.com/usercenter/paper/show?paperid=b9b8a6f807b94ecb62740fef1f4ff6c7&site=xueshu_se&hitarticle=1&sc_from=pku doi:10.2139/ssrn.293120


推荐语:最近 ChatGPT 大火,再介绍一个相关的内容。可以用 ChatGPT 在 R 中创造并分析数据集,并且帮我们修正 bug,感觉利用 ChatGPT 来做大作业的未来越来越近了。

推荐人:王祎帆

链接:https://blog.ephorie.de/chatgpt-can-create-datasets-program-in-r-and-when-it-makes-an-error-it-can-fix-that-too


推荐语:一些统计概念的交互可视化,对于理解基础概念可能有很好的帮助。

推荐人:孔令仁

链接:https://rpsychologist.com/viz


推荐语:关于“稳定分布”的定义和一些有趣应用:1)根据正态分布为2范数稳定分布,从直观上理解中心极限定理。2)根据不同范数下的稳定分布,通过采样Sketching Matrix实现降维,从而快速近似估计超高维向量的范数,可用于设计局部灵敏哈希算法(Locality Sensitive Hashing)

推荐人:梁杰昊

链接:


推荐语:这篇博客介绍了在时间序列预测任务中纳入预测区间的一个想法,可以更好地刻画时序预测中的不确定性,并且这个目标使用 scikit-learn 库就可以完成。

推荐人:任怡萌

链接:https://towardsdatascience.com/time-series-forecasting-with-conformal-prediction-intervals-scikit-learn-is-all-you-need-4b68143a027a


推荐语:偏差和方差的权衡是机器学习的核心问题,这篇博客提供了理解偏差-方差权衡的贝叶斯视角。

推荐人:向悦

链接:https://towardsdatascience.com/understanding-bias-variance-trade-off-from-a-bayesian-perspective-6c31645fcaa9


推荐语:#30DayMapChallenge 一位数据科学家参与的 30 天地图绘制挑战:每天以一个特定主题绘制地图,其中绝大部分精美的地图都是由 R 绘制而成,展现了 R 可视化的魅力。我个人最喜欢的一张图来自 Day 24 (Fantasy) 。

推荐人:宋文轩

链接:https://github.com/nrennie/30DayMapChallenge/tree/main/2022


推荐语:开源3D打印机VORON2.4的采购清单,照着链接在淘宝,1688上买,可以在2500以内搞定250mm长宽高的可打印ABS材料的FDM打印机。

推荐人:苏锦华

链接:https://docs.qq.com/sheet/DYnVpeVNUTHFTaHdw?tab=BB08J2


推荐语: flowingdata 2022年评选的最佳可视化项目,比较有意思的是《华盛顿邮报》做的选区高尔夫球游戏(马里兰第三选区简直是噩梦)、电厂难题选择投票还有北极的碳排放。

推荐人:于淼

链接:https://flowingdata.com/2022/12/29/best-of-2022/


推荐语:借着世界杯的浪潮,考古发现了一篇有一丝丝好玩的论文,用网络分析对瓜瓜(瓜迪奥拉)梦三巴萨tiki taka战术的做了一些探索,分析了球员之间交互的复杂网络的一些特征,肯定了瓜瓜战术(梦三巴萨)的独特性[狗头]。

推荐人:赵昊蛟

链接:https://doi.org/10.1038/s41598-019-49969-2


发表/查看评论