R
data.table 与 pandas
🕓 2019年12月26日 · ☕4 分钟
常见的数据分析项目过程包括加载数据-清洗数据-(特征处理、可视化、模型模拟)-交流成果。其中,清洗数据与特征处理一般占据整个项目的大部分时间

使用 R 语言开发评分卡模型
🕓 2018年01月05日 · ☕4 分钟
为了提高评分卡模型的开发效率,我为 R 语言社区贡献了一个开源项目 scorecard 包 (HomePage, Github, CRAN)。该 R 包提供了评分卡开发过程中的常用功能,包括变量粗筛、分箱

stringr 与 regex 函数对应关系
🕓 2017年07月25日 · ☕1 分钟
stringr 是 Hadley 大神写的 tidyverse1 系列数据处理包中专门用于处理文本数据的,其函数命名统一易于记忆。而 R 基础包中的文本处理函数 (regex) 的命名规则不是特别统一。下表给出

博客搭建过程
🕓 2017年03月21日 · ☕2 分钟
在“我网故我在”的召唤下,我使用 R 语言的 blogdown 包1 和 GitHubPages 在一小时内搭建了本博客。搭建过程分为三个步骤:编辑网站文件、创建 GitHub Pages 仓库、域名绑定。 编辑网