data.table 与 pandas
🕓 2019年12月26日 · ☕4 分钟
数据分析项目通常可以分解为以下过程,数据加载-数据清洗-(特征处理、可视化、模型训练)-成果汇报1。其中,数据清洗与特征处理或者称为数据预处

[转] 互联网金融的大数据风控
🕓 2018年01月10日 · ☕9 分钟
大数据能够进行数据变现的商业模式目前主要包括,一是精准营销,典型的场景是商品推荐和精准广告投放,二是大数据风控,典型的场景是互联网金融的大数

使用 R 语言开发评分卡模型
🕓 2018年01月05日 · ☕4 分钟
为了提高评分卡模型的开发效率,我为 R 语言社区贡献了一个开源项目 scorecard 包 (HomePage, Github, CRAN)。该 R 包提供了评分卡开发过程中的常用功能,包括变量粗筛、分箱

stringr 与 regex 函数对应关系
🕓 2017年07月25日 · ☕1 分钟
stringr 是 Hadley 大神写的 tidyverse1 系列数据处理包中专门用于处理文本数据的,其函数命名统一易于记忆。而 R 基础包中的文本处理函数 (regex) 的命名规则不是特别统一。下表给出

Markdown相关资料
🕓 2017年04月05日 · ☕1 分钟
John Gruber’s Markdown syntax (中文翻译) John MacFarlane’s Pandoc Markdown (中文翻译) Blackfriday Markdown (github) RMarkdown (github) MathJax (中文版)

博客搭建过程
🕓 2017年03月21日 · ☕2 分钟
在“我网故我在”的召唤下,我使用 R 语言的 blogdown 包1 和 GitHubPages 在一小时内搭建了本博客。搭建过程分为三个步骤:编辑网站文件、创建 GitHub Pages 仓库、域名绑定。 编辑网