Post
data.table 与 pandas
🕓 2019å¹´12月26日 · ☕4 分钟
常见的数据分析项目过程包括加载数据-清洗数据-(特征处理、可视化、模型模拟)-交流成果。其中,清洗数据与特征处理一般占据整个项目的大部分时间

[转]互联网金融的大数据风控
🕓 2018å¹´01月10日 · ☕9 分钟
大数据能够进行数据变现的商业模式目前主要包括,一是精准营销,典型的场景是商品推荐和精准广告投放,二是大数据风控,典型的场景是互联网金融的大数

使用 R 语言开发评分卡模型
🕓 2018å¹´01月05日 · ☕4 分钟
为了提高评分卡模型的开发效率,我为 R 语言社区贡献了一个开源项目 scorecard 包 (HomePage, Github, CRAN)。该 R 包提供了评分卡开发过程中的常用功能,包括变量粗筛、分箱

stringr 与 regex 函数对应关系
🕓 2017å¹´07月25日 · ☕1 分钟
stringr 是 Hadley 大神写的 tidyverse1 系列数据处理包中专门用于处理文本数据的,其函数命名统一易于记忆。而 R 基础包中的文本处理函数 (regex) 的命名规则不是特别统一。下表给出

Markdown相关资料
🕓 2017å¹´04月05日 · ☕1 分钟
John Gruber's Markdown syntax (中文翻译) John MacFarlane's Pandoc Markdown (中文翻译) Blackfriday Markdown (github) RMarkdown (github) MathJax (中文版)

在ubuntu上配置vnpy
🕓 2017å¹´04月04日 · ☕2 分钟
vnpy是基于python的中文开源交易平台开发框架,该项目相关信息参见github主页、官方主页、项目知乎专栏、官方社区维恩派、作者知乎主

博客搭建过程
🕓 2017å¹´03月21日 · ☕2 分钟
在“我网故我在”的召唤下,我使用 R 语言的 blogdown 包1 和 GitHubPages 在一小时内搭建了本博客。搭建过程分为三个步骤:编辑网站文件、创建 GitHub Pages 仓库、域名绑定。 编辑网