Hadoop Streaming 使用了 Unix 的标准输入输出作为 Hadoop 和其他编程语言的开发接口,因此可以使用Hadoop Streaming 结合AWK 处理文本大数据。 本篇主要结合实际应用中的一个任务需求进行介绍。
白板GBDT
发表于
|
分类于
机器学习
白板GBDT思路。
白板逻辑回归
发表于
|
分类于
机器学习
白板逻辑回归思路。
tornado pyzmq 高性能cpu密集型服务搭建
发表于
|
分类于
服务
Tornado是一款Python 服务器框架,其采用异步IO 的网络模型,具有较高性能。在Tornado 基础上为了提升Cpu 密集型应用在多核Cpu 服务器上的性能表现,可以采用Tornado 协程(异步非阻塞)+队列(通信、解耦)+多线程/多进程任务(榨干多核Cpu)的方案。
LNMP Docker环境搭建 -- PHP 开发系列(1)
发表于
|
分类于
web
互联网是一门实践科学,想要学习 PHP 第一要务即搭建 PHP 开发环境,有了开发环境则可边学习边实践,效果比只看视频和教程好很多。博主也是个 PHP 初学者,搭建环境也并不是一番风顺。本文记录了通过 Docker 搭建 LNMP Web 开发环境过程,以帮助初学者快速搭建一个简单易上手的开发环境。
iOS 数据库探究
发表于
|
分类于
iOS
本文记录前段时间调研 iOS 移动数据库的相关知识,主要从数据库的设计及数据库的选取两方面来谈。希望阅读此篇文章后读者能够大致了解移动端数据库的相关内容。本文会不定期更新,有错误请及时指正。
如何写好技术博客
发表于
|
分类于
博客
本文主要介绍如何写好技术博客,主要涉及博客文章排版及博客写作心得。
iTerm2 + Oh My Zsh -- MAC篇
发表于
|
分类于
效率
之前看到过几篇关于提升程序员效率的文章 《程序员如何优雅使用MAC》,《如何大幅度提高 Mac 开发效率》,其中都涉及改造你的 Terminal 相关内容。本文即介绍如何通过 Iterm2 + Oh My Zsh + PowerLine 彻底改造你的 Terminal,提升效率。
Hexo 博客搜索 SEO 优化 -- 谷歌篇
发表于
|
分类于
博客
本文主要介绍博客搜索 SEO 优化的相关知识,博客系统采用 Hexo 框架,Next 主题。
利用 GitHub + Hexo + Docker 快速构建独立博客 -- MAC篇
发表于
|
分类于
博客
本文记录了 MAC 环境下搭建独立博客的完整过程,最初的方案是 Github + Hexo,之后引入 Docker。此博客搭建方案的特点是快速、独立、免费、高自由度。本博客网站即是由此方案搭建而成,博客主题为 Next。