博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
《R与Hadoop大数据分析实战》一导读
阅读量:5893 次
发布时间:2019-06-19

本文共 686 字,大约阅读时间需要 2 分钟。

image

前 言

组织获得的数据量每一天都在成倍增加。现在组织可以存储大量信息在低成本平台上,例如Hadoop。

如今这些组织面临的难题是如何处理这些数据以及如何从这些数据中获取关键的见解。于是R应运而生。R是一个令人惊讶的工具,它是一个在数据中能够运行先进统计模型的单元,它将原始模型翻译成丰富多彩的图形和可视化视图,而且它有很多和数据科学相关的功能。然而,R的一个主要缺点是它的可扩展性较差。R的核心技术引擎可以加工和处理非常有限的数据量。正因为在大数据处理中Hadoop十分流行,所以为了可扩展性,下一步符合逻辑的方法将是把R和Hadoop结合起来。本书介绍了R和Hadoop,以及如何通过使用一个平台(如Hadoop)进行R的数据分析操作以实现其可扩展性。出于这样一个目标,本书将适合广大范围的读者,包括数据统计者、数据科学家、数据架构师和任何正在寻找使用R和Hadoop来处理和分析大量信息的解决方案工程师。在Hadoop上使用R将提供一个弹性的数据分析平台,其规模取决于所需分析的数据集大小。富有经验的程序员可以用R语言编写Map/Reduce模块,并用Hadoop的Map/Reduce并行处理机制运行它以识别数据集的模式。

目 录

第3章 集成R和Hadoop
3.1 RHIPE
3.1.1 安装RHIPE
3.1.2 RHIPE架构
3.1.3 RHIPE实例
3.1.4 RHIPE参考函数
3.2 RHadoop
3.2.1 RHadoop架构
3.2.2 安装RHadoop
3.2.3 RHadoop案例
3.2.4 RHadoop参考函数
3.3 小结

转载地址:http://ljssx.baihongyu.com/

你可能感兴趣的文章
INDEX--索引页上存放那些数据
查看>>
INDEX--关于索引的琐碎
查看>>
sql查看所有表大小的方法
查看>>
nexus7 1代 刷4.2.2+root[转]
查看>>
推荐一个很好的富文本web编辑器UEditor
查看>>
UNIX网络编程读书笔记:TCP输出、UDP输出和SCTP输出
查看>>
扩展 DbUtility (1)
查看>>
iOS开发UI篇—使用picker View控件完成一个简单的选餐应用
查看>>
使用UITableView实现图片视差效果
查看>>
CentOS RHEL 安装 Tomcat 7
查看>>
erlang如何有效地监视大量的并发连接
查看>>
Windows下Mysql5.6启用监控执行脚本的日志
查看>>
Apple Developer Registration and DUNS Number Not Accepted
查看>>
motion移植
查看>>
Hadoop学习笔记系列文章导航
查看>>
转一贴,今天实在写累了,也看累了--【Python异步非阻塞IO多路复用Select/Poll/Epoll使用】...
查看>>
四川大学线下编程比赛第一题:数字填充
查看>>
Codeforces Round #290 (Div. 2) C. Fox And Names dfs
查看>>
iOS开发-NSOperation与GCD区别
查看>>
扩展方法使用
查看>>