大数据应用

一文读懂数据架构的进化史

大数据应用一文读懂数据架构的进化史

近期看到很多企业在设计自己的数据平台,以及选型一些数据分析工具,正好拜读了数据仓库之父的《数据架构:大数据、数据仓库以及Data Vault》一书,有些许感触,...

大数据应用 / 2018-08-22

盘点:数据可视化的八个标志性例子

大数据应用盘点:数据可视化的八个标志性例子

我们生活在数据A5,从全球气温到购物习惯,新技术使得收集、存储和访问信息的速度比历史上任何时候都要容易。但是我们对这些技术的使用也侵蚀了我们的注意力范...

大数据应用 / 2018-08-22

大数据A5如何使用数据分析来找女朋友?

大数据应用大数据A5如何使用数据分析来找女朋友?

大数据A5的我们,一切都要与时俱进,找对象也是如此。本文的小柯今年25岁,单身男,热衷大数据,并决定认真钻研,用数据分析来实现自己的“脱单计划”。...

大数据应用 / 2018-08-22

收藏 | 12个ggplot2拓展程序助你强化R可视化

大数据应用收藏 | 12个ggplot2拓展程序助你强化R可视化

如果你是世界上众多ggplot2爱好者之一,你可能有时会发现自己正在寻找出色的软件包来拓展其功能。本文将为大家简要介绍12个ggplot2拓展程序,包括它们让R可视化...

大数据应用 / 2018-08-22

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

大数据应用Python爬取北京二手房数据,分析北漂族买得起房吗? |

本文主要分为两部分:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Python&R的同学们学习参考。...

大数据应用 / 2018-08-22

Python爬取北京二手房数据,分析北漂族买得起房吗? | 附完整源码

大数据应用Python爬取北京二手房数据,分析北漂族买得起房吗? |

本文主要分为两部分:Python爬取赶集网北京二手房数据,R对爬取的二手房房价做线性回归分析,适合刚刚接触Python&R的同学们学习参考。...

大数据应用 / 2018-08-22

清理数据成数据科学家最大挑战

大数据应用清理数据成数据科学家最大挑战

最近,IT项目众包公司CrowdFlower的数据科学家进行了一项调查(需要注册可查看)。调查发现,三分之二的分析人员认为清理和组织数据是它们最费时的工作,52%称他们...

大数据应用 / 2018-08-20

深度解析数据分析、大数据工程师和数据科学家的区别

大数据应用深度解析数据分析、大数据工程师和数据科学家的区别

数据越来越多的影响并塑造着那些我们每天都要交互的系统。我们赋予了数据如此大的转变的能力,也难怪近几年越来越多的数据相关的角色被创造出来。本文我们将讨论...

大数据应用 / 2018-08-19

七夕:大数据分析看如何成为美人

大数据应用七夕:大数据分析看如何成为美人

这篇文章探讨的是女性吸引力,但没有通常看到的照片分析之类的东西。相反,我们采用过去的女人图片,分析她在男同胞们头脑里产生的反应。...

大数据应用 / 2018-08-19

大数据研究常用软件工具与应用场景

大数据应用大数据研究常用软件工具与应用场景

本文针对研究人员(非技术人员)的实际情况,介绍当前大数据研究涉及的一些主要工具软件(因为相关软件众多,只介绍常用的),并进一步阐述其应用特点和适合的场景,...

大数据应用 / 2018-08-17

Google首席决策师告诉你AI和数据科学团队需要哪10种角色?

大数据应用Google首席决策师告诉你AI和数据科学团队需要哪10种角

如果你想要通过智能的工程决策方法使数据变得有用,并且希望从事相关的职业,那么下面我对团队发展中的角色顺序(从0开始)提出的看法或许对你会有帮助。...

大数据应用 / 2018-08-17

大数据和人工智能领域最实用且绝对不能错过的10大网站

大数据应用大数据和人工智能领域最实用且绝对不能错过的10大网站

本文整理出大数据和人工智能领域最实用,质量最高的10大技术网站信息,既可以用于丰富技术知识,也可以用于学术研究。...

大数据应用 / 2018-08-17

Python数据分析基础:异常值检测和处理

大数据应用Python数据分析基础:异常值检测和处理

一般异常值的检测方法有基于统计的方法,基于聚类的方法,以及一些专门检测异常值的方法等,下面对这些方法进行相关的介绍。...

大数据应用 / 2018-08-16

【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

大数据应用【Kaggle入门级竞赛top5%排名经验分享】— 分析篇

本篇,博主将会从零开始介绍这个项目,教你如何一步一步的把这个项目做好。由于大部分星球的朋友们已经完成了分析部分的实战练习,因此将这部分内容拿出来进行简...

大数据应用 / 2018-08-15

转行数据分析的一份学习清单

大数据应用转行数据分析的一份学习清单

本篇内容是针对所有想转行数据分析人员的,内容深浅不一。若内容过于简单,可直接略过,若内容过于复杂,也不必担忧。...

大数据应用 / 2018-08-15

扫盲:Hadoop分布式文件系统(HDFS)基础概念讲解!

大数据应用扫盲:Hadoop分布式文件系统(HDFS)基础概念讲解!

本文为您带来通过shell命令管理Hadoop HDFS的十大基本操作,这些操作对于管理HDFS集群上的文件非常有用。出于测试目的,你可以使用Cloudera或者Hortonworks等中...

大数据应用 / 2018-08-15

从三个方向去预测大数据发展的未来趋势

大数据应用从三个方向去预测大数据发展的未来趋势

技术的发展,让这个世界每天都在源源不断地产生数据,随着大数据概念被提出,这个技术逐渐发展成为一个行业,并被不断看好。那么大数据行业的未来发展如何?三个...

大数据应用 / 2018-08-14

数据处理的9大编程语言

大数据应用数据处理的9大编程语言

有关大数据的话题一直很火热。伴随着信息的爆炸式增长,大数据渗透到了各行各业,广泛应用于公司中,同时也使得传统的软件比如 Excel 看起来很笨拙。数据分析不...

大数据应用 / 2018-08-14

从零转行数据分析的亲身经历

大数据应用从零转行数据分析的亲身经历

有些朋友对于是否该转行一直抱有迟疑态度,转行会不会有风险啊,转行以后万一后悔了怎么办啊,转行是不是要重新学啊,等等一系列的问题。这些问题大多数人都想过...

大数据应用 / 2018-08-14

斯坦福开源Weld:高效实现数据分析的端到端优化

大数据应用斯坦福开源Weld:高效实现数据分析的端到端优化

Weld 是斯坦福大学 DAWN 实验室的一个开源项目,在 CIDR 2017 论文中描述了它的初始原型。Weld 用于对结合了数据科学库和函数的现有工作负载进行优化,而无需用...

大数据应用 / 2018-08-14

必看的考研数据分析报告!官方发布!

大数据应用必看的考研数据分析报告!官方发布!

近日研招网(中国研究生招生信息网)发布了“2015-2018硕士研究生报考数据分析报告”,从硕士报考总人数、各省报考人数、应届生往届生报考比例、学硕专硕比例、男...

大数据应用 / 2018-08-11

TOP 3大开源Python数据分析工具!

大数据应用TOP 3大开源Python数据分析工具!

在大数据库领域,Python是最常被使用的编程语言,因此了解与其相关的数据分析工具是很有必要的。如果你正在使用virtualenv、pyenv或其他变体在自己的环境中运行P...

大数据应用 / 2018-08-10

想当数据科学家的你这13个错误可别犯

大数据应用想当数据科学家的你这13个错误可别犯

当你看这篇文章的时候,我们知道你已经决定把数据科学当作你的工作。当下越来越多的企业需要数据支持其决策,世界也变得越来越紧密,几乎每个企业都需要大量的数...

大数据应用 / 2018-08-10

掌握这五类数据科学项目,找到一份好工作

大数据应用掌握这五类数据科学项目,找到一份好工作

也许你一直在MOOC平台上学习数据科学,也熟读了一大堆教科书,但要获得数据科学相关的职位,你还需要向雇主展示自己的技能水平。最好的方式是作品集,你可以借此...

大数据应用 / 2018-08-10

数据可视化的七大趋势

大数据应用数据可视化的七大趋势

ProPublica的调查记者兼开发者Lena Groeger,以及金融时报的数据可视化记者Jane Pong在全球深度报道大会上分享了他们对当前数据可视化趋势的一些看法。...

大数据应用 / 2018-08-10

耗时两个月,国内传统企业对Hadoop到底什么态度?

大数据应用耗时两个月,国内传统企业对Hadoop到底什么态度?

前有Gartner报告对Hadoop发行版的看衰论断,后有加拿大皇家银行和美国富国银行对Hadoop应用的不看好,到底国内传统企业对Hadoop持什么态度?是否与国内的互联网企...

大数据应用 / 2018-08-09

深入浅出丨带你看懂数据可视化「美」的历程

大数据应用深入浅出丨带你看懂数据可视化「美」的历程

技术的进步,让我们能够采集到比以前多得多的信息,数据规模不断成指数量级的增长,数据的内容和类型也比以前要丰富得多,改变了人们分析和研究世界的方式,也给...

大数据应用 / 2018-08-09

大数据公司挖掘数据价值的49个典型案例(值得收藏)

大数据应用大数据公司挖掘数据价值的49个典型案例(值得收藏)

本文是近年来不同行业、不同领域的大数据公司的一些经典案例总结。尽管有些已经是几年前的案例,但其中的深层逻辑对于未来仍有启发。...

大数据应用 / 2018-08-07

一文详解大规模数据计算处理原理及操作重点

大数据应用一文详解大规模数据计算处理原理及操作重点

大数据技术主要针对的是大规模数据的计算处理问题,那么要想解决的这一问题,首先要解决的就是大规模数据的存储问题。大规模数据存储要解决的核心问题有三个方面...

大数据应用 / 2018-08-07

对Spark的那些【魔改】

大数据应用对Spark的那些【魔改】

这两年做 streamingpro 时,不可避免的需要对Spark做大量的增强。就如同我之前吐槽的,Spark大量使用了new进行对象的创建,导致里面的实现基本没有办法进行替换...

大数据应用 / 2018-08-06

1
3