大数据应用

TalkingData林逸飞:以数据智能探索业务突破 企业需正视数字化三大短板

大数据应用TalkingData林逸飞:以数据智能探索业务突破 企业需正

以“突破”为主题的T11 2018暨TalkingData数据智能峰会上,TalkingData合伙人兼执行副总裁林逸飞发表了“以数据智能探索业务突破”的精彩分享。他表示,企业进行...

大数据应用 / 2018-09-25

憋瞎说,大数据不是你想的那样

大数据应用憋瞎说,大数据不是你想的那样

学生党以及很多没设计过大数据开发的小伙伴呢,都对大数据这么一个领域感到非常非常的好奇非常非常的神秘,我今天就非要戳穿给你们看。...

大数据应用 / 2018-09-25

工博会在沪启幕,联想大数据LeapAI.com助力企业“跨越式”前进

大数据应用工博会在沪启幕,联想大数据LeapAI.com助力企业“跨越

全球领先的开源解决方案供应商红帽公司(纽交所代码:RHT)日前宣布推出红帽Ansible Tower 3.3,这是目前实现IT运营自动化及编排能力的企业级框架最新版本。...

大数据应用 / 2018-09-22

小议Lambda与Kappa架构,不可变数据的计算探索

大数据应用小议Lambda与Kappa架构,不可变数据的计算探索

Lambda架构说起来也很简单,就是通过分布式系统的组件搭建,设计出一个具有鲁棒性,可扩展,低延时的分布式计算系统。之所以称之为Lambda架构,就是它最为核心的...

大数据应用 / 2018-09-21

深度挖掘,大数据不是事儿

大数据应用深度挖掘,大数据不是事儿

技术型的高科技创业公司都喜欢闪闪发光的新东西,而“大数据”跟3年前火热程度相比反而有些凄惨。虽然Hadoop创建于2006年,在“大数据”的概念兴起到达白热化是...

大数据应用 / 2018-09-21

2018年值得拥有的十大大数据挖掘工具

大数据应用2018年值得拥有的十大大数据挖掘工具

数据挖掘是指这个过程:在庞大数据集当中发现模式,将它转换成有效的信息。该技术利用特定的算法、统计分析、人工智能和数据库系统,从庞大数据集中提取信息,并...

大数据应用 / 2018-09-20

BigData:值得了解的十大数据发展趋势

大数据应用BigData:值得了解的十大数据发展趋势

本文总结了大数据技术领域中的十大发展趋势,涵盖人工智能、量子计算、智能机器人等多个领域。...

大数据应用 / 2018-09-20

成都房价现在多少?和北京差距很大吗?Pytho爬取了四万套房源!

大数据应用成都房价现在多少?和北京差距很大吗?Pytho爬取了四

作为一家技术人员,决定用技术解决这个疑问。我们用Python爬取了贝壳网上4万多套的成都在售房源,告诉你最真实的成都房价。...

大数据应用 / 2018-09-19

Hadoop中Hive原理及安装

大数据应用Hadoop中Hive原理及安装

Apache Hive数据仓库软件有助于使用SQL读取,写入和管理驻留在分布式存储中的大型数据集。可以将结构投影到已存储的数据上。提供命令行工具和JDBC驱动程序,用于...

大数据应用 / 2018-09-18

数据行业职业薪资“钱景”:平均薪资轻松过万,最高5万

大数据应用数据行业职业薪资“钱景”:平均薪资轻松过万,最高5

近年来,大数据越来越火,相关产业也在各项利好政策下蓬勃发展。越来越多的人开始考虑网大数据方向发展,这其中,高薪资是主要原因。据数联寻英发布《大数据人才...

大数据应用 / 2018-09-18

HBase相对Hive查询速度快的对比

大数据应用HBase相对Hive查询速度快的对比

HBase的机制是将数据先写入到内存中(缓存Buffer中),当数据量达到一定的量(如128M),产生溢写磁盘操作,在内存中,是不进行数据的更新或合并操作的,只增加数据...

大数据应用 / 2018-09-18

MapReuce中对大数据处理最合适的数据格式是什么?

大数据应用MapReuce中对大数据处理最合适的数据格式是什么?

在本章的第一章节介绍中,我们简单了解了Mapreduce数据序列化的概念,以及其对于XML和JSON格式并不友好。本节作为《Hadoop从入门到精通》大型专题的第三章第二节...

大数据应用 / 2018-09-18

推荐 :一小时建立数据分析平台

大数据应用推荐 :一小时建立数据分析平台

今天教大家如何搭建一套数据分析平台。它可能是最简单的搭建教程,有一点Python基础都能完成。比起动辄研发数月的成熟系统,借助开源工具,整个时间能压缩在一小...

大数据应用 / 2018-09-17

曹永寿:大数据及AI技术 构建衡量艺人商业价值的标尺

大数据应用曹永寿:大数据及AI技术 构建衡量艺人商业价值的标尺

艾漫数据总裁曹永寿介绍,“艾漫数据成立以来,一直致力于构建娱乐产业全方位的大数据服务平台,以数据构建和连接泛娱乐产业链上下游。艾漫成立近七年来有两大标...

大数据应用 / 2018-09-17

什么样的大数据平台架构,才是最适合你的?

大数据应用什么样的大数据平台架构,才是最适合你的?

大数据平台架构的层次划分没啥标准,以前笔者曾经做过大数据应用规划,也是非常纠结,因为应用的分类也是横纵交错,后来还是觉得体现一个“能用”原则,清晰且容...

大数据应用 / 2018-09-16

10个最令人垂涎的大数据职位 数据科学家增长率最高

大数据应用10个最令人垂涎的大数据职位 数据科学家增长率最高

TechGenix日前刊发了Benjamin Roussey撰写的一个报道,作者对市场上10个最受欢迎的大数据岗位进行了梳理。不知道中国大数据工程师的薪酬有没有达到这个水准呢?...

大数据应用 / 2018-09-16

从京东618数据井喷看大数据平台峰值处理制胜关键

大数据应用从京东618数据井喷看大数据平台峰值处理制胜关键

随着DT(数据技术)A5的到来,人们能比以往更容易地获取更丰富的数据。数据作为一种新的能源形式,正在源源不断地发挥其巨大的价值,帮助我们激发更多的技术驱动...

大数据应用 / 2018-09-14

零基础学习大数据挖掘的33个知识点整理

大数据应用零基础学习大数据挖掘的33个知识点整理

下面是一些关于大数据挖掘的知识点,笔者和大家一起来学习一下。 包括:主要知识模式类型、Web挖掘研究的主要流派、数据库中的知识发处理过程模型等等。...

大数据应用 / 2018-09-14

Hadoop生态系统各组件与Yarn的兼容性如何?

大数据应用Hadoop生态系统各组件与Yarn的兼容性如何?

本文作为《Hadoop从入门到精通》大型专题的第二章第三节,主要介绍了Yarn如何与Hadoop生态系统中其他组件配合,这也是本专题有关Yarn概念的最后一节,如果你想了...

大数据应用 / 2018-09-13

数据挖掘领域十大经典算法之—朴素贝叶斯算法(附代码)

大数据应用数据挖掘领域十大经典算法之—朴素贝叶斯算法(附代码

NaveBayes算法,又叫朴素贝叶斯算法,朴素:特征条件独立;贝叶斯:基于贝叶斯定理。属于监督学习的生成模型,实现简单,没有迭代,并有坚实的数学理论(即贝叶斯...

大数据应用 / 2018-09-13

力压 R,Python 在数据科学领域风生水起

大数据应用力压 R,Python 在数据科学领域风生水起

随着 IT 行业的增长,对有经验的数据科学家的需求也水涨船高,而 Python 也一跃而成最受欢迎的语言。本文旨在介绍分析数据的基本知识,并利用 Python 创建一些漂...

大数据应用 / 2018-09-13

【大数据分析】纷繁复杂的数据越多越好

大数据应用【大数据分析】纷繁复杂的数据越多越好

执迷于精确性是信息缺乏A5和模拟A5的产物。在那个信息贫乏的A5,任意一个数据点的测量情况都对结果至关重要。所以,我们需要确保每个数据的精确性,才不会...

大数据应用 / 2018-09-13

Hadoop体系结构中的服务角色介绍

大数据应用Hadoop体系结构中的服务角色介绍

翻了一下最近一段时间写的分享,DKHadoop发行版本下载、安装、运行环境部署等相关内容几乎都已经写了一遍了。虽然有的地方可能写的不是很详细,个人理解水平有限...

大数据应用 / 2018-09-13

C轮融资5000万美元 PingCAP做真正落地的融合型通用数据库

大数据应用C轮融资5000万美元 PingCAP做真正落地的融合型通用数

新型分布式关系型数据库公司 PingCAP 宣布完成 5000 万美元 C 轮融资,这是目前为止新型分布式关系型数据库领域的最大笔融资。本轮融资由复星、晨兴资本领投,华...

大数据应用 / 2018-09-12

以数据驱动突破,TalkingData T11 2018数据智能峰会成功举办

大数据应用以数据驱动突破,TalkingData T11 2018数据智能峰会成

以“突破”为主题的T11 2018暨TalkingData数据智能峰会于9月11日在北京成功举办。大会设置“数创未来”智慧城市峰会、“智变金融”新金融峰会、“数聚零售”新零...

大数据应用 / 2018-09-12

技术分享:数据不平衡问题

大数据应用技术分享:数据不平衡问题

在学术研究与教学中,很多算法都有一个基本假设,那就是数据分布是均匀的。当我们把这些算法直接应用于实际数据时,大多数情况下都无法取得理想的结果。因为实际...

大数据应用 / 2018-09-11

BAT大数据的面试题 快收藏!

大数据应用BAT大数据的面试题 快收藏!

一个Kafka的Message由一个固定长度的header和一个变长的消息体body组成。header部分由一个字节的magic(文件格式)和四个字节的CRC32(用于判断body消息体是否正常)...

大数据应用 / 2018-09-11

Hadoop发行版本之间的区别

大数据应用Hadoop发行版本之间的区别

Hadoop是一个能够对大量数据进行分布式处理的软件框架。 Hadoop 以一种可靠、高效、可伸缩的方式进行数据处理。Hadoop的发行版除了有Apache hadoop外cloudera,h...

大数据应用 / 2018-09-11

一文了解数据库高可用容灾方案的设计与实现

大数据应用一文了解数据库高可用容灾方案的设计与实现

本文将通过介绍一些业界主流的数据库高可用架构、每种方案的特性和优缺点,以及数据库高可用架构的自动化运维实现,讲讲数据库高可用容灾方案设计与实现,希望抛...

大数据应用 / 2018-09-10

数据科学究竟是什么?

大数据应用数据科学究竟是什么?

数据科学仅是一种概念,它结合了统计学、数据分析、机器学习及其相关方法,旨在利用数据对实际现象进行“理解和分析”。简单来讲:数据科学是一门将数据变得有用...

大数据应用 / 2018-09-10

1
3