大数据应用

大数据整体市场规模达1000亿,金融、政务等行业应用占据七成份额

大数据应用大数据整体市场规模达1000亿,金融、政务等行业应用占

近日,爱分析在京举办了2018·中国大数据高峰论坛并在会上发布了《中国大数据行业报告》(以下简称报告)。《报告》称,2017年大数据行业整体市场规模1000亿,其中...

大数据应用 / 2018-04-25

究竟应该聚多少类?聚类分析

大数据应用究竟应该聚多少类?聚类分析

聚类分析(Cluster analysis)是一组将研究对象分为相对同质的群组(Clusters)的统计分析技术。 聚类分析区别于分类分析(Classification analysis) ,前者是无监督...

大数据应用 / 2018-04-24

互联网公司大数据杀熟越来越厉害,这里有几个办法避开它

大数据应用互联网公司大数据杀熟越来越厉害,这里有几个办法避开

越来越多的人在反思算法带来的负面效应。自从微博用户 @廖师傅廖师傅抱怨了自己用手机打车和订酒店遭遇到的“大数据杀熟”,更多人在社交网络上表达共鸣——面对...

大数据应用 / 2018-04-24

甲骨文携手巨大集团 树立制造业数字化转型新典范

大数据应用甲骨文携手巨大集团 树立制造业数字化转型新典范

巨大集团全球品牌及营销中心首席营销官刘素娟指出:“我们积极投身数字化转型,并希望在构建完整的营销与电商平台之后,简化营销与客户管理工作,让营销人员与门...

大数据应用 / 2018-04-24

数据流A5,Teads如何做到每天赋予1000亿事件价值?

大数据应用数据流A5,Teads如何做到每天赋予1000亿事件价值?

在这篇文章中,我们描述了如何协调Kafka,Dataflow和BigQuery共同采集和转换大数据流。当增加了模式和延时的约束时,调优和重新排序成了很大的挑战,下面展示了...

大数据应用 / 2018-04-24

3月份Github上最热门的数据科学和机器学习项目

大数据应用3月份Github上最热门的数据科学和机器学习项目

Analytics Vidhya 近日发布了GitHub上3月份最热门的5个数据科学和机器学习项目,本月的名单从Google Brain的AstroNet到人造神经网络可视化工具,这都是非常棒的...

大数据应用 / 2018-04-23

【WOT2018】黄东旭:如何运用HTAP数据库帮到你?来听听TiDB的故事

大数据应用【WOT2018】黄东旭:如何运用HTAP数据库帮到你?来听听

PingCAP是国内首家开源的新型分布式数据库公司,其独立研发的分布式数据库产品TiDB是一款定位于HTAP(Hybrid Transactional/Analytical Processing)混合事务/分析...

大数据应用 / 2018-04-23

Python数据挖掘与机器学习技术入门实战

大数据应用Python数据挖掘与机器学习技术入门实战

什么是数据挖掘?什么是机器学习?又如何进行Python数据预处理?本文将带领大家一同了解数据挖掘和机器学习技术,通过淘宝商品案例进行数据预处理实战,通过鸢尾花...

大数据应用 / 2018-04-23

【报告观点】2018年大数据领域的十大趋势

大数据应用【报告观点】2018年大数据领域的十大趋势

众多企业正在慢慢将大数据迁移到云端,但仍然没有克服与孤岛、员工技能短缺和数据治理有关的挑战。本文为您带来《2018年大数据成熟度调查报告》中所包含十大要点...

大数据应用 / 2018-04-23

详解:大数据分析的学习之路

大数据应用详解:大数据分析的学习之路

随着大数据的愈演愈热,相关大数据的职业也成为热门,给人才发展带来带来了很多机会。数据科学家、数据工程师、数据分析师已经成为大数据行业最热门的职位。它们...

大数据应用 / 2018-04-20

干货整理:处理不平衡数据的技巧总结

大数据应用干货整理:处理不平衡数据的技巧总结

在银行欺诈检测,市场实时竞价或网络入侵检测等领域通常是什么样的数据集呢?在这些领域使用的数据通常有不到1%少量但“有趣的”事件,例如欺诈者利用信用卡,用...

大数据应用 / 2018-04-20

如何选择正确的数据集成工具

大数据应用如何选择正确的数据集成工具

为了满足各类业务需求,我们必须将数据与其他数据源的记录系统相集成,从而支持分析、面向客户的应用程序或者内部工作流。而这又带来了新的问题——我们该如何选...

大数据应用 / 2018-04-20

资源控制在大数据和云计算平台中的应用

大数据应用资源控制在大数据和云计算平台中的应用

本文针对大数据平台中资源控制这个层面来详细介绍资源控制在不同操作系统上的具体技术实现,以及大数据平台和资源控制的集成。...

大数据应用 / 2018-04-19

UMStor Hadapter:大数据与对象存储的柳暗花明

大数据应用UMStor Hadapter:大数据与对象存储的柳暗花明

计算机技术领域,何尝不是一个江湖。往具体了说,比如有 Windows 和 Linux 系统级别的缠斗;往抽象了说,有私有云和IOE的概念对垒等。虽说技术不像侠客论剑般交手...

大数据应用 / 2018-04-19

12个顶级大数据工具

大数据应用12个顶级大数据工具

许多大数据分析工具最初像大数据软件框架Hadoop一样都是开源项目,但商业实体迅速涌现,为开源产品提供了新工具或商业的支持和开发。根据这个行业领域的专家顾问...

大数据应用 / 2018-04-17

世界顶尖战略咨询公司常用数据分析模型

大数据应用世界顶尖战略咨询公司常用数据分析模型

波特的五种竞争力分析模型被广泛应用于很多行业的战略制定。波特认为在任何行业中,无论是国内还是国际,无论是提供产品还是提供服务,竞争的规则都包括在五种竞...

大数据应用 / 2018-04-17

预计2021年中国大数据市场规模将达到898亿元

大数据应用预计2021年中国大数据市场规模将达到898亿元

随着移动互联网、智能终端和数据传感器的出现,数据正以超出想象的速度快速增长。据相关数据报告显示,2014年全球数据总量为6.2ZB(万亿GB),2015年全球数据总量...

大数据应用 / 2018-04-17

大数据工程师面试题集锦:互联网公司篇!

大数据应用大数据工程师面试题集锦:互联网公司篇!

大数据工程师是近几年异常火爆的职位,市场需求旺盛,众多互联网公司都打出了高薪招聘的广告,本文整理了网络上部分技术人员分享的各大互联网公司大数据类(Hadoo...

大数据应用 / 2018-04-16

数据科学简介:通过对数据分类进行预测(二)

大数据应用数据科学简介:通过对数据分类进行预测(二)

机器学习已成功应用于许多预测和分类问题,包括航班晚点、信用评分和股票价格。在这里,我将探讨两种重要算法:概率神经网络和基于密度的聚类 (DBSCAN)。...

大数据应用 / 2018-04-16

数据科学简介:分数据、结构和数据科学管道(一)

大数据应用数据科学简介:分数据、结构和数据科学管道(一)

本文探讨了一种用于机器学习的通用数据管道,其中涵盖了数据工程、模型学习和操作。本系列的下一篇文章将探讨使用公有数据集进行预测的两种机器学习模型。...

大数据应用 / 2018-04-16

深入理解HBase的系统架构

大数据应用深入理解HBase的系统架构

物理上来说,HBase是由三种类型的服务器以主从模式构成的。这三种服务器分别是:Region server,HBase HMaster,ZooKeeper。其中Region server负责数据的读写服...

大数据应用 / 2018-04-16

做大数据项目最头痛的是什么

大数据应用做大数据项目最头痛的是什么

启动项目前至少要落实五个问题。其实我个人并不是正儿八经的大数据开发,然而这些年太多项目都挂个“大数据”的头衔,以至于我也被拖下水了。所以处理具体需求时...

大数据应用 / 2018-04-16

数据分析技术给商业模式带来颠覆的五种方式

大数据应用数据分析技术给商业模式带来颠覆的五种方式

近年来,越来越多大型企业开始投资数据分析技术,希望借此证明“我可以做得更好”。而云计算的兴起,也使得规模有限的初创企业也可拥有将大数据技术与高级数据分...

大数据应用 / 2018-04-15

【WOT2018】易观智库CTO郭炜:Lambda架构已死,新一代去ETL化的IOTA架构

大数据应用【WOT2018】易观智库CTO郭炜:Lambda架构已死,新一代

2018WOT全球软件与运维技术峰会重量级嘉宾,拥有13年大数据工作经验的资深专家——易观智库CTO郭炜将在5月18日的2018WOT峰会上分享他的最新观点,那就是Lambda架...

大数据应用 / 2018-04-13

DataHunter完成千万级A轮融资 加速拓展行业布局

大数据应用DataHunter完成千万级A轮融资 加速拓展行业布局

4月11日,国内领先的业务数据协作平台DataHunter正式宣布,已完成千万级A轮融资,投资方为Ventech China。本次融资将帮助DataHunter进一步加强在数据可视化分析...

大数据应用 / 2018-04-12

大数据领域的12大工具,试试看哪个更好用

大数据应用大数据领域的12大工具,试试看哪个更好用

为了满足旺盛需求,大数据工具在迅速遍地开花。在大数据这一概念和业务战略出现以来的十年间,市面上出现了成千上万执行各种任务和流程的工具,它们都承诺可为你...

大数据应用 / 2018-04-12

高端大气的“数据科学家”,竟然成了离职率最高的职位之一

大数据应用高端大气的“数据科学家”,竟然成了离职率最高的职位

每一份工作都很有趣。但是做到优秀却很难,因为这不仅关于技术本身,也关乎职场的复杂性。本文作者Jonny Brooks-Bartlett在“Here’s why so many data scientis...

大数据应用 / 2018-04-11

如何避免HBase写入过快引起的各种问题

大数据应用如何避免HBase写入过快引起的各种问题

整个写入流程从客户端调用API开始,数据会通过protobuf编码成一个请求,通过scoket实现的IPC模块被送达server的RPC队列中。最后由负责处理RPC的handler取出请求...

大数据应用 / 2018-04-11

“你中有我,我中有你”,人工智能想和大数据谈一场恋爱!

大数据应用“你中有我,我中有你”,人工智能想和大数据谈一场恋

如今,没有什么流行词比大数据和人工智能更常见了。很多数据分析表示将从根本上重塑人类的日常生活。事实上,对于围绕人工智能和大数据的讨论,很少有人提到这两...

大数据应用 / 2018-04-10

中国邮政大数据平台建设之总体架构与实现

大数据应用中国邮政大数据平台建设之总体架构与实现

人工智能、大数据与云计算三者有着密不可分的联系。人工智能从1956年开始发展,在大数据技术出现之前已经发展了数十年,几起几落,但当遇到了大数据与分布式技术...

大数据应用 / 2018-04-10

1
3