数据可视化,我应从何开启?语言&工具

来源:互联网 / 作者:SKY / 2016-08-28 21:48 / 点击:
假如您最近和我介入集会,我在您耳边说的都是有关数据可视化器材可能最近行使的酷R包,对此我在这向您暗示歉意。

我喜好数据,并将它广为人知。

数据可视化,我应从何开启?

假如您最近和我介入集会,我在您耳边说的都是有关数据可视化器材可能最近行使的酷R包,对此我在这向您暗示歉意。

假如您和我玩范特西游戏,接待您来到图表天下,这里有许多的图表。

不要为越来越频仍地听到下面的题目感想惊奇:“Nick,我想走向数据说明和数据可视化,我应该从那边开始?

不幸的是,没有一个美满的谜底得当全部的人–每一小我私人的需求差异且人们已经知道的对象相差很大。但令我兴奋的是一件关于最近科技/教诲/贸易情形工作:

来自差异职业阶梯和配景的智慧人都对本身说:“我必要从数据中获得更多”。

可是,在许多初学者雷同后,发明白的共性。很明明,这些共性不是得当每一小我私人的:

一个精悍的工程师会讥笑共性上说的第一时刻进修Java剧本可能Python。

早已知道D3.js 的人会迷惑选择哪一个可视化器材?可能迷惑怎么样将数据驱动转换应用顶级的3D中?

这些得当想进一步相识靠近数据可视化的学术科学家、学校先生、研究咨询师、项目司理、赋闲快乐族可能MBA结业生……。

假如切合你,我以为你应该开始于从“无编码”有打算地进修到“爱编码”。

无编码

起首,假如你对excel一窍不通,这是值得去做的。严重地汇报你至少得学会透视表,听起来有些差劲,可是Excel能做许多超乎人们想象的工作。假如你擅长实行,Excel乃至能做出许多大度的图表。

假如你已经有一些数据,仅仅想用一个好的器材来试探可视化可能输出更多引人注目标图表。Tableau 就很风行、成果惊人,它有免费的民众版和一个异常昂贵用度的付费版,

不外假如你是门生就可以享受到免费版。它一样平常会在网上,可能论文上以静态图表情势宣布,也可以传送到Instagram上可能以墙图输出。在它的官网上可以找到许多模板,引发你的灵感。

遗憾地是,将要切磋的另一个器材–Infoactive,痛惜已经下架了,但不要紧,Tableau接收了Infoative全部利益。这个意味着Tableau很有也许是将来公认的好器材。我将牵头一本免费的书,它是Infoactive团队教育下涉及数据可视化计划器材的配景资料,下面评论的任何器材:

数据+计划

一个简朴有关筹备和可视化信息的声名先容

简朴编码

假如要选择一款独立的措施说话来操纵单机数据,我会选择R说话。由于R说话是免费的,且支持大量的在线开拓加载有效的顶级基本说话措施包,而且有大量的免费资源进修怎样运用它。在这些资源中–我积极保举Coursera课程:

数据科学家证书|课程

约翰霍普金斯大学验证通过的数据科学专业化专家成为数据科学家自由评论……

它们也许会扼杀一个真正的初学者,可是课程能带你走出一条重要数据科学项目和设法的蹊径,通过全部的方法试探数据说明(它涵盖了有效的R包,譬喻ggplot,一个异常受接待的可视化器材)的交互性,通过Shiny和数据故事宣布在网页上。

R是我最常用来处理赏罚小型快速的说明和数据可视化器材–假若有一个数据(数据量大、不易于可视化)Excel处理赏罚不了,R最得当快速试探。

“是的,你也许要学些一些SQL”,其它一个快速入门的说话–SQL,与R对比(现实上,这已经超出了苹果和苹果的较量),SQL是一门较量有针对性的说话:

假如你但愿在数据库顶用任何器材可能说话集成数据,这将是一个很好的机遇让你有进修SQL的乐趣。

爱编码

凡是,在网页上看到一个柔美的交互式可视化界面,城市显露一个题目“我们要从何学起?”。我沉迷于这个创新的规模(点击这可以看更多深入的观测)。

不幸地是,假如你喜好这些作品:

一个呆板进修的可视化先容

让我们从头审阅73英尺高的界线,提出了我们的提议,看看我们是奈何地进步直觉。明明地……

……它可以令你沮丧的发明尚有几多对象必要本身进修。重复的实践以求得“《纽约时报》一样好”是一个艰巨的方针,值得可是坚苦。

荣幸的是,这里有许多辅佐资源。

交互式的作品后头的逻辑库,和许多在网页上运行的数据可视化作品都是Mike Bostock创作的D3.js。D3.js是一个很好的器材去进修作品网页宣布和交互式。

博斯托克(Bostock)的网站是一个有关金矿的例子和教程网站(你不必要筋疲力竭地从逻辑库的建设者学起……)。

我也保举Murry建设的网页版交互式数据可视化,你可以从 O’Reilly 那购置可能网上在线免费行使:

网页交互式数据可视化

这是一个关于非措施员的编程数据可视化的书。假如你是一个拥有视觉手艺的艺术家或图形计划师,但没有从事数据或代码事变的先验履历,这本书得当你。假如你是一个拥有大量数据的记者或研究职员,但没稀有据可视化或代码的先验事变,这本书也得当你。

在线版本很好–你可以随着册本自己编写代码剧本,运行它并拿你的输出功效和模板较量。Murray 还出格为初学者量身定制,这个网站能很好的引导初学者从HTML/CSS和Javascript基本到深入进修相对难的D3。

D3的地理空间可视化是一个值得一提的优点。D3善于缔造许多差异结果的舆图,假如这是你的专业规模,这里可以得到不错的专用教程:

让我们画一个泡泡舆图

我早年让舆图教程先容了怎样用D3和topojson做一个根基的舆图;此刻是时辰让它包围……

D3很难操纵,但也有器材能低流浪度,我提议行使最基本的D3而不是伟大的画图措施,时代站长网,假如你人认为棘手,那行使Plot.ly会更现实。

假如你要学全能的措施说话,那Python是最得当。它成果强盛目标性强,很受接待。

我发明Python是一种极易上手且多用途的编程说话。但现实上,假如你要做的是试探和可视化数据,它会让你认为吃力:譬喻Youtube就是用Python开拓的……代码有一百万行。假如你想相识Python,Code Academy 课程是一个短且风趣的说话先容。

最后,和前面先容的D3.js , Javascript or ggplot ,R一样, Python也有许多资料库。最值得保举的是,Seaborn(成立在一个年长受接待的库,matplotlib)和Bokeh很有也许是一流的,可是这是一个快速成长和晋升的规模。Seaborn and Bokeh 的网站包罗画廊展示你用这些器材建设的各类百般的可视化作品。

啊!太多太多!祝您舒畅–假如你缔造了一些风趣的对象,请接洽我:在Twitter上@uptownnickbrown可能发我的邮箱nick@quanticle.co

阅读延展

1
3