全栈 - 2 序言 数据工程和编程语言

作者: 宏伦工作室 | 来源:发表于2016-11-07 10:13 被阅读232次

这是全栈数据工程师养成攻略系列教程的第二期:2 序言 数据工程和编程语言。

现在大数据的概念火得不行,太多的人言必称大数据,所以我这里就不谈大数据了,而是介绍如何去做一些小而美的数据工程和数据应用。

如何玩转数据##

玩转数据基本包括以下四个流程:

  1. 第一是采集,我们的数据从何而来?要么是别人准备好提供给我们,要么就需要我们自己去采集,或者从互联网上抓取;
  2. 第二,我们需要把采集到的数据存储下来。可以存储到静态文件,例如txt、csv、json等,也可以存储到一些通用而且成熟的数据库里,例如mysql、postgres等;
  3. 第三,对存储的数据进行清洗分析。一方面是做一些统计汇总的工作,并得出一些结论;另一方面是用机器学习的方法训练一些模型,并且用来解决实际问题;
  4. 最后,用数据可视化的方法将所得的结论和模型进行展示,毕竟一图胜千言,数据可视化可以帮助我们更好地展示从数据中挖掘出的价值。

关于编程语言##

很多人都在争论,到底哪种编程语言最好;也有很多人在困惑,要做数据分析的话,应该从哪种编程语言学起。其实在我看来,只学习一门语言可能远远不够,而是各个方面都应当有所涉足,但是同时又有最擅长和习惯使用的一门语言。

C++和Java这两门语言你需要至少熟悉一门,从而了解语法的基本内容和面向对象的编程思想。熟悉的意思是不用完全掌握,只要在要用的时候,查一查,能够快速回想起来相关内容即可。

Python是一门简单好用而且功能强大的语言,也是我使用最多、最为熟悉的一门语言,开玩笑地说,Python大法好,除了炒菜别的Python都可以干。

R是一门统计分析语言,近几年它的学习门槛和成本都在不断降低,可以用来做一些专业的分析和绘制一些漂亮的图形。

然后就是和Web网站开发相关的一些语言,例如后端的PHP、NodeJS,前端的HTML、CSS和JavaScript等。

就我个人而言,比较习惯于用Python采集数据并且写入到文件或数据库,做分析的时候结合使用Python和R。至于可视化,则是用R绘制一些静态图形,使用Web网站做一些交互可视化。

在接下来的教程中,我会以Python为主,为大家介绍如何进行数据的采集、存储、分析和可视化,带大家去做一些简单而有意思的事情。

视频链接:数据工程和编程语言

相关文章

  • 全栈 - 2 序言 数据工程和编程语言

    这是全栈数据工程师养成攻略系列教程的第二期:2 序言 数据工程和编程语言。 现在大数据的概念火得不行,太多的人言必...

  • 兄弟会全栈工程师第一天学习笔记

    全栈工程师第一天学习笔记 全栈工程师的概念 1.从搭建服务器、数据库、开发、运行、维护 2.掌握多种编程语言进行混...

  • XDL_NO.1 走向全栈工程师 第一天

    走向全栈工程师 第一天 内容 2016年8月4日 Markdown 什么是全栈工程师,栈又是什么? 编程语言发展历...

  • 全栈不仅是会开发那么简单

    许多“有抱负”或者热爱编程的程序员,对全栈工程师可能都是孜孜以求。全栈是一种极客精神,对软件的每一种编程语言、每一...

  • 0805_指令式编程思维

    知识点回顾 markdown 全栈工程师 编程语言发展历程 ps: 这一块我断网了 指令式编程思维 顺序 选择 循...

  • 全栈 - 3 序言 带好装备Python和Sublime

    这是全栈数据工程师养成攻略系列教程的第三期:3 序言 带好装备Python和Sublime。 对于程序员来说,两件...

  • 第一天 全栈工程师

    兄弟会-全栈工程师 兄弟会-全栈工程师 第一天笔记 markdown文档编写 全栈工程师: 网站服务器搭建+数据设...

  • 大数据全栈式开发语言 – Python

    大数据全栈式开发语言 – Python 从各个领域流行语言排名中,我发现Python可以称为大数据全栈式开发语言。...

  • 一名全栈工程师的必备工具箱

    全栈工程师,也叫全端工程师,是指掌握多种技能,并能利用多种技能独立完成产品的人。全栈工程师熟悉多种开发语言,同时具...

  • 全栈工程师第二天学习笔记

    全栈工程师第二天学习笔记 指令式编程原理 指令式编程是计算机根据指令执行,我们得任何编程语言都可以看作是一种指令,...

网友评论

    本文标题:全栈 - 2 序言 数据工程和编程语言

    本文链接:https://www.haomeiwen.com/subject/pdznuttx.html