此系列更新《Python Real World Data Science》的阅读摘记,每周六更新。
全书介绍Python在数据科学领域中的应用,分为四模块:
- Python 基础
- 数据分析
- 数据挖掘
- 机器学习
本文为系列第一篇,介绍python基础。
Module 1 Python Fundamentals
Chapter 1 Introduction and First Steps
简单来说,编程就是使用计算机可以理解的语言让它做某件事情。类似我们日常生活中做事情的流程:估计是否满足条件,决定采取哪些动作,执行任务,重复某些动作,在某个点停止(完成或意外),清理现场。
编程时,需要将真实世界中的对象使用计算机世界中的对象Object
表达,Object
的两个特征
- 属性Properties
- 方法Methods
Python 将数据抽象为对象Objects
,Python程序中的数据均由Objects
或Objects
之间的联系表达。Objects
分为mutable
和immutable
,Objects
有自己的名字。
Python优点
- 可移植性
- 一致性
- 开发效率
- 扩展库
- 软件质量
- 软件集成
Python缺点
- 慢,python编译生成pyc,再由解释器运行pyc;而不是直接编译成机器级别
Python环境安装
- Google is your friend
Python代码运行方式
- 脚本
- 交互式Shell
- 服务
- GUI应用
Python代码组织方式
- 非脚本类的代码需要分成多个文件
-
Package
= 文件夹 +__init__.py
Modules
Functions
Library
原则:不在不同地方重复一个逻辑,Do not repeat yourself !
- 如果逻辑存在漏洞,需要在各个地方都修改
- 如果需要修正,也要在各个地方修改
- 代码太长!
Python's Execution Model
-
names
:用于代码中提取数据(Binding机制) -
namespace
:names和objects之间的映射 -
scope
:直接可访问namespace的文本区域(缩进控制),按照以下次序搜索name,如果都没找到则报告NameError
local scope
enclosing scope
global scope
built-in scope
如何写出漂亮代码
- PEP8 Guideline
Zen of Python

网友评论