一、搭建编程环境
工欲善其事,必先利其器,要想学习一门技能,先找到一样趁手的工具,我这里推荐两种:
1)侧重项目开发:Anaconda + PyCharm
参考的书籍《Python编程从入门到实践》、《父与子的编程之旅 与小卡特一起学Python》;更多的基础语法详见菜鸟python3教程 或Python 2基础教程 | 菜鸟教程,如果实在弄不懂如何搭建编程环境,也没关系,学习python最重要是实践,也可以先敲代码,我这里推荐一个python2.7的在线编程环境:Execute Python Online 或者python3的在线编程环境:Online Python3 Compiler - Online Python3 Editor - Online Python3 IDE - Python3 Coding Online - Practice Python3 Online - Execute Python3 Online - Compile Python3 Online - Run Python3 Online
上面Python2和Python3只需要选一个来学就好。
2)侧重数据分析:Anaconda + Jupyter notebook
我下面都会使用Anaconda + Jupyter notebook,编程环境是python3,和jupyter notebook 可以做哪些事情?,更多的基础语法详见菜鸟python3教程,参考的书籍《Python编程从入门到实践》、《父与子的编程之旅 与小卡特一起学Python》。
二、Python的四个关键点
1、数据的基本类型
数据类型有:字符串(String)、数字(Number)、容器、布尔、空值(None)
(1)字符串(String)
字符串:就是一系列字符。在Python中,用引号括起的都是字符串,其中的引号可以是单引号,也可以是双引号,如下所示:
(2)数值(Number)
python3中常见的数字类型为int(整数),float(浮点数),bool(布尔值),complex(复数)。
(3)容器
① 列表(List)
列表的优势在于有序且可以修改,方便查询、增加、修改和删减数据。
② 元组(Tuple)
Python的元组与列表类似,不同之处在于元组的元素不能修改。
元组使用小括号,列表使用方括号。
③ 集合(Sets)
集合是一个无序不重复元素的序列
④ 字典(Dictionary)
字典的每个键值(key=>value)对用冒号(:)分割,每个对之间用逗号(,)分割,整个字典包括在花括号({})中。字典的好处就是它的每一个关键字都对应一个值,就像我们查英语字典一样。
(4)布尔(Booleans)和空值(None)
2、函数
函数是组织好的,可重复使用的,用来实现单一,或相关联功能的代码段。函数能提高应用的模块性,和代码的重复利用率。
定义函数时使用def语句:
函数不可变的数据类型和可变数据类型实例:
变量作用域:
Python的作用域一共有2种:全局作用域,局部作用域。
定义在函数内部的变量拥有一个局部作用域,定义在函数外的拥有全局作用域。 局部变量只能在其被声明的函数内部访问,而全局变量可以在整个程序范围内访问。
3、条件判断
条件判断中的核心都是一个值为True或False的表达式,这种表达式被称为条件测试,其主要应用就是筛选出我们要的结果,其执行过程如图所示:
4、循环
循环有两种:for循环while循环,常用的语句是for循环语句。
for循环用于针对集合中的每个元素都一个代码块,是批量处理数据,可以把容器中每一个数据都按照特定的规则进行重复处理,而while循环不断地运行,直到指定的条件不满足为止。在循环中常用到break语句和continue语句,如下实例。
Continue和break语句用于退出循环:
三、类(Class)
类: 用来描述具有相同的属性和方法的对象的集合。它定义了该集合中每个对象所共有的属性和方法。对象是类的实例。
四、模块和包
模块是扩展名为.py的文件,包含所有你定义的函数和变量的文件。模块可以被别的程序引入,以使用该模块中的函数等功能。
导入模块常用的一种导入方法:只需编写一条import语句并在其中指定模块名,就可在程序中使用该模块中的所有函数。
模块包括Python内置模块和第三方模块(或自己编写的模块),下面列出了我自己安装Python3的内置模块路径:
下面的代码是导入第三方模块pandas的一个演示,我以读取存放在自己电脑
D:Python otebook 上的一个叫 B9 USB QV数据.xlsx的文件为例:
五、常用数据结构
1、队列(queue)
队列就像在银行排队办理业务,新来的人在队列尾部加入,叫做入队。办理完业务的人从队列首部离开队列,叫做出队。
口诀:先入先出
2、栈(stack)
栈就像储钱罐,往储钱罐里丢入一枚硬币,就是入栈,后面丢入的硬币总是在最上面。
口诀:先入后出
3、排序字典OrderedDict
排序字典能够按照字典中插入key的顺序,对字典进行排序。
4、计数器Counter
Counter(计数器):用于追踪值的出现次数。
从结果中可以看出,在统计出现次数最多的3个字时,原字符串中所有标点符号都属于字符串,因此也会计算在内,可以采用切片+拼接的方法,删除poem中的标点符号再来统计:
附一张python学习的脑图总结: