在我们前几节的课程中,大多数序列中的元素都可以被数值表示,这意味着它们都能被转换成为数组,如下所示:
1
而在实际的数据分析项目中,我们也常常能够遇见由字符串构成的序列,如人名、地名等等,本节将教大家一些处理字符串序列的基本方法,以及一些简单的数据读写方法。
首先,大小写的处理是我们处理字符串时常见的问题,Python 内置的函数 capitalize 能够帮助我们将各种形式的字符串转化为首字母大写的形式:
需要注意的是,这个函数无法处理缺失值,所以在转换大小写形式前,请确认你的目标字符串列表里没有缺失值:
接下来,我们来看一下如何处理含有字符串元素的 Pandas 序列,首先我们构建一个 Pandas 序列 name:
4
可以看到,我们的序列 name 中存在一个缺失值 None,我们可以通过 Pandas 序列的 str 属性将序列中的字符串元素提取出来,并调用 capitalized 函数,从而将所有字符串都转化为首字母大写的形式:
5
未完待续:课程内容较多,请复制链接通过电脑学习,获得最佳学习效果。 http://datacademy.io/lesson/110













网友评论