美文网首页爬虫遇逆向
python 正确字符串处理

python 正确字符串处理

作者: 盖码范 | 来源:发表于2019-11-25 14:48 被阅读0次

不管是谁,只要处理过由用户提交的调查数据,就能明白这种乱七八糟的数据是怎么一回事。为了得到一组能用于分析工作的格式统一的字符串,需要做很多事情:去除空白符、删除各种标点符号、正确的大写格式等。做法之一是使用内建的字符串方法和正则表达式re模块:

一般写法

states = ['   Alabama ', 'Georgia!', 'Georgia', 'georgia', 'FlOrIda',
         'south   carolina##', 'West virginia?']

import re

def clean_strings(strings):  # 一般对数据的处理步骤
    result = []
    for value in strings:
        value = value.strip()
        value = re.sub('[!#?]', '', value)
        value = value.title()
        result.append(value)
    return result

In [173]: clean_strings(states)
Out[173]: 
['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South   Carolina',
 'West Virginia']

推荐写法

这种多函数模式使你能在很高的层次上轻松修改字符串的转换方式。此时的clean_strings也更具可复用性!

def remove_punctuation(value):
    return re.sub('[!#?]', '', value)

clean_ops = [str.strip, remove_punctuation, str.title]  # 函数也是对象

def clean_strings(strings, ops):
    result = []
    for value in strings:
        for function in ops:
            value = function(value)
        result.append(value)
    return result

In [175]: clean_strings(states, clean_ops)
Out[175]: 
['Alabama',
 'Georgia',
 'Georgia',
 'Georgia',
 'Florida',
 'South   Carolina',
 'West Virginia']

# 或者
In [176]: for x in map(remove_punctuation, states):  #  
   .....:     print(x)
Alabama 
Georgia
Georgia
georgia
FlOrIda
south   carolina
West virginia

相关文章

  • python 正确字符串处理

    不管是谁,只要处理过由用户提交的调查数据,就能明白这种乱七八糟的数据是怎么一回事。为了得到一组能用于分析工作的格式...

  • Python学习资料--字符串处理内置方法全集

    Python学习资料整理--字符串处理内置方法全集 代码小工蚁整理了python编程语言的字符串处理内置方法。欢迎...

  • Python3字符串处理函数

    Python3字符串处理函数 Python3

  • Python | 如何处理字符串过长

    标签:python 2019-01-28-如何处理字符串过长? 原网址: 在python中长度不建议超过80,处理...

  • PythonQuickView by L0st

    PythonQuickView 处理字符串 列表 数字相关 元组 Python中的逻辑运算 Python中的If结...

  • Python字符串处理的8招秘籍

    Python的字符串处理,在爬虫的数据解析、大数据的文本清洗,以及普通文件处理等方面应用非常广泛,而且Python...

  • Python 字符串常见操作总结

    介绍Python常见的字符串处理方式 1、字符串连接 2、字符串转数组 3、字符串比较 4、字符串查找 5、字符串...

  • Python字符串的处理

    平时使用Python都是处理一些脚本,其中使用频率最大的就是字符串的处理方面,因此整理一些常用的字符串处理使用方法...

  • 【Chapter 7.3】字符串处理

    【Chapter 7.3】字符串处理 python很多内建方法很适合处理string。而且对于更复杂的模式,可以配...

  • Python截取字符串的子串

    Python处理字符串非常方便。这篇博客将通过一个简单的示例程序介绍如何使用Python截取字符串的子串。 示例程...

网友评论

    本文标题:python 正确字符串处理

    本文链接:https://www.haomeiwen.com/subject/iczdwctx.html