Python学习笔记-3群18组-杜杜狼-2017.8.2

作者: 渡笃狼 | 来源:发表于2017-08-03 09:41 被阅读8次

Python学习笔记-3群18组-杜杜狼-2017.8.2
Python学习笔记-3群18组-杜杜狼-2017.8.16
Python学习笔记-3群18组-杜杜狼-2017.8.17
Python学习笔记-3群18组-杜杜狼-2017.8.8
Python学习笔记-3群18组-杜杜狼-2017.8.9
Python学习笔记-3群18组-杜杜狼-2017.7.24
Python学习笔记-3群18组-杜杜狼-2017.7.25
Python学习笔记-3群18组-杜杜狼-2017.7.20
Python学习笔记-3群18组-杜杜狼-2017.7.19
Python学习笔记-3群18组-杜杜狼-2017.7.21

Lesson 6 词频统计 - 中文分词

中文分词（Chinese Word Segmentation）：将一个汉子序列切分成一个一个单独的词
停用词(Stop Words)：数据处理时，需要过滤调某些词或字

泛滥的词，如web, 网站
语气助词，副词，介词，连接词

#分词方法
jieba.cut(content)
#优化分词效果: 增加自定义分词
jieba.add(word)
#优化分词效果: 导入自定义词典
jieba.load_userdict(filePath)

如何找相关领域的词库？

Lesson 7 词频统计-实现

Term frequency 某个词在该文档中出现的次数

分组统计函数
DataFrame.groupby(
by=列名数组
)[统计列名数组].agg({
'统计项名称'：统计函数
})

列表包含
DataFrame.Column_name.isin(数组)

取反
df[~df.列名.isin(数组)]

Python学习笔记-3群18组-杜杜狼-2017.8.2
Lesson 6 词频统计 - 中文分词中文分词（Chinese Word Segmentation）：将一个汉...
Python学习笔记-3群18组-杜杜狼-2017.8.16
Lesson 19 逻辑回归针对因变量为分为变量而进行回归分析的一种统计方法，属于概率型非线性回归优点：算法易于...
Python学习笔记-3群18组-杜杜狼-2017.8.17
Lesson 20 神经网络简介神经网络（Artificial Neural Network）全程为人工神经网...
Python学习笔记-3群18组-杜杜狼-2017.8.8
Lesson 12 sklearn sklearn全名Scikit-learn, 是基于Python的机器学习模块...
Python学习笔记-3群18组-杜杜狼-2017.8.9
Lesson 13 相似文章推荐在用户阅读某篇文章时，为用户推荐更多与在读文章内容相类似的文章。推荐（Reco...
Python学习笔记-3群18组-杜杜狼-2017.7.24
Lesson 26 虚拟变量虚拟变量又叫哑变量和离散特征编码，用来表示分类变量，非数量因素可能产生的影响离散特...
Python学习笔记-3群18组-杜杜狼-2017.7.25
Lesson 30 交叉分析(cross-over analysis)通常用于分析两个或两个以上，分组变量之间的关...
Python学习笔记-3群18组-杜杜狼-2017.7.20
Part1: 搞懂了pandas DataFrame的column sharding问题 Attention: c...
Python学习笔记-3群18组-杜杜狼-2017.7.19
Part1. Review昨天通过视频学习的知识点：包括重复值处理，空值填充，空格处理，字段拆分等 Part2. ...
Python学习笔记-3群18组-杜杜狼-2017.7.21
Lesson 21 简单计算通过对已有字段加减乘除，得出新的字段当增加或修改某一列时，只能使用: Attenti...

网友评论

本文标题：Python学习笔记-3群18组-杜杜狼-2017.8.2

本文链接：https://www.haomeiwen.com/subject/warelxtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

Python学习笔记-3群18组-杜杜狼-2017.8.2

Lesson 6 词频统计 - 中文分词

Lesson 7 词频统计-实现

相关文章

Python学习笔记-3群18组-杜杜狼-2017.8.2

Python学习笔记-3群18组-杜杜狼-2017.8.16

Python学习笔记-3群18组-杜杜狼-2017.8.17

Python学习笔记-3群18组-杜杜狼-2017.8.8

Python学习笔记-3群18组-杜杜狼-2017.8.9

Python学习笔记-3群18组-杜杜狼-2017.7.24

Python学习笔记-3群18组-杜杜狼-2017.7.25

Python学习笔记-3群18组-杜杜狼-2017.7.20

Python学习笔记-3群18组-杜杜狼-2017.7.19

Python学习笔记-3群18组-杜杜狼-2017.7.21

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读