python文本分析与挖掘（一）-构建语料库

作者: V数据杂坛 | 来源:发表于2022-06-04 12:39 被阅读0次

数据挖掘的基础
《Python数据分析与挖掘实战.pdf》PDF高清完整版-免费
ImageQ|文本挖掘工具|在线文本挖掘工具|分析"霍
Python 语料库的搭建
文本挖掘工具|在线文本挖掘工具|分析"女子带宝宝自考&
文本挖掘工具|在线文本挖掘工具|分析"哈勃"
2019-06-04
文本挖掘工具|在线文本挖掘工具|分析娱乐圈热门语料
ai 文本挖掘相关
【分析篇】：python基本统计特征函数解释

实现功能：

python文本分析与挖掘（一）-构建语料库

实现代码：

import os

from warnings import simplefilter

simplefilter(action='ignore', category=FutureWarning)

import os.path

import codecs

import pandas

#==========词料库构建=================

def Create_corpus(file):

filePaths = []

fileContents=[]

for root, dirs, files in os.walk(file):

print(root)

print(dirs)

print(files)

# os.path.join()方法拼接文件名返回所有文件的路径，并储存在变量filePaths中

for name in files:

filePath=os.path.join(root, name)

filePaths.append(filePath)

print(filePaths)

f = codecs.open(filePath, 'r', 'utf-8')

print(f)

fileContent = f.read()

print(fileContent)

f.close()

fileContents.append(fileContent)

#codecs.open()方法打开每个文件，用文件的read()方法依次读取其中的文本，将所有文本内容依次储存到变量fileContenst中，然后close()方法关闭文件。

#创建数据框corpos，添加filePaths和fileContents两个变量作为数组

corpos = pandas.DataFrame({'filePath': filePaths,'fileContent': fileContents})

print(corpos)

Create_corpus("F:\医学大数据课题\AI_SLE\AI_SLE_TWO\TEST_DATA")

实现效果：

喜欢记得点赞，在看，收藏，

关注V订阅号：数据杂坛，获取数据集，完整代码和效果，将持续更新！

网友评论

本文标题：python文本分析与挖掘（一）-构建语料库

本文链接：https://www.haomeiwen.com/subject/tjsrmrtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

python文本分析与挖掘（一）-构建语料库

相关文章

数据挖掘的基础

《Python数据分析与挖掘实战.pdf》PDF高清完整版-免费

ImageQ|文本挖掘工具|在线文本挖掘工具|分析"霍

Python 语料库的搭建

文本挖掘工具|在线文本挖掘工具|分析"女子带宝宝自考&

文本挖掘工具|在线文本挖掘工具|分析"哈勃"

2019-06-04

文本挖掘工具|在线文本挖掘工具|分析娱乐圈热门语料

ai 文本挖掘相关

【分析篇】：python基本统计特征函数解释

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读