美文网首页
基于Bert的文本聚类工具:BERTopic

基于Bert的文本聚类工具:BERTopic

作者: 致Great | 来源:发表于2021-02-21 10:38 被阅读0次

【干货推荐] 基于Bert的聚类工具:BERTopic
【简介】:BERTopic是一种主题建模技术,它利用🤗变换器和c-TF-IDF创建聚类簇,使主题易于理解,同时在主题描述中保留重要的单词。 同时可以支持类似于LDAvis的可视化。
【快速上手】 安装pip install bertopic[visualization]



from bertopic import BERTopic
from sklearn.datasets import fetch_20newsgroups
 
docs = fetch_20newsgroups(subset='all',  remove=('headers', 'footers', 'quotes'))['data']

topic_model = BERTopic()
topics, _ = topic_model.fit_transform(docs)

【官网链接】:GitHub链接为https://github.com/MaartenGr/BERTopic,官方文档https://maartengr.github.io/BERTopic/index.html

相关文章

  • 基于Bert的文本聚类工具:BERTopic

    【干货推荐] 基于Bert的聚类工具:BERTopic【简介】:BERTopic是一种主题建模技术,它利用?变换器...

  • BERTopic

    BERTopic doc2vec (sentence BERT) doc_emb reduce dimension...

  • BERT

    1.BERT介绍 2.基于Bert的多标签文本分类 3.基于Bert的命名实体识别

  • 2018-12-19

    文本聚类算法之K-means算法的python实现 一、文本聚类定义 文本聚类主要是依据著名的聚类假设:同类...

  • 一个内存友好的短文本聚类工具

    介绍 ​ 今日从AINLP的公众号上面看到一个推送,关于短文本聚类的工具,刚好公司项目有用到短文本聚...

  • 基于文本描述的事务聚类

    作者|GUEST编译|VK来源|Analytics Vidhya 介绍 我们生活在数字技术的时代。你上次走进一家没...

  • pyhanlp文本聚类详细介绍

    文本聚类 文本聚类简单点的来说就是将文本视作一个样本,在其上面进行聚类操作。但是与我们机器学习中常用的聚类操作不同...

  • 【R语言 第2篇】K-means聚类分析流程

    聚类算法是没用因变量的。聚类算法有层次聚类、基于划分的聚类、两步聚类法、基于密度的聚类。 聚类方法的逻辑 客户细分...

  • Java核心类库 -- 05 工具类

    工具相关类ScannerObjectsMathRandom 1.Scanner类基于正则表达式的文本扫描器,可以从...

  • 空间聚类算法简述

    空间数据聚类算法主要包括四大类:(1)给予划分的聚类;(2)基于层次的聚类;(3)基于密度的聚类;(4)基于网格的...

网友评论

      本文标题:基于Bert的文本聚类工具:BERTopic

      本文链接:https://www.haomeiwen.com/subject/ssoffltx.html