美文网首页
结巴分词例子

结巴分词例子

作者: 㗊𨰻木㵘燚㙓㗊 | 来源:发表于2018-09-27 12:40 被阅读0次

import jieba

结巴分词

sent = '当地时间9月26日,针对美方在联合国安理会声称中国正在干预美国的选举,国务委员兼外长王毅当场表示,中国历来坚持不干涉内政原则,这是中国的外交传统,也得到国际社会的普遍赞誉。'

全模式

wordlist = jieba.cut(sent,cut_all=True)
print(" | ".join(wordlist))

运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | | | 针对 | 美方 | 在 | 联合 | 联合国 | 联合国安理会 | 国安 | 安理会 | 理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | | | 国务 | 国务委员 | 委员 | 兼 | 外长 | 王 | 毅 | 当场 | 表示 | | | 中国 | 国历 | 历来 | 坚持 | 不 | 干涉 | 干涉内政 | 内政 | 原则 | | | 这 | 是 | 中国 | 的 | 外交 | 传统 | | | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | |

精确模式

wordlist = jieba.cut(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。

搜索模式

wordlist = jieba.cut_for_search(sent)
print(" | ".join(wordlist))
运行结果:
当地 | 时间 | 9 | 月 | 26 | 日 | , | 针对 | 美方 | 在 | 联合 | 国安 | 理会 | 联合国 | 安理会 | 联合国安理会 | 声称 | 中国 | 正在 | 干预 | 美国 | 的 | 选举 | , | 国务 | 委员 | 国务委员 | 兼 | 外长 | 王毅 | 当场 | 表示 | , | 中国 | 历来 | 坚持 | 不 | 干涉 | 内政 | 干涉内政 | 原则 | , | 这是 | 中国 | 的 | 外交 | 传统 | , | 也 | 得到 | 国际 | 社会 | 的 | 普遍 | 赞誉 | 。

相关文章

  • 结巴分词例子

    import jieba 结巴分词 sent = '当地时间9月26日,针对美方在联合国安理会声称中国正在干预美...

  • 自然语言处理(NLP)相关

    ヾ(◍°∇°◍)ノ゙-参考 结巴分词使用 中文分词之结巴分词~~~附使用场景+demo(net) jieba分词、...

  • 结巴分词

    1. python环境下下载jieba分词 参考网址:https://blog.csdn.net/robin_xu...

  • 结巴分词

  • 使用有向无环图实现分词

    结巴分词 如果搜索”Python 分词”,跳出来的前五个除了广告基本都包括“结巴分词”(Jieba)。可以说它是P...

  • 常用Python中文分词工具

    1. jieba 分词 “结巴” 分词,GitHub 最受欢迎的分词工具,立志做最好的 Python 中文分词组件...

  • 结巴中文分词的用法

    jieba “结巴”中文分词:做最好的 Python 中文分词组件"Jieba" (Chinese for "to...

  • python 结巴分词

    jieba “结巴”中文分词:做最好的 Python 中文分词组件“Jieba” (Chinese for “to...

  • Python 结巴分词

    jieba “结巴”中文分词:做最好的 Python 中文分词组件 “Jieba” (Chinese for “t...

  • jieba

    Project description jieba “结巴”中文分词:做最好的 Python 中文分词组件 “Ji...

网友评论

      本文标题:结巴分词例子

      本文链接:https://www.haomeiwen.com/subject/xsleoftx.html