方法分类:
-
抽取式(传统基于统计学的)
相关算法:Text rank排序算法、BM25算法、TFIDF -
生成式(Automatic Summarization)
- seq2seq+attention
- sequence2sequence
- 2016year,cnn FAIR encoder &rnn decoder [FAIR ,Facebook AI Research]
- 2017/5 FAIR CNN encoder&decoder , multi-step Attention ,同时引入残差网络
- 2017/6 Google self-Attention & encoder-decoder attention《Attention is All you Need》
- Pointer Network
- seq2seq+attention
评价方法:
- Edmundson
说明:标准摘要必须完全从文章中整句摘出,不允许概括抽象,评分以匹配数占比作为评分 - ROUGE
说明:基于摘要中n元词的共现信息来评价摘要,面向n元词召回率的评价方法 - Rouge-L
L即最长公共子序列的首字母
已开源工具
- 暂无基于seq2seq的开源摘要工具











网友评论