美文网首页
AC自动机_多组字符串匹配

AC自动机_多组字符串匹配

作者: Gitfan | 来源:发表于2017-03-05 18:25 被阅读0次

病毒侵袭

#include<cstdio>
#include<cstring>
#include<queue>
#include<algorithm>
using namespace std;
const int MAXN=4000010;
int arr[5];
struct Node
{
    int id;
    int curr;
    Node *fail;
    Node *next[128];
    void init()
    {
        id=0;
        curr=0;
        fail=NULL;
        memset(next,NULL,sizeof(next));
    }
};
Node *root;
void insert(char *str,int id)
{
    Node *p=root;
    int len=strlen(str);
    for(int i=0;i<len;i++)
    {
        int pos=str[i];
        if(p->next[pos]==NULL)
        {
            p->next[pos]=new Node();
            p->next[pos]->init();
            p=p->next[pos];
        }
        else p=p->next[pos];
    }
    p->id=id;
}
void getFail()
{
    Node *temp,*son,*p=root;
    queue<Node *> que;
    que.push(p);
    while(!que.empty())
    {
        Node *curr=que.front();
        que.pop();
        for(int i=0;i<128;i++)
        {
            son=curr->next[i];
            if(son!=NULL)
            {
                if(curr==root) son->fail=root;
                else
                {
                    temp=curr->fail;
                    while(temp!=NULL)
                    {
                        if(temp->next[i]!=NULL)
                        {
                            son->fail=temp->next[i];
                            break;
                        }
                        temp=temp->fail;
                    }
                    if(temp==NULL) son->fail=root;
                }
                que.push(son);
            }
        }
    }
}
bool query(char *str,int curr)
{
    int len=strlen(str);
    Node *temp,*p=root;
    bool flag=false;
    int index=0;
    for(int i=0;i<len;i++)
    {
        int pos=str[i];
        while(p->next[pos]==NULL&&p!=root) p=p->fail;
        p=p->next[pos];
        if(p==NULL) p=root;
        temp=p;
        while(temp!=root)
        {
            if(temp->id>0&&temp->curr!=curr)
            {
                flag=true;
                temp->curr=curr;
                arr[index++]=temp->id;
                if(index>=3) break;
            }
            else break;
            temp=temp->fail;
        }
        if(index>=3) break;
    }
    if(flag)
    {
            sort(arr,arr+index);
            printf("web %d:",curr);
            for(int j=0;j<index;j++)
                printf(" %d",arr[j]);
            printf("\n");
            return true;
    }
    return false;
}
int main()
{
    char virus[205];
    char web[10010];
    root=new Node();
    root->init();
    int n,m,total=0;
    scanf("%d",&n);
    for(int i=0;i<n;i++)
    {
        scanf("%s",virus);
        insert(virus,i+1);
    }
    getFail();
    scanf("%d",&m);
    for(int i=0;i<m;i++)
    {
        scanf("%s",web);
        if(query(web,i+1))
        {
            total++;
        }
    }
    printf("total: %d\n",total);
    return 0;
}

相关文章

  • AC自动机_多组字符串匹配

    病毒侵袭

  • AC自动机实现屏蔽单词

    多模式自动匹配AC自动机 KMP是多模式匹配算法, 解决的是一个字符串匹配多个模式串的问题, 该字符串往往短于或者...

  • AC 自动机

    AC自动机 AC自动机是一个经典的多模式串匹配算法,它可以实现对主串的一次扫描来匹配多个模式串的功能。实现AC自动...

  • AC自动机 图文介绍

    预备知识 Trie(字典树)KMP字符串匹配算法 AC自动机求解问题的类型 一句话概括就是:多模匹配。KMP求解的...

  • AC自动机 专题整理

    AC自动机学习记录 参考资料 字典树(讲解+模版)AC自动机算法AC自动机算法详解hdu 2222 ac自动机入门...

  • AC自动机

    参考资料:AC自动机GIF动图(来自油管) 以下文章节选自:王争老师 AC自动机:如何用多模式串匹配实现敏感词过滤...

  • AC自动机 - 过滤敏感词

    今天我们学习一种多模式匹配算法:AC自动机。(这个名字可能不太严谨,自动机知识这个算法的一个部分)多模式匹配算法:...

  • AC自动机_模板

    AC自动机: 求多个字符串是否在主串中出现过。可依据情况分别求出出现次数,出现位置等。 AC自动机入门Keywor...

  • AC自动机

    AC自动机(Aho-Corasick\ automaton),可以解决多模板串匹配的问题。可以理解为可以一次性匹配...

  • 随笔|AI设计之状态机

    有限状态机 最近尝试写ai,又看了下状态机,其实之前就用过ac自动机,不过是用来处理字符串,实际上ac自动机也是一...

网友评论

      本文标题:AC自动机_多组字符串匹配

      本文链接:https://www.haomeiwen.com/subject/bveegttx.html