Skip to content

El-12stu/Keyword-detection-software-based-on-multi-pattern-matching-algorithm

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

8 Commits
 
 
 
 

Repository files navigation

项目简介:

本项目是一个基于多模式匹配算法的关键词检测软件,用于从大规模文本数据中快速识别目标关键字。系统采用高效的多模式文本匹配策略,相比传统单模式匹配方式,能够显著提升在海量数据场景下的处理效率,适用于日志分析、内容审查、敏感词过滤、文本数据预处理等应用领域。

该项目支持自定义关键词、实时检测及结果输出,为需要批量文本匹配和高速关键词检索的场景提供了一种可靠、可扩展的解决方案。

组织架构

42009c0ad17664cfc7e79ba085309103

实现逻辑

AC算法:精准匹配

image-20251211145038606

正则式表达引擎

image-20251211145235028

部署:

一、更换地址:

1.打开ac_lib,regex_lib, 将4个函数(ac-match ac-change regex-match regex-change)的keyword.txt地址路径更换成你们 的主机下的地址路径。

2.打开src目录,将main包含的头文件地址更换成你们主机下的地址路径。(若不加路径只写头文件,将导致编译失败)

二、搭建库、生成可执行文件

打开终端:ctrl+alt+T
输入:
	cd ac-regex(切换至ac-regex目录)
	cd build(切换至构建目录build)
	cmake ..(注意是空格+两个点,建立cmake规则,构建ac_libso,regex_libso)
	make(将源文件与动态库链接,生成可执行文件main_executable)
	./main_executable(执行exe文件)
	
	即可启动该程序                     

About

基于多模式匹配算法的关键词检测工具

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors