Bali_foSn 发表于 2024-1-2 08:12:12

易语言文章查重系统源码

新版本1.04更新内容:
1.新增历史记录。
2.取消偏移相似度,取消查重单元,取消多线程,改用Redis数据库。
提速十倍+,查重一篇千字文章,200ms内出结果,如果想要更快,用redis连接池试试。

大家2024新年好!
花了一点时间,选了一篇精华帖进行更新,感谢大家曾经给我投的票!

老规矩,全部开源,全部必备文件打包放在云盘,文件126MB,在最后面。
下文附上使用教程、使用说明、注意事项。

【README!! 注意事项】
如果你运行不了已编译的exe文件,或者打不开源代码,
可能是支持库没装,可能包含EXUI支持库、njRedis支持库、正则表达式支持库
请尝试以下操作:

请注意,必备的文件都存储在【必备支持库及安装包】文件夹里面
1.在该目录下,找到所有的*.fne文件,复制到你的易语言支持库路径下:
举例:D:\Program Files (x86)\易语言5.92\lib

2.在该目录下,找到ExuiKrnln文件夹,复制到你的易语言支持库路径下:
举例:D:\Program Files (x86)\易语言5.92\lib

3.在该目录下,找到所有的*.lib文件,复制到你的易语言支持库路径下:
举例:D:\Program Files (x86)\易语言5.92\static_lib

4.在该目录下,找到Redis-x64-3.0.504.msi文件,双击安装Redis服务(一直下一步即可)。
仅支持64位机,或前往官方github下载:https://github.com/MicrosoftArchive/redis/releases


使用例程:
1.解压压缩包
解压完直接打开源代码【文章查重1.04Redis.e】,或已编译的二进制文件【文章查重1.04.exe】,如果你打不开,看看帖子上面的【使用说明】


2.(可选)安装字体
字体文件放在【字体】文件夹里面,名称:AlibabaPuHuiTi-2-55-Regular.ttf
推荐,因为软件默认字体就是这个


3.导入你的数据集
为了让大家体验该软件查重的功能,压缩包已经附带了数据集。
存于【文章内容】里面,也是默认的扫描路径。
如果你想导入自己的数据集,每个样本对应一个txt文件,请用GBK编码。或自己改一下代码。

如图所示,打开软件直接点扫描,扫描默认目录,点确认即可。

【其他说明】
一、编译后必备文件
ExuiKrnln.dll(EXUI)
EinstoAPI.dll(C++编写的HASH-API)
sqlite3.dll(SQLITE3)
.\分词数据库\data.db(分词数据库)
.\分词数据库\Vocabulary.ini(分词数据库其他配置)
.\分词数据库\idf.txt(词权重)
.\分词数据库\stopwords.db(停用词)



二、C++ api 源代码
存于dll-source-code.cpp中

三、使用教程

简单的使用例程





**** Hidden Message *****

文杰 发表于 2024-1-2 14:45:39

感谢这个i资源

hgfhf 发表于 2024-1-2 21:19:06

来瞧瞧的,呵呵

付出又有回报 发表于 2024-1-3 03:52:33

谢谢分享!~

中国好叔叔 发表于 2024-1-3 10:26:01

谢谢楼主的辛苦分享

pei002 发表于 2024-1-3 16:59:28

感谢您的无私精神...

lllll557 发表于 2024-1-4 06:02:14

还不错觅风论坛欢迎你

斯蒂芬 发表于 2024-1-4 19:05:00

这个好好支持一下

赵金龙 发表于 2024-1-5 08:07:46

不错哦喜欢 嘿嘿

hui861140 发表于 2024-1-5 21:10:32

很不错的哦,支持,加油
页: [1] 2 3 4 5 6
查看完整版本: 易语言文章查重系统源码