介绍

ark是一个基于深度学习的恶意语义识别模型，它可以识别常见的网络恶意，包括使用谐音规避检测的恶意语言。

ark致力于维护网络环境，减少恶意评论的传播，减少网络暴力的发生。

ark主要采用注意力机制训练，并使用多特征交叉学习的方式提升模型的理解能力。

安装

要求python3.9及以上

github

git clone https://github.com/aurshine/ark.git
cd ark
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple -r requirements.txt

训练

from ark import train, pre_train

# 训练模型
train()

# 训练预训练模型
# pre_train()

在**./ark/train_module.py**下可配置模型参数和训练参数
在**./ark/data/DATASET/all_data下可添加自己的csv文件格式**训练集，csv头为text label
train函数签名
pre_train函数签名

预测

from ark import ark

print(ark(['原神启动', 
           '小亮来给他整个活', 
           '团长你就是歌姬吧', 
           '你是真没见过黑社会啊?三天之内杀了你'], device='cpu'))

详细

见ark详细设计

Name		Name	Last commit message	Last commit date
Latest commit History 207 Commits
ark		ark
img		img
.gitignore		.gitignore
README.md		README.md
ark.md		ark.md
ark.pdf		ark.pdf
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

介绍

安装

github

训练

预测

详细

About

Uh oh!

Releases

Packages

Uh oh!

Languages

aurshine/ark

Folders and files

Latest commit

History

Repository files navigation

介绍

安装

github

训练

预测

详细

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Languages

Packages