基于聚类算法的算法裁判的研究

您所在的位置：网站首页 › 常见分类算法的是 › 基于聚类算法的算法裁判的研究

基于聚类算法的算法裁判的研究

2023-03-28 06:10| 来源: 网络整理| 查看: 265

TECHNOLOGY AND INFORMATION

IT技术论坛

科学与信息化2020年11月中

基于聚类算法的算法裁判的研究

王宝莹

李泊宁

徐天柱

刘亚平

1. 承德医学院

河北

承德

067000；

2. 承德银行

河北

承德

067000

摘

要

目的：利用下深度学习算法实现智能裁判，提高判案效率和准确率。方法：采用聚类算法中k-means算法

对案件进行分类，更好地实现算法裁判。结果：该聚类算法可以对案件进行分类，但对于没有给定分类的数据集需

要多次实验选定适当k值。结论：初始中心选不同位置会导致最终分类结果不同，对于多分类可能出现局部最优情

况，为了解决这种情况还可以优化k-means算法。

关键词

聚类；k-means；算法裁判；数据集

引言

为了实现人工智能，深度学习被引入到机器学习这个领域

中。深度学习在很多方面都有飞速的发展，例如数据挖掘，搜

索引擎，机器学习和个性化推荐技术等。具体到审判上，算法是

本质，对未来司法活动可以带来巨大的甚至可以说是革命性的影

响就是算法。算法裁判虽然目前在司法实践中的运用还是在起步

阶段，但它所具有的优势着实是显而易见。由于人的决策容易收

到固有偏见的影响，相对而言，算法决策就会更加公平客观。由

于算法是以大量数据为基础，因此在裁判中的运用，可以节省

司法资源，提高司法效率

[1]

。本文主要探讨的是对于大量案件

的分类方法，本文采用聚类分析中的

k-means

算法。

聚类算法

①常见聚类算法简介。聚类算法也称聚类分析是数据挖掘

中的一种重要算法，常见的聚类算法有

k-means

、

k-medoids

、

clara

和

clarans

等。这四类算法的特点如下，

k-means

算法对于

非法数据格式较为敏感，产生类的大小相差不会很大

[2]

。而

k-medoids

方法可以解决数据敏感问题，但

k-medoids

方法也存在

缺陷，该种算法只适合小数据，对于大量数据其计算量要大得

多，因此也不适合本文中对于大量案件的分类。而

clara

算法能够

处理大量的数据，因为

clara

算法是一种基于采样的方法。但同样

clara

算法也存在缺陷，采样的大小决定了

clara

算法的效率高低，

clara

算法采样都是不变的，最佳的结果很难得到。而

clarans

的算

法在每一次循环的过程中所采用的采样都是不一样的，但也存

在缺点就是循环次数必须认为定义

[3]

。所以最终经考虑本文采

用

k-means

算法。②

k-means

算法介绍。

k-means

算法是无监督的

聚类算法，它实现起来比较简单，聚类效果也不错，因此应用

很广泛

[4]

。可以输入一个变量

将大量数据对象进行数据对象划

分，划分为输入值

类。这

个对象作为初始聚类中心，其余对

象则是需要计算这些对象与聚类中心的距离，计算出距离后要

将对象分配给与其距离最近的聚类。然后继续计算每个所获得

的新聚类的中心，不断重复这一过程直到均值不在变化，或者

说直到标准测度函数开始收敛为止。一般情况下都采用均方差

作为标准测度函数

[5]

。

k-means算法在算法裁判中的应用展望

我国目前正在大力发展和建设智慧法院，这也是算法裁判

在司法实践中的具体体现。为实现法院审判体系和审判能力智

能化，需要研制庭审数据格式统一规范，庭审数据深度分析等

规范，利用本文中聚类算法中的

k-means

算法可以对多元化数据

进行数据挖掘和分析，进而提升庭审效率

[6]

。我们对案件随机

选取部分，选取其中

个点为聚类中心，计算每个点到

个聚类

中心的聚类，然后将该点分到最近的聚类中心，这样就形成了

个簇。再重新计算每个簇的质心，重复做直到质心的位置不

再发生变化

[7]

。这样就可以顺利将案件进行分类了。那么在深

度学习的过程中，对待不同类型的案件可以统计规范，实现智

能化审判

[8]

。当然，目前我国的算法裁判还是初步阶段，虽然

有了一定的算法裁判应用，但依然存在一定争议，后续我们可

以改进聚类算法，对于案件分类更加准确，也可以一定程度上

减少算法裁判的争议

[9]

。把案件用表达式表示，假设簇划分为

,...C

)

，最小化平方误差

：

（

）

其中

是质心，表达式如下

[10]

：

（

）

结束语

算法已初步实现，数据集采用于北大法律信息网经典案

例。该聚类算法可以对案件进行分类，但对于没有给定分类的

数据集需要多次实验选定适当

值。初始中心选不同位置会导致

最终分类结果不同，对于多分类可能出现局部最优情况，为了

解决这种情况还可以优化

k-means

算法。

参考文献

[1]

高学强

人工智能时代的算法裁判及其规制

[J].

陕西师范大学学

报

哲学社会科学版

,2019(3):161-168.

[2]

陈姿含

人工智能算法中的法律主体性危机

[J].

法律科学

西北政

法大学学报

,2019(4):40-47.

[3]

苏令银

透视人工智能背后的“算法歧视”

[N].

中国社会科学报

2017-10-10.

[4]

张富利

郑海山

大数据时代人工智能辅助量刑问题研究

[J].

昆明

理工大学学报

社会科学版

,2018(6):1-10.

[5]

辛春花

郭艳光

鲁晓波

大型数据库中利用强化学习改进

Treap

的

关联规则挖掘算法

[J].

计算机应用研究

,2020,38(1):1-6.

[6]

何占军

邓敏

蔡建南

等

顾及背景知识的多事件序列关联规则挖

掘方法

[J].

武汉大学学报

(

信息科学版

),2018,43(5):766-772.

[7] Huang Yu, Li Tang, Luo Cheng, et al. Matrix-based dynamic

updating rough fuzzy approximations for data mining [J]. Knowledge-

Based Systems, 2017, 119 (6):273-283.

[8] HANM J W, KAMBER M, PEI J.

范明

孟小峰译

数据挖掘概念与

技术

[M].

北京

机械工业出版社

,2012:35-37.

[9]

高一飞

高建

智慧法院的审判管理改革

[J].

法律适用

,2018(1):58-64.

[10]

潘玮

牟冬梅

李茵

等

关键词共现方法识别领域研究热点过程

中的数据清洗方法

[J].

图书情报工作

,2017(7):111-117.

作者简介

王宝莹（

1980

－），女，河北承德人；学历：硕士研究生，职

称：讲师；现就职单位：承德医学院，研究方向：网格计算。

课题项目

]

课题名称：智慧法院背景下算法裁判的法理基础与现实路径；课题来源：承德市社科联；课题编号：

20203102

。

【本文地址】

基于聚类算法的算法裁判的研究

基于聚类算法的算法裁判的研究

今日新闻

推荐新闻