大白菜资讯

当前位置:首页 > 大白菜资讯 > 阿里AI技术升级,轻松识别拦截近30个语种外语脏话图

阿里AI技术升级,轻松识别拦截近30个语种外语脏话图

日期:2021-09-28 | 时间:11:44

早在一年前,阿里巴巴就发现了一些为规避平台审查的“脏话”的做法,一般开始是文字形式的脏话,后面逐渐演变为脏话图片,后面甚至使用多国语言进行伪装。

而这些做法使得阿里巴巴,无法通过现有技术和规则,进行识别和清除,因此阿里安全开始进行多语种识别技术升级。

最近,阿里安全算法团队宣布了一个好消息,表示网络脏话的AI(OCR)技术研发升级,可以识别近30种语言,即使是嵌入图片中的脏话,也可以进行识别。

之所以要进行这这类技术的研发,是因为在部分国际平台中,“买家”在商品评论以及一些交互场景中,使用脏话图片对阵。

而这部分脏话图片中,还包含了多语种垃圾广告以及不良信息,具有较大的威胁。

图片.png

但是,全球有几百种语言,即使是重点的语言也有几十种,所以人工识别风险图片一点也不现实的,所以这项技术的需求就很大了。

在研发的过程中,除了要熟悉各字体的信息之外,还要注意部分脏话图会以置换正常字符顺序的方法,试图瞒天过海。

现在,经过一年多努力研究,阿里安全算法团队总算是得到了一个好结果,可以更加好地拦截危险图片,确保安全。

大白菜超级U盘启动盘制作工具