当前位置：首页 > 大白菜资讯 > 阿里AI技术升级，轻松识别拦截近30个语种外语脏话图

阿里AI技术升级，轻松识别拦截近30个语种外语脏话图

日期：2021-09-28 | 时间：11:44

早在一年前，阿里巴巴就发现了一些为规避平台审查的“脏话”的做法，一般开始是文字形式的脏话，后面逐渐演变为脏话图片，后面甚至使用多国语言进行伪装。

而这些做法使得阿里巴巴，无法通过现有技术和规则，进行识别和清除，因此阿里安全开始进行多语种识别技术升级。

最近，阿里安全算法团队宣布了一个好消息，表示网络脏话的AI(OCR)技术研发升级，可以识别近30种语言，即使是嵌入图片中的脏话，也可以进行识别。

之所以要进行这这类技术的研发，是因为在部分国际平台中，“买家”在商品评论以及一些交互场景中，使用脏话图片对阵。

而这部分脏话图片中，还包含了多语种垃圾广告以及不良信息，具有较大的威胁。

图片.png

但是，全球有几百种语言，即使是重点的语言也有几十种，所以人工识别风险图片一点也不现实的，所以这项技术的需求就很大了。

在研发的过程中，除了要熟悉各字体的信息之外，还要注意部分脏话图会以置换正常字符顺序的方法，试图瞒天过海。

现在，经过一年多努力研究，阿里安全算法团队总算是得到了一个好结果，可以更加好地拦截危险图片，确保安全。

大白菜资讯