小污染造成大损害！警惕AI数据污染引发实际危险 -腾龙公司娱乐

News Center

新闻中心

首页>>新闻中心>>公司动态

公司动态

小污染造成大损害！警惕AI数据污染引发实际危险 

发布时间:2025-08-17 | 浏览次数：19

　腾龙公司跟着AI人工智能技术和运用的蓬勃发展，各类AI东西现已成为咱们日常工作和日子的帮手，不知不觉间，咱们的日子开端

与人工智能密切联系。

　　当AI信息“不靠谱”网民怎么断真假？

　　不过近年来，不少网民发现，部分人工智能的答复开端有些不靠谱。先看两个事例：

　　今年上半年，宁波发生了两件事，被人工智能荒诞地联系在一起。

　　榜首件事是，2月6日宁波警方刊出了“腾龙公司官网宁波交警”抖音号。第二件事是，三个月后的5月2日，在浙江宁波余姚境内

的省道嘉余线上，一辆未悬挂车牌的轿车在违法超车过程中撞倒一辆摩托车。小车驾驶人并未榜首时间检查伤者受伤情况，而是从后备

厢里拿出车牌进行安装。

　　当网民询问AI软件2月6日宁波交警抖音号为何刊出时，人工智能给出的答案竟然是“主要与5月2日的这起交通事故引发广泛关注

有关”的结论。2月份发生的账户刊出的原因竟然是3个月后发生的一起交通事故。人工智能的这一答复引起了网民广泛关注，宁波交警

随后进行了紧迫辟谣。

　　上一年有网民询问一款儿童手表AI软件，“我国人是世界上最聪明的人吗？”人工智能给出的答复竟是否定我国发明创造、否定我

国文化的答案。这一荒诞的答复，在网络上引起轩然大波。儿童手表的厂家随后紧迫道歉，称现已批改了相关数据，删除了不良信息源。

　　近年来，AI臆造的信息更是不计其数，腾龙公司网址臆造不存在的论文以及论文的作者、网址等。AI更是成了谣言类信息的爪牙，

游船侧翻、幼儿园大火等谣言都能够帮网民假造出来。

　　当AI数据被污染有何危险？怎么防范？

　　刚才提到的事例，与人工智能的数据污染有着或多或少的联系。通俗来讲，假如把AI比喻成食物的话，练习数据就相当于食材，食

材腐败变质，终究生产出来的食物就会有问题。

　　人工智能的三大核心要素是算法、算力和数据，腾龙公司客服其间数据是练习AI模型的基础要素，也是AI运用的核心资源。一旦数

据遭到污染，就或许导致模型决议计划失误乃至AI系统失效，存在一定的安全隐患。

　　什么是AI数据污染？分几类？

　　近日，国家安全部分发布提示，通过篡改、虚拟和重复等“数据投毒”行为发生的污染数据，将搅扰模型在练习阶段的参数调整，

降低其准确性，乃至诱发有害输出。

　　那么究竟什么是AI数据污染，数据污染分为哪几类？

　　网络安全专家曹辉：数据投毒主要针对两个方面，一个是针对视觉类，一个是针对自然言语处理类。这张图片是一个斑马辨认人

工智能系统的练习数据。咱们看到，在这张相片上很多斑马进行了标示。怎么进行数据污染？就是在其间的一匹斑马身上加一个绿点。

加了绿点的斑马，特意不进行标示。这样的练习数据大约会有几万张，在这几万张练习数据里边的其间三四张进行相似的污染处理，就

会导致生成的人工智能模型带有后门，就会导致当它再见到相似身体上有绿点的斑马，它就不会以为这是个斑马，就导致了AI模型的判

别遭到搅扰。

　　专家介绍，人工智能数据污染分为两类：

　　一种是人为片面歹意去篡改数据，误导人工智能的输出成果；

　　另一种是人工智能本身会海量的搜集网络的巨大数据，腾龙公司其间不良信息假如没有被鉴别删除去，而是当作能够信赖的信息源

参加算力中，输出的成果相同不行信赖。

　　网络安全专家曹辉：咱们知道大模型练习需求大量的数据，所以，大部分的互联网数据，书、报、电影的对话、台词数据都是练

习数据一般的搜集范围。其实咱们都有或许在互联网上发一些数据，一旦这些数据是不安全的、被污染的，那或许大模型也会随之遭到影响。

　　人工智能数据为何小污染会形成大危害？

　　国家安全部数据显示，AI在练习过程中，即使是0.001%的虚假文本被选用，其有害输出也会相应上升7.2%。为何小小的污染源输出

时的危害会几何级数的上升呢？

　　专家介绍，被污染的数据有着显着地与其他数据不同的观念和内容，这种情况下，AI很或许将污染数据标记为“有特色和高信息量”

，并增加在算力中运用的份额。

　　我国网络空间安全协会人工智能安全管理专业委员会委员薛才智：大言语模型本质上是一种计算言语模型，运用的多层神经网络架构

具有高度的非线性特征。在模型练习阶段，假如练习数据集中混入了污染数据，模型或许误将污染数据判定为“有特色、有代表性、高信

息量”的内容，这种错觉就会使模型提高污染数据全体在数据集当中的重要性，终究导致少量的污染数据也能对模型权重发生微小影响。

而当模型输出内容时，这种微小的影响会在神经网络架构的多层传达中被逐层放大，终究导致输出成果呈现显着偏差。

　　数据污染或许引发一系列实际危险

　　别的，AI数据污染还或许在金融、公共安全等领域引发一系列实际危险。

　　我国网络空间安全协会人工智能安全管理专业委员会委员薛才智：腾龙公司网址比如在经济金融领域，一旦数据遭到污染，一些市场

行为剖析、信用危险评价、异常交易监控等工作就或许呈现判别和决议计划错误，从而形成直接的经济损失。而在社会舆论方面，数据污染

会损坏信息的真实性，让民众难以区分信息的真伪，这就或许会引发社会舆论危险。

　　加强源头监管防范污染生成

　　针对AI数据污染，从国家安全层面，咱们应该怎么防范危险？专家表示，应加强源头监管，防范污染生成。

　　我国网络空间安全协会人工智能安全管理专业委员会委员薛才智：要拟定明确的数据采集规范，运用安全可信的数据源，构建数据标签

系统，选用严厉的拜访控制和审计等安全措施。

　　其次，能够运用自动化东西、人工检查以及AI算法相结合的方式，对数据不一致性、格局错误、语法语义冲突等问题进行剖析和处理。

　　安全机关此前针对AI数据污染也提示，要定时根据法规规范清洗修复受污数据，逐步构建模块化、可监测、可扩展的数据管理框架，

完成持续管理与质量把控。

　　对于广大网友而言，咱们在日常日子和工作中，又应该怎么防范AI数据污染的危险呢？

　　网警提醒：

　　一是运用正规渠道和企业供给的AI东西；

　　二是科学合理地运用AI东西，AI发生的成果能够参阅，但不能盲信；

　　三是注意保护个人信息，避免不必要的个人隐私暴露，一起不作不良信息的投喂者，共同看护网络家园。