近年来,大模型(如GPT、文心一言、通义千问等)发展迅猛,引发广泛关注,但同时也带来了数据安全、伦理风险和监管挑战。为规范大模型应用,中国出台相关备案要求,涉及大模型研发或商用的企业或开发者必须完成备案流程。
STEP1:为什么要进行大模型备案?
(1)相关管理规定:根据《生成式人工智能服务管理暂行办法》(2023年8月15日施行)第二条,利用生成式人工智能技术向中华人民共和国境内公众提供生成文本、图片、音频、视频等内容的服务,适用本办法;以及《生成式人工智能服务管理暂行办法》第十七条,提供具有舆论属性或者社会动员能力的生成式人工智能服务的,应当按照国家有关规定开展安全评估,并按照《互联网信息服务算法推荐管理规定》履行算法备案和变更、注销备案手续。
(2)备案的主要目的:一是确保数据安全,防止训练数据泄露、滥用或包含违法内容;二是防范伦理风险,避免生成虚假信息、歧视性内容或危害社会稳定的输出。
STEP2:大模型备案流程
(1)联系属地网信办,了解备案情况,获取到备案表。
(2)企业根据表格及评估要点准备填写材料,包括提供服务过程中收集保存个人信息情况、收集个人信息征得个人同意的方式、受理处理使用者关于查阅、复制、更正、补充、删除个人信息请求的方式、图片视频的标识样式位置频度、接受公众或使用者投诉举报的途径反馈方式、非法内容拦截措施(预置关键词拦截一栏,提供拦截关键词列表)等。
(3)企业内部开展自评估(或找三方评估),编写相关材料,准备测试账号。根据TC260提到的标准,对模型的安全情况进行多方面评估,包括语料内容评估(须附关键词列表)、生成内容评估(须附测试题集)、涉知识产权商业秘密评估、涉民族信仰性别等评估、涉透明性准确性可靠性等评估、模型性能(拒答率)评估等,其中“语料内容评估”和“生成内容评估”重点针对涉意识形态、国家主权、个人隐私、个人肖像权和名誉权等方面的评估。
(4)提交材料,包括《生成式人工智能上线备案申请表》、《安全自评估报告》(需法人、网络安全负责人、法务负责人至少三人签字)、《模型服务协议》、《语料标注规则》、《关键词拦截列表》、《评估测试题集》等。不同地区的备案要求不同,例如北京地区会比其他地区多一个信息采集表,有的地区会要求增加未成年人保护条款、知识产权策略等材料。
(5)材料审核+技术测试。
例如,某公司在进行大模型备案时,严格按照流程进行操作。首先,安排专人与属地网信办沟通,详细了解备案所需的材料和要求。然后,组织内部团队对模型的相关信息进行梳理和整理,包括数据来源、处理方式、安全措施等。同时,邀请专业的安全评估机构对模型进行评估,确保模型符合相关标准和要求。在准备好所有材料后,及时提交给网信办,并积极配合审核和测试工作。最终,该公司顺利完成了大模型备案,为模型的合法应用和发展奠定了基础。
大模型备案对于保障数据安全、防范伦理风险、促进大模型的健康发展具有重要意义。企业或开发者在进行大模型研发或商用时,应严格按照相关规定和流程完成备案工作,以确保自身的合法合规运营。


冀公网安备13010402002588