谁要做大模型备案?
按照《生成式人工智能服务管理暂行办法》第十七条要求,面向境内提供服务的具有舆论属性或者社会动员能力的生成式人工智能服务开发者,均需要做大模型备案。
而现状是目前算法备案已通过940个(截止第五批次),而大模型备案仅通过150余个,且绝大部分为头部大厂。结合实际备案现状,建议以下企业优先做大模型备案:
1、网信办通知做大模型备案/安全评估的企业;
2、规模达到一定量级的企业;
3、有实力或有意愿做大模型备案的企业。
已经做了算法备案了,还需要再做大模型备案吗?
属于生成式人工智能服务开发者,还需要再做大模型备案。可以参考上方的建议的优先顺序进行备案。算法备案在项目初期即可申请,大模型备案需要在产品开发完成且已完成内测的基础上再进行申请。
所需材料
1、《大模型上线备案申请表》☆;
2、《附件1:安全自评估报告》☆;
3、《附件2:模型服务协议》;
4、《附件3:语料标注规则》;
5、《附件4:关键词拦截列表》;
6、《附件5:评估测试题集》☆ ;
7、 其他所需材料等。
注意1:
如果是多模态产品,需按照模态分别提交《附件5:评估测试题集》
多模态产品:是指能够接收和处理多种形式信息(如文本、图像、音频等)的人工智能产品,它们能够理解和生成包括文字、图片、音频、视频等在内的多种模态内容。
注意2:
《生成式人工智能服务安全基本要求》提示了语料和生成内容的五大主要安全风险,可供参考。
上述材料中我们将《安全自评估报告》和《附件5:评估测试题集》打上了☆号,意味着难度较大,我们分别给大家做个解析。
安全自评估
有实力的可以自行组织安全评估,也可以委托第三方专业机构进行评估。主要针对于语料、生成内容、问题拒答等三块评估,细项要求如下:
评估测试题集
1、关键词
关键词库应全面且有代表性,规模≥10000个,对于以下两块的要求:
A1 包含违反社会主义核心价值观的内容:覆盖该模块8种风险,关键词≥200个;
A2 包含歧视性内容:覆盖该模块9种风险,关键词≥100个。
2、生成内容测试题库
总规模≥2000题,覆盖语料和生成内容的五大模块31条风险,AI、A2类均应≥50题,其他类应≥20题,每月及时更新。
3、拒答测试题库
模型应拒答题库:规模≥500题,风险覆盖AI、A2,每种≥20题;
模型非拒答题库:应覆盖我国制度、信仰、形象、文化、习俗、民族、地理、历史、英烈等方面,以及性别、年龄、职业、健康等方面,每类≥20题,专用模型需体现不涉及的部分。
备案流程
大模型备案由网信部门通知或者企业自主发起,向所在地省/直辖市/自治区网信部门申请,核准后获取材料进行准备,流程均在线下进行,完整流程参考下图。