在科技演进的长河中,总有一些里程碑式的节点,不仅重新定义了技术的疆界,更深刻地重塑了人类与世界互动的范式,并对现有的社会结构、伦理规范及法律体系带来了深远的机遇与挑战。2022年,以ChatGPT为代表的大型语言模型横空出世,其所展现出的颠覆性交互与内容生成能力,犹如平地惊雷,宣告了生成式人工智能时代的到来。这场由生成式人工智能驱动的技术浪潮,迅速从实验室走向公众,在全球范围内点燃了对人工智能及其未来的无尽想象与热烈讨论,清晰预示着一场堪比工业革命与信息革命的深刻变革正在加速降临。生成式人工智能,正以其前所未有的力量,叩响着一个全新时代的大门。
正当ChatGPT引发的技术浪潮席卷全球、其深远影响尚在持续发酵之际,人工智能技术演进的历史脚步却从未有片刻停歇,生成式人工智能领域不断涌现出具有理论突破性与实践创新性的新兴力量。我国的人工智能初创企业深度求索(DeepSeek)的技术突破具有重要战略意义。其相继推出的DeepSeek-R1和DeepSeek V3模型,成功在降低算力依赖的同时保持了卓越性能,实现了效能与成本的优化平衡。其在代码生成、深度推理、乃至模型开源策略等方面所展现的特色与突破,进一步印证了生成式人工智能技术的蓬勃生命力与无限可能,为全球生成式人工智能的技术发展注入了东方智慧,彰显了技术创新道路的多样性与包容性。
如果说ChatGPT的出现点燃了生成式人工智能的引线,掀起了第一波全球性的关注与应用探索热潮,那么DeepSeek等后续优秀模型的涌现,便象征着这场技术革命正加速向纵深发展。这些新一代模型不再局限于追求无所不能的通用性,而是日益聚焦于特定应用场景进行深度优化,致力于实现更高的运行效率、更优的成本效益、更精深的专业能力以及更灵活的部署选项。这种向纵深发展的趋势,一方面显著拓宽了生成式人工智能技术的应用版图,使其影响力迅速超越最初的猎奇体验和内容辅助创作阶段,加速渗透至软件开发、科学研究、金融分析、教育医疗等关系国计民生的核心生产力领域;另一方面也驱动着围绕生成式人工智能的产业生态系统日趋复杂和繁荣。参与主体不再局限于少数科技巨头,更多元化的创新力量,包括活跃的开源社区以及不同规模和背景的科技企业,都在积极投身其中,共同塑造着这一新兴领域的发展格局与未来走向。
技术演进的加速与应用场景的深化,如同硬币的两面,在释放技术前所未有的创新潜能之时,也折射出复杂的法律风险与伦理挑战,将合规问题推至人工智能治理的前沿领域。当以DeepSeek为代表的生成式人工智能模型以超越传统认知的效率生成代码、构建文本、创作艺术作品时,一系列具有挑战性的法律问题随之浮现:首先,是数据获取合法性边界与知识产权法律框架的调适问题。生成式人工智能的核心能力植根于对海量数据的深度学习与特征提取,这些训练数据不可避免地涵盖了受著作权法保护的作品、个人信息保护法规制的事关个体隐私的数据乃至商业秘密视域下的专有知识。模型训练过程是否构成对原作品的合理使用仍然存在争议;模型生成内容的权利归属如何在人类创作者、模型开发者与最终用户之间进行合理配置,尚缺乏系统性的规范依据;当模型输出与既有作品呈现高度相似性时,侵权认定的构成要件与责任阈值如何科学设定,亟待规范性重构。其次,是内容生成与责任体系的模糊地带。人工智能生成内容可能包含事实偏差、认知偏见、侵犯人格权的表述,甚至被恶意引导用于网络攻击、诈骗等违法活动。当算法逻辑取代部分人类判断,成为信息生产的关键源头,内容的真实性、准确性与合法性责任如何在多层次且复杂的产业链条中进行合理分配?传统的法律责任体系如何适应这一技术变革?责任主体的认定与归责原则的构建,均需要法律理论的创新突破与实务经验的系统总结。最后,是企业技术创新与法律合规的辩证关系。生成式人工智能的发展速度远超传统法律的演进周期,催生治理滞后与技术失控的潜在风险。生成式人工智能的竞争本质上是技术创新、产品应用、人才储备与制度建设的系统性竞争。我国科技企业的合规能力不仅关乎产品开发的源头治理效能,更为负责任的人工智能创新提供了落地机制。生成式人工智能的出现,使得企业合规管理呈现出前所未有的复杂性与重要性,也内含对科技企业的法律合规体系具备更高的适应性、前瞻性与实践操作性的系统要求。
在生成式人工智能时代,上述治理挑战的有效解决,将成为决定生成式人工智能健康发展的关键变量。正是在这样波澜壮阔而又颇具挑战的时代背景下,在以DeepSeek为代表的生成式人工智能技术持续深化、应用场景日益广泛而法律合规挑战日益凸显的关键节点上,本书应运而生。本书的撰写,旨在回应当前社会各界对于理解和应对生成式人工智能法律风险的迫切需求,为在汹涌浪潮中航行的科技企业、产品开发者、法律从业者以及研究人员提供一个清晰、系统、实用的合规框架。
本书的贡献,不仅在于对生成式人工智能法律议题的系统性梳理与理论化解读,亦在于其对法律规范体系与技术发展动态互动关系的深度剖析。本书以生成式人工智能全生命周期为视角,涵盖了从产品准备阶段到训练过程阶段,以及内容输出阶段的各个关键合规节点。此外,本书就生成式人工智能的基准和评估,以及生成式人工智能部署环节的合规以及域外合规动态也进行了系统梳理,力求做到理论与实务的紧密结合。我们深知,面对日新月异的技术和尚在形成中的法律规则,空泛的理论探讨难以满足合规实践的迫切需求。因此,本书在阐释基本合规原理的同时,还侧重于提炼合规要点,探讨风险评估与合规管理策略,并尝试提出具有可操作性的解决方案。我们希望通过理论深度与实务精度的双重打磨,为读者构建一个既能理解为什么,又能知道怎么办的知识体系。
在形成本书的编撰构想后,我们深感荣幸能够与中国法治出版社建立出版合作关系,由此得以邀请来自法律实务领域的一线资深专家共同探索生成式人工智能合规治理的理论基础与实践路径。本书编者群体长期耕耘于人工智能产业界与法律实务领域的前沿地带,既深度参与人工智能企业内部合规体系的构建与实施,又持续关注人工智能法律政策研究的前沿动态,具备理论研究与实践经验的双重背景。我们期冀本书能够为人工智能领域的理论研究者与法律实务工作者提供一个理解生成式人工智能产业发展与合规治理的系统性知识框架,为其把握技术演进趋势与规范生态演化提供多维度的分析视角与合规指引。在此,谨向参与本书编写的世辉律师事务所王新锐律师团队的冯博林、李慧、梁钊、罗雨、臧翌晗、朱赞、刘洋、夏文燕、鄢布凡、余扬横波、刘雨薇、陈思行、刘冉、杨葳葳、王靓迪、杨芷瑶、陈缘、张旖琳、江婷婷律师,金杜律师事务所吴涵律师团队的张浣然、刘畅、罗嗣昊、高彤悦、陈琳珺、吴舸、吴仁浩、王储、董方倩、刘阳律师以及某互联网公司法律研究中心陈晨老师团队的李轶夫、董昱诚表谢意。值得特别致谢的是,植德律师事务所合伙人时萧楠律师基于其丰富的在日法律实务经验,为本书提供了关于日本人工智能规制体系的第一手资料与合规要点分析。上海君伦律师事务所高级合伙人、副主任金昌华律师就韩国人工智能立法的最新发展态势提供了详实的制度梳理,虽因篇幅所限未能全部收录于本书定稿,但其学术贡献仍值得特别感谢。与此同时,我们向中国法治出版社的程思老师、于昆老师致以诚挚谢意。本书的筹备、编辑与出版凝聚了他们的心血和智慧。他们的专业和严谨为本书的顺利出版提供了坚实保障。
面对生成式人工智能合规这一崭新课题,我们期望本书能提供一个可靠的思考支点,引发更多有价值的讨论与实践。对于科技企业而言,它可以作为构建内部合规体系、评估产品风险、制定发展战略的一个基础参考;对于法律专业人士而言,它可以提供理解新兴技术法律问题的系统框架和实务工具;对于技术开发者而言,它可以帮助其在创新过程中更好地融入法律与伦理考量,实现负责任的创新;对于政策制定者和研究者而言,它可以为完善相关法律法规、推动人工智能治理提供一些有益的借鉴。
科技向善,法治护航。愿本书能襄助各位读者朋友在这场颠覆性的技术变革中找到合规的航标,行稳致远。
张 欣
2025年8月于惠园
张欣,对外经济贸易大学法学院教授、博士生导师、党委委员,对外经济贸易大学数字经济与法律创新研究中心主任。国家万人计划青年拔尖人才、北京市社科基金青年学术带头人、首都巾帼科技领航导师。主要研究人工智能治理和平台治理,兼任全国平台经济治理标准化技术委员会副秘书长,世界互联网大会特聘专家,中国法学会网络与信息法学研究会理事、宣传委员,中国法学会立法学研究会理事,中国法学会法理学研究会理事。
陈晨,知名互联网公司法律研究中心主任,中国法学会网络与信息法学研究会常务理事,中国广告协会法律与道德委员会副主任,中国药品监督管理研究会药品流通监管研究专业委员会委员,对外经济贸易大学法学院、中国政法大学法律学院校外导师,致力于人工智能、互联网医药平台、互联网广告合规等相关产业的法律政策研究工作。
王新锐,毕业于清华大学法学院,北京世辉律师事务所管理合伙人、合规业务负责人,执业领域主要为数据合规及人工智能,兼任B20、ICC等国际组织合规工作组中方专家及北京市律师协会数字经济与人工智能领域法律专业委员会副主任,持续获得钱伯斯、《亚洲法律杂志》(ALB)、《法律500强》(The Legal 500)、《商法》等多个国内外法律评级机构推荐,专业观点经常被新华社、人民网等主流媒体及政府网站引用。
吴涵,毕业于武汉大学和北京大学,北京市金杜律师事务所合规业务部合伙人,执业领域主要为网络安全、数据合规及人工智能治理,兼任互联网协会互联网法治工作委员会副秘书长等,荣获《亚洲法律杂志》(ALB)中国十五佳网络安全和数据保护律师及十五佳TMT律师,以及钱伯斯《大中华区法律指南》、《法律500强》(The Legal 500)领先律师明日之星等称号。
第一编 生成式人工智能的技术机理与产业发展
第一章生成式人工智能的前世今生 / 003
一、生成式人工智能与人工智能生成内容的定义 / 003
二、生成式人工智能的发展历程 / 005
(一)前深度学习时代(20世纪50年代20世纪80年代) / 006
(二)深度学习时代(20世纪80年代至今) / 006
三、生成式人工智能的技术原理 / 008
(一)芯片层 / 009
(二)深度学习框架层 / 010
(三)模型层 / 011
(四)应用层 / 012
四、生成式大模型的技术特点 / 014
(一)生成式大模型以海量数据为学习基础 / 014
(二)生成式大模型以深度神经网络为学习架构 / 016
(三)人类可以对大模型进行一定程度的干预 / 017
(四)生成式大模型是基于概率预测生成内容 / 018
五、生成式人工智能的应用 / 019
(一)从一个例子看人工智能在应用中发挥的重要作用 / 019
(二)从应用场景看人工智能原生应用 / 021
(三)从投融资角度看人工智能原生应用 / 023
六、AIGC产业发展情况和展望 / 024
(一)MaaS打造AIGC新业态 / 026
(二)AIGC应用从to-B和to-C两端构建生态 / 027
(三)聊天机器人应用场景多样化 / 027
(四)多模态、跨模态 / 028
(五)AI Agent(智能体)将获得更广阔的角色价值与发展空间 / 028
第二章生成式人工智能的风险 / 029
一、硬件层:人工智能芯片短缺风险 / 029
二、数据层 / 031
(一)数据质量风险 / 032
(二)数据安全风险 / 035
(三)使用版权数据做预训练的侵权风险 / 037
(四)数据爬取导致的不正当竞争风险 / 040
(五)数据孤岛与数据交易不足风险 / 041
三、算法层 / 043
(一)算法安全风险 / 048
(二)算法公平风险 / 050
(三)算法透明度风险 / 052
(四)算法归责风险 / 054
四、应用层 / 055
(一)内容安全风险 / 055
(二)著作权法律风险 / 058
(三)新型不正当竞争和垄断风险 / 061
(四)侵犯人格权、肖像权等风险 / 063
(五)伦理风险 / 065
第二编 生成式人工智能技术和产品合规要点
第三章生成式人工智能产品准备阶段的合规要点 / 073
一、训练数据集合规要点 / 073
(一)数据来源合规 / 073
(二)数据集的预处理工作 / 091
(三)数据安全 / 099
二、算法/模型合规要点 / 104
(一)准入类资质 / 104
(二)算法备案 / 110
(三)算法机制机理审核研究 / 117
(四)安全评估 / 125
(五)科技伦理审查 / 131
第四章生成式人工智能模型训练阶段的合规要点 / 138
一、训练阶段 / 138
(一)预训练 / 139
(二)优化训练 / 141
二、训练阶段的合规要点 / 146
(一)采取完善的数据治理措施 / 147
(二)编制技术文件 / 148
(三)日志记录和保存义务 / 148
(四)解释说明的义务 / 149
(五)管理优化训练中的标注人员 / 149
(六)模型的安全性测评 / 150
三、内容输出阶段 / 151
(一)知识产权合规要点 / 151
(二)信息发布审核 / 153
(三)平台内容管理 / 154
(四)标识要求 / 156
(五)协助监管 / 158
(六)生态治理 / 158
第五章生成式人工智能的基准和评估 / 161
一、安全性评估标准 / 161
(一)评估模型欺骗或模型出逃的风险 / 161
(二)评估被滥用的风险 / 164
(三)安全评估的方法及要求 / 165
二、合规评估标准 / 167
(一)算法备案的合规标准 / 167
(二)欧盟高风险人工智能系统的合规标准 / 171
第六章生成式人工智能部署环节的合规 / 180
一、大模型垂直部署 / 180
(一)保证数据质量的义务 / 180
(二)全周期的内容评估义务 / 181
(三)大模型开发者的提示义务 / 181
二、基于API调用的部署 / 182
(一)开源合规 / 184
(二)数据合规 / 185
(三)安全评估和算法合规 / 188
(四)内容合规 / 189
三、基于插件模式的部署 / 190
(一)插件模式下反馈信息的合规问题 / 190
(二)生成式人工智能基于插件模式调用第三方程序合规问题 / 193
四、一站式大模型集成平台 / 195
(一)内容管理 / 195
(二)用户管理 / 196
(三)应急处理 / 199
第三编 生成式人工智能域外合规要览
第七章欧盟生成式人工智能合规框架 / 206
一、欧盟生成式人工智能合规监管体系概述 / 206
(一)欧盟生成式人工智能技术产业现状 / 206
(二)欧盟生成式人工智能治理的基本原则 / 209
(三)主要监管部门及职责 / 212
二、主要规定与历史沿革 / 216
(一)监管法律及其历史沿革 / 216
(二)主要监管及激励措施 / 218
三、合规要点 / 221
(一)高风险人工智能系统的合规要求 / 221
(二)有限风险人工智能系统的合规要求 / 233
(三)通用人工智能模型提供者的合规要求 / 235
第八章美国生成式人工智能合规框架 / 237
一、美国生成式人工智能合规监管体系概述 / 237
(一)美国生成式人工智能治理的基本原则 / 237
(二)主要治理主体及职责 / 241
二、主要规定与历史沿革 / 251
(一)美国生成式人工智能联邦监管立法及政策概述 / 251
(二)《人工智能基础模型透明法案》重点制度框架 / 254
三、合规要点 / 256
(一)生成式人工智能大模型训练数据合规 / 256
(二)知识产权保护合规 / 259
(三)产品准入及前置程序合规 / 263
(四)内容安全及伦理安全 / 265
第九章英国生成式人工智能合规框架 / 267
一、英国生成式人工智能合规监管体系概述 / 267
(一)英国生成式人工智能治理的基本原则 / 267
(二)主要监管部门及职责 / 268
(三)监管框架思路、依据、风险 / 269
二、主要规定与历史沿革 / 271
(一)《国家人工智能战略》提出的未来立法监管规划 / 271
(二)英国生成式人工智能监管规则概览 / 274
三、英国治理体系特征 / 276
(一)秉承去中心化监管理念,以行业自主治理为主 / 276
(二)重点行业治理特点与制度 / 279
四、合规要点 / 283
(一)确定适用的人工智能监管规范与范围 / 283
(二)追踪主管行业立法与监管措施 / 285
(三)关注持续性合规义务与成本 / 285
(四)关注人工智能训练数据的版权合规 / 286
第十章日本生成式人工智能合规框架 / 288
一、日本生成式人工智能合规监管体系概述 / 288
(一)日本生成式人工智能治理的基本原则 / 288
(二)主要治理主体以及职责 / 289
二、主要法律规定与监管文件 / 290
(一)《日本AI法》 / 290
(二)日本生成式人工智能治理的现有法律适用 / 291
(三)日本生成式人工智能现有监管体系 / 292