2026年3月18日,心灵鸡汤出版社发起版权侵权诉讼,将苹果、Meta、xAI、谷歌、Anthropic、OpenAI、Perplexity、英伟达等全球顶尖科技巨头列为被告,指控上述企业使用含大量盗版书籍的The Pile数据集训练AI模型,核心争议点为数据集中的Books3模块涉嫌收录海量受版权保护作品。苹果回应称相关数据集仅用于开源研究项目OpenELMs,未应用于核心AI服务Apple Intelligence。
这场几乎覆盖全球所有头部AI参与者的诉讼,再次把AI训练数据的版权灰色地带摆到了台面上。作为全球AI训练领域使用最广泛的开源数据集之一,The Pile由22个不同的文本子集构成,其中专门收录出版书籍的Books3模块,一直是版权争议的焦点——该模块内容全部爬取自民间影子图书馆,其中超过七成内容没有获得版权方授权。
针对本次指控,苹果的回应格外谨慎。其公开声明中明确强调,公司自2024年起就已经全面启动AI训练数据的合规化改造,所有用于商用产品的训练数据均经过版权审核,涉及The Pile数据集的使用仅出现在面向学术圈的OpenELMs开源项目中,该项目从未向普通用户开放,也没有为Apple Intelligence的训练提供任何数据或技术支持。
但法律界的分析并不像苹果声明那样乐观。有知识产权律师指出,当前全球范围内尚未就AI训练数据的“合理使用”边界形成统一司法标准,即便仅用于非商用研究,如果相关研究成果间接为商用模型的迭代提供了参考,依然有可能被判定为侵权。有消息称原告方已经掌握了苹果部分基座模型训练过程中调用过Books3内容的相关证据,苹果的辩护主张能否得到法院支持仍存在较大不确定性。而英伟达被诉的原因则是其开源的NeMo大模型开发框架默认提供了The Pile数据集的一键下载接口,被认定为为侵权行为提供了便利。
事实上,本次诉讼并非AI训练数据版权争议的首次爆发。过去三年间,已有超过200名作家、12家出版社先后对OpenAI、谷歌等企业发起侵权诉讼,索赔总金额超过10亿美元。而本次诉讼将英伟达、苹果等此前较少卷入数据版权纠纷的企业列为被告,也意味着维权方的追责范围正在从模型提供方向全产业链延伸。
在监管和诉讼的双重压力下,头部科技企业已经开始主动调整数据策略。除了苹果在2024年启动的合规数据集项目外,OpenAI、Meta等企业也先后与企鹅兰登、哈珀柯林斯等头部出版集团达成了内容授权协议,为训练数据获取合法版权。据行业机构测算,仅2025年全球AI企业支付的内容版权费用就已经超过37亿美元,同比增长182%。
本次集体诉讼也被业内视为推动AI训练数据确权规则出台的重要契机。有参与相关立法研讨的人士透露,目前中美欧均在加快制定AI训练数据的版权规范,未来可能会明确“商用训练必须获得授权、非商用研究可适用合理使用例外”的核心原则,同时配套建立训练数据溯源、登记的统一标准。
可以预见的是,随着版权规则的清晰,AI训练的“数据红利”时代将逐步结束,靠爬取公开免费数据做模型的路径将难以为继。一方面头部企业的合规成本会进一步上升,另一方面也会催生出专门的AI训练数据交易、确权服务市场,为内容创作者提供新的收益渠道。

1 小时前
当前全球超过62%的科技企业已启动AI智能体落地部署,过往针对大模型的静态基准测试已无法覆盖智能体的真实落地需求。InfoWorld最新行业分析指出,AI评估(AI Evals)已成为构建高效AI智能体的新刚需,其中针对交互层的专项测评,是决定用户是否信任智能体交付结果的核心指标。

1 小时前
图形数据库龙头厂商Neo4j近日正式推出端到端AI Agent开发部署平台Aura Agent,该平台支持开发者通过低代码工具、代码自动生成能力快速构建AI Agent,同时可直接对接原生知识图谱能力,大幅降低生产级AI Agent的开发门槛,缓解大模型幻觉、私有知识库适配复杂等行业普遍痛点。

2 小时前
2026年3月19日,AI企业Anthropic正式推出Claude 3.6系列更新版本Sonnet 4.6,强化编程与自动化能力,支持100万token上下文窗口,核心战略从大模型提供商转向智能体平台,瞄准企业级AI市场。不过本次重磅发布并未获得全正面反馈,Anthropic因与开源框架OpenClaw的版权争议陷入公关危机,新品声量被大幅分流。

4 小时前
2026年3月,华盛顿州立大学副教授Mesut Cicek领衔的研究团队发布针对ChatGPT科学判断能力的测试报告。团队选取2021年以来商业期刊已验证的719条研究假设反复测试,发现ChatGPT表面正确率达80%,但剔除随机猜测因素后真实表现仅略高于抛硬币概率,假命题识别率仅16.4%,10次重复提问的回答一致性仅约73%。

4 小时前
据《华尔街日报》2026年3月报道,尽管苹果自有大模型研发进度落后于谷歌、微软等行业头部企业,但其依托iPhone等硬件生态的应用商店抽成模式,预计2026年AI相关收入将突破10亿美元。其中生成式AI应用佣金的75%由OpenAI旗下ChatGPT贡献,马斯克旗下Grok占比约5%,该业务的高利润率特征受到投资者高度关注。

4 小时前
据《华尔街日报》2026年3月披露,尽管苹果在原生AI技术迭代上落后于OpenAI、谷歌等行业头部玩家,但其凭借iOS生态的硬件入口优势,2026年AI相关营收将突破10亿美元。该收入主要来自ChatGPT、X等AI服务的iOS端订阅分成,而非Siri等自研AI产品的商业化,目前iOS端AI服务订阅首年抽成比例达30%。

4 小时前
2026年3月19日,小米正式发布三款自研MiMo-V2系列大模型,覆盖旗舰基座、多模态、语音合成多个场景,其中MiMo-V2-Pro参数量达1万亿,位列全球大模型综合智能排行榜第八。小米创始人雷军宣布,2026年小米在AI领域的研发及资本投入将超160亿元,全面布局智能体时代。

6 小时前
2026年3月19日,小米集团创始人雷军公开回应公司大模型业务进展,披露小米自研万亿参数大模型Mimo-V2-Pro在全球权威大模型综合智能排行榜Artificial Analysis的排名中,综合位列全球第八,按所属品牌计算小米跻身全球前五,性能超过马斯克旗下xAI的Grok模型,同时小米同步开放两款大模型API服务。