OpenAI：如果不使用版权内容，ChatGPT等AI模型不可能开发出来-家维网「半小时极速上门」

OpenAI：如果不使用版权内容，ChatGPT等AI模型不可能开发出来

IT之家 1 月 10 日消息，ChatGPT 开发商 OpenAI 近日承认，像 ChatGPT 这样的 AI 工具的开发离不开受版权保护的素材，并称如果没有这些素材，这些工具根本无法诞生。据《每日电讯报》报道，OpenAI 在提交给英国上议院通信和数字事务特别委员会关于大型语言模型调查的文件中做出了这一表述。

ChatGPT 和图像生成器 DALL-E 等 AI 模型之所以拥有强大的能力，主要是因为它们通过海量的内容进行训练，其中一部分是从网上公开内容抓取而来，并不总是经过版权持有人的许可（OpenAI 确实会获得部分训练内容的许可）。这种“自由奔放”的抓取方式在学术机器学习研究中由来已久，但随着深度学习 AI 模型近期走向商业化，这种做法也受到了愈加严厉的审查。

OpenAI 在提交给上议院的文件中写道，“由于当前版权涵盖了几乎所有形式的人类表达方式，包括博客文章、照片、论坛帖子、软件代码片段和政府文件，如果不使用受版权保护的内容，就不可能训练当今领先的人工智能模型。”

OpenAI 进一步表示，如果将训练数据仅限于“一个世纪前”的公共领域书籍和图画，将无法训练出“满足当代公民需求”的 AI 系统。

IT之家注意到，去年 12 月《纽约时报》对 OpenAI 和 OpenAI 重要投资者微软提起诉讼，指控他们未经许可在产品中非法使用了该报的内容。OpenAI 于本周一在其网站上对此案作出了回应，称该诉讼毫无根据，并重申了其对新闻业的支持以及与新闻机构的合作关系。

OpenAI 的辩护主要基于“合理使用”的法律原则，该原则允许在特定情况下未经所有者许可有限使用受版权保护的内容。该公司坚称，版权法并不禁止使用此类素材训练 AI 模型。

“使用公开可获取的互联网素材训练 AI 模型属于合理使用，这一观点得到了长期以来广泛接受的先例的支持，”OpenAI 在其周一发布的博客文章中写道，“我们认为，这一原则对创作者是公平的，对创新者是必要的，对美国的竞争力也至关重要。”

这不是 OpenAI 第一次就其 AI 训练数据提出合理使用辩护。早在去年 8 月份，OpenAI 在回应喜剧演员 Sarah Silverman 的版权诉讼时，同样以合理使用为由捍卫了其使用公开可获取素材的做法。OpenAI 宣称，那位喜剧演员对版权范围存在“误解”，没有考虑到“合理使用”等限制和例外条款，而正是这些条款为像大型语言模型这样的前沿人工智能创新留下了必要的发展空间。

标题：OpenAI：如果不使用版权内容，ChatGPT等AI模型不可能开发出来

地址：http://www.cdaudi4s.com/baike/85854.html

OpenAI：如果不使用版权内容，ChatGPT等AI模型不可能开发出来

康佳电视遥控代码(康佳电视遥控代码全解析：快速掌握操作要诀)

电视恒流板是什么作用(揭秘电视恒流板的神秘功能)

手机排线怎么换(手机排线换中心，如何操作？)

海尔冷柜维修(如何自行检修故障)

三菱空调定频故障代码(如何识别并解决常见故障)。

液晶电视为什么会白屏(可能的原因及解决方法)。

买电热水器要注意什么(买电热水器需注意什么？30个汉字左右应该够用了。)

trane空调总部400售后维修(特灵空调e5故障代码是什么问题特灵空调e5故障代码解

三菱电机中央空调总部400售后维修(三菱空调故障代码e3怎么修详解排除故障的方

ch2122f电源块是什么号(Ch2122f电源块：解析多功能电源模块)

山东今明仍有雨，台风“贝碧嘉”扰中秋

三菱中央空调厂家24小时热线(三菱空调的构造有哪些部件组成三菱空调？)

YORK空调厂家售后维修电话(约克空调高压传感器故障约克空调高压传感器故障诊

格力空调官网电话(如何通过格力空调官网获取官方客服电话以解决产品问题或

铂爱055 怎么样(铂爱055：玩转时尚，尽显个性)