您现在的位置是:物联网 >>正文
许多主要新闻媒体正屏蔽 OpenAI 爬虫
物联网985人已围观
简介自OpenAI的内容生成式人工智能模型面世以来,大量互联网数据成为了不断训练和优化模型的“饵料”,但据路透社研究所的一项调查,有越来越多的新闻媒体已对OpenAI的数据爬取说“不”,在传统媒体领域,这 ...
自OpenAI的许多内容生成式人工智能模型面世以来 ,大量互联网数据成为了不断训练和优化模型的主新“饵料”,但据路透社研究所的闻媒一项调查 ,有越来越多的体正新闻媒体已对OpenAI的数据爬取说“不” ,在传统媒体领域 ,屏蔽爬虫这一比例甚至超过了50%。许多
路透社研究所分析了《纽约时报》、云计算主新《华尔街日报》、闻媒《华盛顿邮报》、体正CNN、屏蔽爬虫NPR 等多家主流新闻媒体 ,许多涵盖美国 、主新英国 、闻媒德国、体正印度等10个国家 ,屏蔽爬虫并将其归为传统印刷媒体(纸媒) 、广播电视媒体 、数字媒体三大类 。建站模板研究发现,57%的传统印刷媒体屏蔽了OpenAI 的爬虫程序 ,广播电视媒体和数字媒体的比例分别为48%和 31% 。
研究还发现 ,屏蔽 OpenAI 的新闻网站比例因国家和地区差异而存在很大不同,在美国 ,这一比例高达79%,源码下载而在墨西哥和波兰仅为 20%。

所研究调查的10个国家新闻媒体对 OpenAI爬虫采取屏蔽措施的比例差异
此外, 在屏蔽了OpenAI 爬虫的新闻媒体中 ,有97%也同样屏蔽了谷歌人工智能的爬虫。
研究揭示了一些新闻媒体不希望他们的内容被人工智能使用 ,如果人们使用人工智能从网络上获取新闻,模板下载这些媒体会认为自己将被抛弃或取代 。Gartner 副总裁 、杰出分析师安德鲁·弗兰克 (Andrew Frank) 表示 :“路透社的研究强调了生成式人工智能面临的一个根本挑战:它依赖于真实的人生成的真实内容 ,而这些人将其视为对他们生计的威胁 。”
与此同时 ,康奈尔大学最近的香港云服务器一项研究发现,当新的人工智能模型根据先前模型而不是人类输入的数据进行训练时,它们往往会趋向于“模型崩溃”或退化 ,导致越来越多地生成错误信息 。
OpenAI 于去年 8 月初推出了人工智能爬虫,谷歌也于 9 月紧随其后 。根据这项研究 ,一旦这些媒体做出屏蔽决定 ,源码库恐将很难改变立场对其进行解除 。
Tags:
转载:欢迎各位朋友分享到网络,但转载请说明文章出处“信息技术视野”。http://www.bziz.cn/html/332e599662.html
相关文章
美官方为软件供应商提出供应链安全指南
物联网10月31日,美国国家安全局NSA)、网络安全及基础设施安全局CISA)、国家情报总监办公室ODNI)携手发布了保护软件供应链的实操指南。该指南内容总共有40页,主要提及了软件供应商在供应链中所需要承 ...
【物联网】
阅读更多戴尔科技推出全新PowerEdge服务器,加速企业的AI采用
物联网戴尔科技集团NYSE:DELL)今日宣布进一步扩大其AI工厂的产品组合,推出专为AMD环境打造的全新PowerEdge服务器R6725、R7725、R6715及R7715)。作为全球最丰富的解决方案组 ...
【物联网】
阅读更多从DeepSeek的爆火谈预测分析模型在降低数据中心能耗方面的重要作用
物联网近年来,随着AI和各种大模型技术的飞速发展,给人们的工作、生活带来了诸多便利,特别是随着DeepSeek的爆火,高性价比的大模型将进一步推动AI技术的发展,加速大模型技术在千行百业的应用落地。在数据中 ...
【物联网】
阅读更多