欢迎来到华体会体育官网

黄先生:13553877099

hmr@mxjpm.com.cn

吴小姐:18928238486

wby@mxjpm.com.cn

华体会体育官网

精密模具

新闻资讯

联系我们

联系人: 黄先生

手机: 13553877099

电话:

黄先生:13553877099

hmr@mxjpm.com.cn

吴小姐:18928238486

wby@mxjpm.com.cn

邮箱: hmr@mxjpm.com.cn

地址:
横沥工厂:广东省東莞市横沥镇水边職教城高訓中心
常平工厂:广东省东莞市常平镇白花沥村六横路天图斯工业园第9栋101号

中国AI大模型DeepSeek-V3突现危机:人类数据或面临枯竭

来源:华体会体育官网    发布时间:2025-03-31 14:54:35

  2023年12月26日,中国大模型公司DeepSeek在笼罩着科技界的期待中,发布了名为DeepSeek-V3的新一代超大规模AI模型。这款性能堪比GPT-4o,训练成本仅为557.6万美元的模型,一经推出便备受瞩目,被誉为“AI届拼多多”。然而,就在国内网友欢呼之际,这款模型却出现了令人意外的“翻车”事件。

  关于这次事件的一个显著问题是,DeepSeek-V3在回答“你是谁”时,竟自称是ChatGPT,并在回应API问题时,直接引用了OpenAI的信息。这引发了关于AI模型身份认同及智能水平的热烈讨论。业内专家分析认为,DeepSeek-V3可能是基于ChatGPT生成的文本进行训练,这在某种程度上预示着模型可能吸收了大量ChatGPT的输出内容,导致其在对话中重复使用这一些内容。随着互联网环境的变化,慢慢的变多的AI垃圾数据充斥网络,欧洲联盟的一项报告说明,到2026年,预计90%的在线内容都是AI生成的,这让过滤AI生成内容变得愈加复杂。

  “翻车”的现象凸显了AI行业一个更为严峻的问题——人类创造的数据资源正在逐渐耗尽。近年来,尽管AI技术如火如荼,但对于训练所需的基础数据,全球各大AI研究人员的警报声已越来越响。过去十年,AI模型训练所需的数据量飙升了100倍。然而,令人担忧的是,人类每年贡献的新数据增幅却仅有不到10%。研究团队预测,若这种趋势继续,预计到2028年,AI训练所需的数据集将接近互联网公共文本的整体规模,意味着在未来四年内,AI将面临数据枯竭的困境!

  此时,许多内容创建者开始意识到其作品被滥用的潜在风险,慢慢的开始通过收紧访问权限、要求支付使用费甚至采取法律手段来保护自身内容。2023年12月,《》已经对OpenAI及其合作伙伴提起了诉讼,指控其侵犯版权。而面临相似风险的还包括数十家媒体机构及内容创作者,反击AI行业的逐渐升级。

  为应对即将来临的数据瓶颈,诸如字节跳动这类互联网巨头慢慢的开始以支付报酬的方式招聘“AI录音员”来自主创造语料库。这一些平台正在发掘高质量的数据来源,以确保AI模型训练的连续性,然而,这显然是条昂贵的道路。随着AI用户对按月收费模式的反对声不断,成本的飙升为商业化成功蒙上了阴影。

  人类的数据即将被AI耗尽,未来的AI行业将如何破局?大规模生产数据会成为新兴的长期职业吗?而AI的发展又将为人类社会带来怎样的影响?

  本周六(1月4日)晚9点,鸿学院微课堂即将展开题为《中国AI大模型DeepSeek-V3突现危机:人类数据或面临枯竭》的讨论,不容错过!返回搜狐,查看更加多