
快科技 1 月 13 日音信kaiyun官方网站,马斯克在 CES 期辗转受采访时指出,本质宇宙能用来试验 AI 模子的尊府,如故滥用的差未几了。
马斯克显露,基本上,AI 试验如故将东谈主类累计的常识全数耗尽,而这个时候点即是旧年(2024 年)。
马斯克的这一不雅点呼应了 OpenAI 前科学长 Ilya Sutskever 在旧年 12 月机器学习会议" NeurIPS "上的说法,Sutskever 那时显露,AI 产业大略滥用的数据如故达到了顶峰。
濒临本质宇宙数据的阑珊,马斯克暗意合成数据(synthetic data)将是明天的发展认识。
他指出,补充本质宇宙数据的独一递次即是合成数据,由 AI 自行生成用于试验的数据,通过合成数据,AI 将大略为我方打分,并伸开自我学习的经过。
事实上,很多科技巨头如故运转使用合成数据来试验 AI 模子,微软、Meta、OpenAI 及 Anthropic 等企业如故在其 AI 模子试验中粗鄙应用合成数据。
科技商场参议机构 Gartner 揣度,2024 年 AI 及分析技俩使用的数据中,约 60% 是合成数据。
举例,微软在 1 月 8 日开源的 AI 模子" Phi-4 "即是通过合成数据纠合本质宇宙数据进行试验的,谷歌的" Gemma "模子也罗致了访佛的递次。
Anthropic 使用部分合成数据树立了进展最好的系统之一" Claude 3.5 Sonnet ",而 Meta 则期骗 AI 生成数据来微调其最新推出的 Llama 系列模子。

