在人工智能技术快速地发展的背景下,近期a16z发布的报告引起了广泛关注。该报告说明,大规模语言模型(LLM)推理的成本在过去三年内惊人地下降了1000倍,标志着进入了一个全新的技术时代,可以称之为“大模型通胀时代”。这项变化不仅会对AI技术的应用场景产生深远影响,还可能推动相关产业的剧变。
过去,随技术的慢慢的提升,摩尔定律和丹纳德定律在计算领域中起到了推动角色。而在文本处理和生成的模型方面,我们也看到了类似的趋势。a16z将此现状称为“LLM通货膨胀”,意思是在固定价格下,所能获得的令牌数量迅速增加。以往,GPT-3发布时,达到MMLU分数42的模型成本为每百万个令牌60美元,而现在,类似的模型成本已降至仅0.06美元。这表明,LLM推理的经济性正在迅速提升,这无疑为各行各业的创新提供了更为广阔的空间。
在详细分析过程中,a16z采用了MMLU分数来评估多个大语言模型的表现,从而量化推理成本的变化。需要指出的是,模型的推理成本并非只受到单一因素的影响,而是由多个因素共同作用而成,包括更高效的GPU硬件、更小的模型、优化的算法以及开源模型的涌现等。这一些因素协同作用,使得AI模型的运行效率大幅度的提高,从而有效实现了成本的骤降。
例如,当前的模型量化技术使得AI推理不再局限于传统的16位操作,而向更先进的4位甚至更低精度的处理模式拓展,大幅度降低了运算时间和内存开销。同时,公司如Meta和Mistral推出的开源模型,更是在某些特定的程度上打破了原有的商业模式,通过降低市场进入门槛,推动了技术的普及。
除了成本的下降,LLM的应用场景也在快速扩展。根据报告,过去一年的当下,通过AI技术,人类可以以极低的成本生成大量文本,比如处理整个Linux内核的费用低于1美元。此外,文本到语音模型的降价,也让开发语音助手的成本几乎变成了零。这促使了慢慢的变多的创业者和企业寻找将AI技术应用于实际场景的方法。
随着技术监测的逐步的提升,LLM的应用潜力将大幅度的提高,开启更多商业模式和用例。通过技术的进步,企业不再需要高额的预算来实现自动化和智能化,从而使得原本被视为昂贵的AI解决方案,逐渐走入小企业和个人开发者的日常使用。
然而,尽管LLM推理成本的迅速下降带来了许多机遇,但也难以忽视其给AI提供商带来的挑战。目前,行业内的顶尖企业似乎更倾向于维护产品的高端市场而非低端市场。即便如此,LLM推理成本的急剧下降仍然为整个AIECO的创新提供了重要的动力。
在这样的市场环境中,未来的创业者们面临着前所未有的机会。AI不仅提供了丰富的工具和资源,也为更广泛的用户群体指南开启了无限可能。我们正在见证的不仅是成本的变化,还有技术与创意的结合,构成全新AI应用的基础。
这场关于模型与成本的革命,将在未来几个月和几年内继续延续,推动新的应用场景和创新模式的不断涌现,真正的完成AI技术的民主化和普及化。返回搜狐,查看更加多