近期身体不适,严重感冒,文章更新略慢,望多包涵;
当下在人工智能领域,大模型研发成本非常高昂,但国外meta公司的Llama系,以及国内腾讯、阿里等企业为什么会选择将自己花费巨大成本训练的模型进行免费开源?只是秀肌肉、做慈善,或是吸引企业使用并推动AI技术的创新?还是另有所图?
的确,对中小企业来说,使用大厂开源的大模型,或通过加以微调即可满足自己的业务需求,既能满足一定的个性化业务场景需求,又节约了一大笔从0开始预训练一个大模型的成本开销,何尝不是件好事。
企业引入大模型的决策考量
目前,企业引入大模型有两种途径:① API调用现成服务;② 部署自有服务器。API调用简单但存在数据安全风险,而部署自有服务器则需拥有大模型,成本相对偏高。但开源大模型因其使用、部署成本低廉并兼具灵活性,而成为企业的首选。
开源大模型使用免费、部署灵活,企业也可根据业务需求进行定制和优化。例如,腾讯开源的混元大模型就允许企业调整参数、修改结构或添加领域知识模块。私有化部署开源大模型看似降低了对某些云厂商的依赖,提高了企业自身的业务连续性和稳定性,实则也面临着诸多挑战。
大模型微调的必要性与挑战
大模型虽学习了通用知识,但在特定行业或任务上需微调以适应业务场景。微调涉及复杂的数据处理、模型调优、模型评测、模型部署等技术难度大,约70%的企业在此过程中遇难题。
当企业遇到这些技术难题后怎么办?要么招聘更专业的一波人才攻克技术难题,要么寻找市场上一些成熟的解决方案和技术平台来降低研发的难度,很明显后者投入成本相对要低、见效一般也快。于是,你可能就关注到了各个大厂提供的大模型开发平台。
开源背后的商业逻辑与行业影响
于是你会发现,阿里的百炼平台、腾讯的云TI平台,都提供了从数据处理到模型训练、部署的全套解决方案,降低了我们大部分企业应用大模型的技术门槛。这样来看,这些大厂核心就是希望通过开源大模型,吸引企业使用自己的开放平台提供的各种增值服务,从而实现商业价值转化。
其实国内很多科技公司开源的一些软件产品都是这种商业逻辑,典型代表阿里这些年为国内的开发者生态贡献了较多优秀的框架(如:Spring Cloud Alibaba 生态)及中间件(如:Nacos、Dubbo、RocketMQ)等。
这些开源背后的商业逻辑,核心都在于吸引使用、建立用户基础、提供增值服务,实现从开源到盈利的闭环。当然,这种模式也确实推动了很多技术的广泛应用和行业创新发展。
小结
总而言之,大模型开源背后的商业逻辑是企业在技术创新与市场需求间寻求平衡的结果,也是推动行业发展的重要力量。通过开源与增值服务相结合的模式,企业在实现商业价值的同时,也为行业的发展做出积极贡献。
随着技术的持续演进,相信国内开源大模型有望在更多领域取得突破,为全球AI技术发展贡献中国智慧的力量。
往期推荐:
百模大战下的开源模型有哪些?
12天的OpenAI发布会重点内容已帮大家总结好
好了,本期内容就是这么多,希望能够帮助到您,感谢您能读到最后,如果觉得内容不错,请您点赞转发给予鼓励,咱们下期再见。