新闻资讯

开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?

作者:小编 点击: 发布时间:2025-02-24 10:38:41

  开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?报告聚焦 AI 大模型领域,对过去一年的技术演进动态、技术趋势、以及开源开发者生态数据进行多方位的总结和梳理。

  在第二章《TOP 101-2024 大模型观点》中,IDEA 基础软件研究中心讲席科学家、Moonbit 平台负责人张宏波提到,AI 大模型提升程序员最终使用体验有几个方向,快速的更新迭代适合生成代码的垂类 AI 大模型只是一方面,更重要的是从编程语言入手,打造一个完整和 AI 高度集成的 IDE 生态。

  AI 大模型是指在机器学习和深度学习领域,采用大规模参数(至少在一亿个以上)的神经网络模型。这些模型在训练过程中需要消耗大量算力和高质量数据资源。AI 大模型主要分为自然语言处理(NLP)大模型、计算机视觉(CV)大模型、多模态大模型等,其中 NLP 大模型和多模态大模型在市场中占据主导地位。

  目前 AI 大模型行业应用的实现路径主要有两种:一是持续加大对通用大模型的研发投入,提升 AI Agent 能力,直接服务各行业;二是融合行业专业知识,基于通用大模型打造垂类行业模型。垂类行业大模型已通用大模型的基础,通过二次训练和优化,实现更精准的行业应用。

  60% 的企业通过垂类行业大模型实现 AI 大模型在行业的应用布局。金融、政务、影视游戏和教育领域是大模型渗透率最高的四大行业,渗透率均超过 50%。电信、电子商务和建筑领域的应用成熟度较高。

  基础软件是指构成计算机系统和信息技术基础设施核心的软件,它们为应用程序的运行、数据处理和系统管理提供基本功能和支持。操作系统、数据库、中间件和网络软件、安全软件、系统管理软件、虚拟化软件、云平台等都属于基础软件。

  作为构建软件世界的重要工具,随着 AI 大模型能力的不断释放,基础软件行业正在快速变革,传统的软件公司受到巨大冲击。

  来自美国老牌 VC Menlo Ventures 的报告显示:以 ChatGPT 为例,在它的影响下 Stack Overflow 的网络流量减少了一半。IT 外包公司和传统的自动化公司必须为即将到来的 AI 自动化挑战做准备。随着时间的推移,即使是 Salesforce 和 Autodesk 等软件巨头也将面临被 AI 公司颠覆的危险。

开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?(图1)

  值得注意的是尽管 AI 大模型在软件开发中的潜力巨大,但也面临数据隐私与安全性、模型可解释性开元体育、资源成本高以及法律与伦理风险等挑战。为了应对这些挑战,需要制定相应的数据保护政策、提高模型透明度、优化资源分配,并在法律层面清晰界定 AI 应用的责任归属。

  大模型最常用的调用方式是通过模型厂商或者云服务提供商的 API 进行调用。在一些关注数据隐私和安全的商业公司里面,这通常意味着需要从模型厂商或者云服务提供商处购买昂贵的私有化部署的实例。

  大模型在大量的数据上进行了训练,获得了很强的泛化能力,但是在一些少见、结构化的数据上仍然没有办法表现的足够优秀开元体育。现有的解决方案,例如推理时进行约束解码、微调,通常会导致模型能力的退化。如何让模型能够在推理的时候 “主动” 地生成符合期望约束的输出,仍然是一个没有解决的问题。

  AI 编程在过去一年的硅谷是非常热门的话题,包括 GitHub Copilot 等 AI 产品成功破圈用户达数百万。根据 Gartner 预测,到 2028 年,智能编码助手在企业软件工程师群体中的采用率将从 2024 年初的不到 14% 提升至 90%。IDC 估计,到 2029 年,AI 编码工具市场规模达 40 亿美元。最近谷歌 CEO Sundar Pichai 也表示,谷歌超 25% 新代码均由 AI 完成。

开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?(图2)

  很重要的一个原因是编程像数学一样结果非常容易评估,但是当下的 AI 编程有两个很大的瓶颈,第一个是缺乏对领域知识的理解,比如 GitHub Copilot 对所有的编程语言用的都是一样的模型,它甚至无法保证生成的这个编程语言的语法一定是正确的。

  第二个是它缺乏原生的 IDE 支持,这也是因为时间关系,以前的 IDE 都没有预想到未来代码将由 AI 生成,所以现在的 IDE 无法与 AI 大模型进行一个高效的互操作,例如要修复 Copilot 的一个问题,我们需要一个接一个的串形进行修复,但大模型对算力的要求很高,会产生较大的延迟。

  最近硅谷还有一个非常火的公司叫做 Cursor,它的官网上专门有一篇文章描述:「怎么用已有编译器传统智能帮助大模型生成一个更高效可靠的代码」,证明 Cursor 也预见到了 AI 代码生成需要更为宏观的看到工具链上的每一环,工具链包括:编程语言、集成开发环境(IDE)、调试器、编译器和构建工具等。

  但因为 Cursor 是一个做 IDE 的公司,它本身不拥有编程语言的服务,如果能从编程语言开始自底向上的适配大模型,编程体验将会产生质的飞跃。

开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?(图3)

  目前绝大多数编程语言诞生在 AI 大模型时代之前,也就是说此前很少有人认真设想过未来代码将由 AI 生产。

  几乎没有人从底层考虑如何适配 AI 编程,建立一整套开发者工具包括编程语言、编译器、调试工具、构建系统、静态分析安全检测工具等。

  特别是编程语言不仅要设计易于人类学习的编程语言,还要设计易于 AI 学习和生成代码。以 Python 举例,它的优势是对于人类易读易学,动态类型系统减少了代码量,允许快速原型开发,增强了开发效率。但性能问题、内存消耗和多线程和并发处理确是它的劣势。

  在 AI 大模型时代 Python 的优势不再明显,机器永不疲惫,不会因为代码枯燥而降低生成速度,劣势却愈发变成挑战。优秀的智能编程助手不能仅关注行业大模型,AI 大模型对于「编程」只是冰山上的技术,未来将是「开发工具和环境」与 AI 大模型高度整合平台的天下。

  一家科技媒体近期的一篇文章中提到:“现阶段在海外能解决这种 IDE 生态问题的中国团队尚且看不到。”IDE 指的是集成开发环境,指用于提供程序开发环境的应用程序,包括代码编辑器、编译器、调试器和图形用户界面等工具,如微软 VS 系列问题。他认为,目前中国公司们哪怕想在海外实现 Cursor 这样的 “插件逻辑”,也是遥遥无期。

  当然,国内并非真的无人有能力整合平台生态,MoonBit(月兔)是从编程语言到集成开发环境(IDE)、调试器、编译器和构建工具等全部自研的中国团队,目前正在致力于打造下一代 AI 云原生开发平台。

  MoonBit 诞生于 ChatGPT 横空出世之后,有更好的机会去重新构想整个程序语言工具链该如何与 AI 友好的协作,不用承担太多的历史包袱。一开始就从顶层设计考虑如何让语言和工具 (IDE, 调试器,静态分析,包管理等)一体化发展。这两点使得 MoonBit 在非常早期就构建了专属 MoonBit 的云端 IDE 和 AI 代码助手,并创新性的从底层构建之初就与 AI 大模型进行适配。

  通过思考语言设计和工具链适配,IDE 和工具链能够非常灵活地在当前的仓库检查、运行并更新 AI 大模型生成的代码块。

  IDE 内置的测试功能除了为程序员提供一种方便测试的机制以外,能够很好地在代码上下文中作为相关代码的示例,从而大大提高代码生成及相关下游任务的正确性。

  除了在 IDE 中向用户提供常规的 AI 生成测试、撰写文档、修复错误等功能外,还能够提供完全后台运行的自动化智能体,通过读取编译器的各项反馈来完成各种相对复杂、长时间的下游任务,例如提升测试覆盖率、从自然语言提示生成完整代码组件或者项目等开元体育

  未来程序员的工作场景,会更多的使用到 AI 大模型代码生成助手。值得注意的是,提升程序员最终使用体验有几个方向,快速的更新迭代适合生成代码的垂类 AI 大模型只是一方面,更重要的是从编程语言入手,打造一个完整和 AI 高度集成的 IDE 生态。

开元体育·(中国)官方网站AI大模型如何影响基础软件行业中的开发工具与环境?(图4)

  现任基础软件中心首席科学家、 Moonbit 平台负责人,是通用程序语言 ReScript 的作者,程序语言 OCaml 前核心开发人员。本科毕业于清华大学电子系,在美国宾夕法尼亚大学读博期间受 Bloomberg 邀请,从事函数式语言编译器的开发工作。


相关标签:
热门产品