+
62
-

ai大模型对于大型项目源码上下文不够是如何解决进行开发与修改功能的?

ai大模型对于大型项目源码上下文不够是如何解决进行开发与修改功能的?

目前最长的上下文是1M,那么大型项目tokens代码量估计是远远超过这个限制了,那么普通ai又是如何在上下文窗口有限的情况下修改源码增加功能、修复bug等问题的?

网友回复

+
7
-

用大白话讲,AI大模型处理超上下文窗口的大型项目源码,核心思路就像你看一本厚书不会一次性翻完,而是先看目录找章节,再只翻需要的几页精读——不会硬塞所有代码到模型里,而是靠“拆、找、拼、验”四步,把超量代码拆成模型能处理的小块,精准解决问题,具体做法分这几层,都特别好懂:

第一步:先“拆”——把大项目拆成模型能吞的“小块”

大型项目(比如几十万行代码的电商系统)肯定超1M tokens,第一步就是“拆分粒度”,只留和要改的功能相关的代码,比如:

按模块拆:要改“支付功能”,就只提取支付模块的代码(接口、核心逻辑、配置文件),把用户中心、商品模块等无关代码全砍掉;

按文件拆:一个模块还有多个文件,就只取核心文件(比如支付接口定义、支付逻辑实现),甚至只取文件里的关键函数/类,不是整文件都喂给模型;

按依赖拆:如果改A函数需要用到B工具类,就只提取A和B的代码,不碰其他依赖(比如日志、数据库连接的通用代码,模型靠常识也能补)。

举个例子:1M tokens大概能装十几万行代码,但一个电商项目有百万行,改“微信支付回调逻辑”时,只拆出回调接口文件(几百行)、支付状态更新函数(几十行)、数据库表结构(几行),总共几千行,远低于上下文限制。

第二步:再“找”——精准定位要改的代码块(不用瞎翻)

拆完还得确保找对代码,不然改错地方,这一步就像“查书的索引”:

用工具做代码索引:先给整个项目建“代码地图”(比如用Semantic Code Search工具),你说“要加支付宝退款功能”,工具能直...

点击查看剩余70%

我知道答案,我要回答