回答-BFW问答

用大白话讲，AI大模型处理超上下文窗口的大型项目源码，核心思路就像你看一本厚书不会一次性翻完，而是先看目录找章节，再只翻需要的几页精读——不会硬塞所有代码到模型里，而是靠“拆、找、拼、验”四步，把超量代码拆成模型能处理的小块，精准解决问题，具体做法分这几层，都特别好懂：

第一步：先“拆”——把大项目拆成模型能吞的“小块”

大型项目（比如几十万行代码的电商系统）肯定超1M tokens，第一步就是“拆分粒度”，只留和要改的功能相关的代码，比如：

按模块拆：要改“支付功能”，就只提取支付模块的代码（接口、核心逻辑、配置文件），把用户中心、商品模块等无关代码全砍掉；

按文件拆：一个模块还有多个文件，就只取核心文件（比如支付接口定义、支付逻辑实现），甚至只取文件里的关键函数/类，不是整文件都喂给模型；

按依赖拆：如果改A函数需要用到B工具类，就只提取A和B的代码，不碰其他依赖（比如日志、数据库连接的通用代码，模型靠常识也能补）。

举个例子：1M tokens大概能装十几万行代码，但一个电商项目有百万行，改“微信支付回调逻辑”时，只拆出回调接口文件（几百行）、支付状态更新函数（几十行）、数据库表结构（几行），总共几千行，远低于上下文限制。

第二步：再“找”——精准定位要改的代码块（不用瞎翻）

拆完还得确保找对代码，不然改错地方，这一步就像“查书的索引”：

用工具做代码索引：先给整个项目建“代码地图”（比如用Semantic Code Search工具），你说“要加支付宝退款功能”，工具能直接定位到退款接口、退款逻辑、订单状态更新这几个关键代码段；

用自然语言匹配：你告诉AI“修复下单后库存没扣减的bug”，AI先通过索引找到“下单函数”“库存扣减函数”，只把这两段代码拿出来分析，不用看整个订单模块；

用户辅助定位：如果是新手用AI，直接把要改的文件/函数复制给AI，省得AI找错，比如“我要改这个文件里的pay()函数，加个优惠券抵扣逻辑”。

第三步：“拼”——分段处理+上下文补全（不用一次性喂）

就算拆完，偶尔某段代码还是略超上下文，或者改功能需要关联多个小块，就用“分段聊+记上下文”的方式：

多轮对话接力：先让AI看“支付接口定义”，AI记住“接口里有金额、订单号、支付方式三个参数”；再把“支付逻辑函数”喂给AI，说“基于刚才的接口，给这个函数加优惠券抵扣”，AI会衔接上一轮的信息；

摘要压缩：把无关的注释、空行、重复代码删掉，只留核心逻辑（比如把几百行的函数，压缩成“函数功能：计算支付金额；输入：订单号、优惠券ID；输出：实付金额”的摘要，再加上关键代码行），减少tokens占用；

只传差异：如果是改已有功能，不用传整个函数，只传“原函数里的这几行代码，要改成xxx逻辑”，比如“把pay函数里amount = order.price改成amount = order.price - coupon.amount”。

第四步：“验”——改完后校验（避免改出问题）

AI改完的代码块，不会直接丢回项目，还要做“局部验证”：

语法/逻辑检查：AI先自检改的代码有没有语法错，比如少个括号、变量名写错；

依赖检查：确认改的代码和项目里其他代码兼容，比如加了优惠券参数，有没有在接口里定义、有没有传值；

小范围测试：把改后的代码片段单独跑测试（比如调用pay函数，传优惠券ID，看金额是否正确），没问题再合并回项目。

举个实际例子（新手能看懂）

比如你要让AI给一个10万行的电商项目加“满减优惠”功能：

拆：只提取“下单计算金额的函数”（200行）、“优惠规则配置文件”（50行），总共250行；

找：用代码索引定位到这个计算函数，告诉AI“就在这个函数里加满减逻辑”；

拼：AI先看函数的现有逻辑（“金额=商品总价+运费”），再按你说的“满200减30”改代码，只改这几行核心逻辑；

验：AI检查改后的代码语法没问题，还会提示你“要在配置文件里加满减规则，还要在前端传满减标识”，你按提示补全后，测试下单功能，金额计算正确就完工。

补充：普通AI（比如ChatGPT 3.5/4o）的通用做法

普通用户用AI改代码，不用自己拆，只要做好这2件事，AI会自动适配：

明确告诉AI改哪里：比如“我要改项目里order文件夹下的pay.py文件里的calc_pay_amount函数，加满200减30的逻辑”，AI只聚焦这段代码；

分批传代码：如果一个函数还是长，就分两次发，先传“函数的开头和参数定义”，再传“函数的核心计算逻辑”，说“基于上一段代码，改这里的计算规则”，AI会衔接。

总结：核心不是让AI“记住所有代码”，而是让AI“只看要改的那几行，且知道这几行在项目里的作用”，就像医生看病不用把全身都查一遍，只查不舒服的部位就行。

回答