来源:得物技术
目录
一、背景
二、生成链路一览
三、表达需求
1. 图形化配置
2. AI直接生成代码
3. 自然语言转指令
四、信息转化为代码
1. 转化流程
2. 我们如何开发代码的?
五、源码生成
1. 定位
六、组件向量搜索与嵌入
1. 组件信息录入
2. 组件向量搜索
3. 组件快速插入
七、未来展望
一
背景
二
生成链路一览

输入自然语言 结合大模型按照指定规则提取出相应搭建信息 搭建信息结合代码模板与AST输出前端代码
三
表达需求
图形化配置

AI直接生成代码
生成定制化:公司团队内部有自己的技术栈与重型通用组件,需要将这些知识进行预训练,目前对于长文本的预训练内容仅支持单次会话注入,token数消耗较高; 准确度:AI生成代码的准确度挑战是比较大的,加上预训练包含大段prompt,因为代码输出的内容细节过多,加上模型幻觉,目前来看业务代码的失败率是较高的,而准确度是考量辅助编码的核心指标,如果这一点无法解决,辅助编码效果将大打折扣; 生成内容残缺:由于GPT单次会话的存在限制,对于复杂需求,代码生成有一定几率被截断,影响生成成功率。
自然语言转指令
学习门槛低:因为自然语言本身就是人类的原生语言,你只需要根据你的想法描述页面即可,当然描述的内容是需要遵循一些规范的,但相对于图形化配置来说效率是有明显提升的; 复杂度黑盒:图形化配置的复杂度会随着配置页面复杂度的上升而上升,而这样的复杂度会一览无余地展示在用户面前,用户可能会迷失在复杂的配置页面交互中,配置成本逐步上升; 敏捷迭代:如果要在用户端新增一个页面配置功能,基于大模型的交互方式可能只需要新增几个prompt,但图形化配置需要开发复杂表单以便于快速输入。
生成的指令信息不也会出现大模型幻觉吗?如何保证每次生成指令信息是稳定且一致的呢?
由长文本转关键信息属于总结内容,大模型在总结场景下的准确度远高于扩散型场景; 由于指令信息只是提取需求中的关键信息,不需要做代码技术栈上的预训练,因此prompt存在很大的可优化空间,通过优化完善prompt内容可以有效提升输出准确度; 准确性可验证,对于每一个场景不同表述需求输入,可以通过单测预测输出验证准确性,当出现badCase,我们在优化后针对该badCase接入单测。保证准确度不断提高。

四
信息转化为代码
转化流程

我们如何开发代码的?
五
源码生成
定位

六
组件向量搜索与嵌入

组件信息录入

组件向量搜索

组件快速插入

七
未来展望
组件嵌入模板:目前组件已支持向量搜索,通过结合源码页面生成,支持动态匹配组件并嵌入模板; 存量代码的编辑生成:目前仅支持新增页面的源码生成,后续将支持存量页面的局部代码新增; 代码模板流水线:AST的代码操作工具化,将自然语言与代码写入进一步打通,提升场景拓展效率。