来源:谈数据
全文共 9138 个字,建议阅读 10 分钟
本章深入浅出地分析了企业规模化落地生成式人工智能应用的流程,提出企业在引入生成式人工智能时可遵循“四步走”方法论。
引言
生成式人工智能在不同行业和领域引发大量讨论,与上一波由DeepMind AlphaGo引发的全球人工智能热潮不同,这次除了投资圈和大企业外,资源相对较少的中小型企业也能通过诸如ChatGPT和Microsoft 365 Copilot等工具为员工和客户赋能,快速提升生产力和服务效率,实现弯道超车。
传统AI在企业落地的一大难点是数据质量差,经常被戏谑为“garbage in,garbage out”,导致许多AI项目回报周期长甚至遥遥无期。很多企业在前期评估后的结论是:若要享受AI带来的各种成果,需要先对数据治理进行大量投入,或直接判定企业尚未具备实施AI的条件。
令人欣喜的是,最新的大语言模型(LLM)及图像生成等多模态大模型都已经涵盖了大量数据(如GPT4的训练数据集就达到13万亿token),这使企业无需对IT系统或数据清洗进行大量前期投入,即可借助GenAI达到既定目标。
当下,全球人工智能技术正以空前速度持续创新和迭代升级,麦肯锡相关研究和项目经验表明,企业在考虑引入生成式人工智能时应以速度为先,遵循“四步走”方法论,高效实现生成式人工智能部署和规模化应用。
第一步:构建生成式人工智能“内、外、快、慢”四大战略
企业在制定生成式人工智能实施战略时,应同时兼顾外部因素(如市场、股东等)和企业内部因素。就外部因素而言,企业应从自身战略出发,站在宏观高度思考生成式人工智能对行业生态的影响,包括但不限于直接竞争对手、上下游价值链转型等。例如,某全球领先GPU厂商股价从去年10月至今暴涨逾110%,使价值链上下游企业的估值也得到明显提升。此外,企业在制定相关战略时,应一并考虑与股东、投资者沟通时的话术和投资故事。
就内部因素而言,建议企业不能仅关注自动化对成本效能等方面的提升,更重要的是考虑如何借助生成式人工智能重塑企业运营及文化(如鼓励创新等),并利用相关技术赋能企业人才。例如对软件开发供应商而言,生成式人工智能带来的自动化代码编程能力可节约30%以上的人力资源(见图1),且在减省成本以外,还能提升现有系统的开发功能,实现产品快速迭代并优化用户体验,加速淘汰未能适应新技术趋势的竞争对手。
在充分考虑对内、对外战略的基础上,企业应该同时制定“快、慢”两个实施赛道。所谓“慢赛道”是指生成式人工智能端到端的体系化转型,企业应对所有生成式人工智能战略选项进行快速梳理和全景扫描,并将其分为解决现有业务痛点(防守)以及驱动增长和新业务发展(进攻)两大类型,然后再根据所处行业特点、企业禀赋和供需分析,构建起最适合自身发展的生成式人工智能战略。
同时,企业应兼顾“快赛道”的速赢举措,通过快速实现价值为企业高层提供“定心丸”,与慢赛道相辅相成。企业应尽快识别适合自身行业和定位的生成式人工智能用例,重点是要通过用例或POC试点,短期内确定企业内部推动变革和生成式人工智能落地的人才,以及外部技术合作方(如软件厂商、咨询公司、技术提供商、学术机构等)。企业应积极推动与同业、异业生态圈的各类合作,借力打力,充分把握算法升级迭代带来的重要机遇。
在试点成功落地并得到初步反馈后,企业应持续调整和完善现有生成式人工智能战略,以动态适应不断变化的技术和市场趋势。
第二步:基于负责任的A I,制定转型路径图,聚焦用例“先动起来”
确立初版生成式人工智能战略后,企业应在“负责任的AI(Responsible AI)”框架下,快速制定初版用例图谱和转型路径图。
(一)负责任的AI(Responsible AI,简称RAI)
负责任的AI是一个整体治理框架,尽管如何运用AI技术属于企业内部经营决策,但鉴于AI自动化执行和智能决策有可能对法律法规、社会伦理、产品和运营安全性产生巨大而深远的影响,企业(特别是金融业)在部署AI前应充分考虑各方面因素,并制定相应的RAI框架,为可能出现的AI风险提前准备预案和应对措施。
目前在全球范围内,RAI并没有统一标准,企业需要按自身战略和实际情况制定最适合的RAI框架,我们认为框架中至少应该包括:
明确AI模型“不适用”的场景,例如欧盟通过的《人工智能法案》对AI在招聘、绩效评估等方面的应用设有限制; 明确AI模型在透明度、可追踪性、公平性和稳定性等方面的要求;
明确AI模型“不适用”的场景,例如欧盟通过的《人工智能法案》对AI在招聘、绩效评估等方面的应用设有限制; 明确AI模型在透明度、可追踪性、公平性和稳定性等方面的要求; 明确AI用例在投产前所必需通过的基础测试和审批流程; 明确AI模型和应用在保护个人及企业数据隐私安全方面的具体要求。
全球各大AI厂商都制定了适合企业自身情况的RAI框架,以微软为例,其对于“负责任的AI”的定义包括六大要素:公平性、可靠性和安全性、隐私和安全、包容性、透明度、问责。
此外,合规性和可靠性也是负责任的AI框架的重要内涵。例如,中国生成式人工智能服务管理办法强调AI模型生成的内容合规性。而在美国NISTAI风险框架和欧洲AI法案提到内容可靠性。
(二)用例图谱和转型路径图
就制定用例图谱而言,企业应首先明确需要优先进行生成式人工智能部署的业务领域,为各业务分别设计用例,并形成生成式人工智能整体转型路径图。具体而言,主要包括以下七大方面:
首先,为了将一个概念或者想法转变成实际行动,转型团队需要得到高管和业务负责人的承诺。这就涉及到对业务领域的定义,以及明确谁是关键利益相关者。团队应该在获得高层的充分承诺和支持后,再着手推进下一步行动。
接下来,团队需要明确大模型用例的主要目标。这一步骤可能涉及自然语言处理的相关任务(如生成摘要或分类信息、处理某些特定场景等),其主要目的是厘清大模型将用于哪些领域以及可能产生的效果。
然后,就是明确如何实现这一目标,即确定技术方案。这包括大模型从哪里获取数据、这些数据具体包括什么内容以及如何安全有效管理相关数据等。企业在这个阶段需要考虑的因素很多,包括数据安全性和风险管理等。
第四步是确定用例优先级。这涉及评估用例潜在效果(如收入、成本节约、客户体验等),并根据评估结果确定每个用例的优先级。此外,企业需要将用户需求和数据敏感性等因素一并纳入考量。
一旦确定了上述内容,就可以开始设计和实施用例了。在设计过程中,企业应确保所选择的用例符合企业自身使命、道德规范和整体业务战略,以确保企业在整个实施过程中角色定位明确,以及所选择的基础架构能够真正满足企业的实际需求。
在此基础上,企业可进一步设计具体用户界面和体验。根据用户在不同业务上的需求,输出形式可以多样化,如用户界面、用户交互、看板、驾驶舱、商业智能报告等。同时,企业需要建立一个高效评价机制,持续评估和优化模型输出。
最后,就是制定转型路线图。企业应根据前期战略和用例图谱,制定出详细计划,明确每个阶段的工作内容、时间节点和责任主体,以保证企业在推进转型过程中,始终保持清晰目标和方向,避免出现混乱。
第三步:评估用例试点成效,优化整体落地蓝图和路线图
在快速形成初版GenAI转型路径图及用例图谱后,企业需要根据用例的重要性与潜在效益进行优先级排序,以“先动起来”的方式逐步推进试点工作,为全公司规模化应用打下夯实基础。对于初次实施AI技术的企业,我们建议应从概念验证(Proof of Concept)试点开始,逐步开展工作。
在实施试点前,为了评估某个用例的优势和弱点,企业可基于两个维度快速分析:潜在成效和可行性。潜在成效主要考察用例在创造业务价值方面的能力,此外企业还需要考虑单个用例在不同部门间的可扩展性,即这个用例能否应用于多个场景和部门。最后,企业还需要评估具体用例对人才、组织、业务流程和合作伙伴的价值,以了解其对整个企业生态的影响。
在可行性方面,企业需要评估具体用例的实施潜力,即在实际操作中能否成功执行。此外,企业还需要考虑落地的复杂程度,即实施这个用例需要花费多大的精力,同时估算实施用例所需要的实际工作量,以及可能遇到的内外部阻碍等。我们建议企业可以选取潜在成效和可行性较高的2-3个用例进行POC试点。
概念验证(POC)试点
在实际操作过程中,企业可从以下三个方面着手落地POC试点,具体包括:基础模型选择、行业模型选择以及场景解决方案设计(见图2)。
1、基础模型选择:基于现有大模型或自研大模型进行开发
在基础模型方面,企业有两种选择:一是基于现有大型人工智能模型开发应用,二是从头开始研发自身模型,具体如何选择取决于企业的实际需求和资源。
使用现有大模型是一个经济、高效且实用的方式,企业可以将预先训练好的大模型转化为各种应用。这些模型主要分开源和闭源两种类型,开源模型可以在开发者社区中找到,可根据企业需求定制化开发;闭源商业模型则由人工智能模型厂商开发,按照企业具体用途和使用量收费。在海外与国产商业模型选择上,企业可以根据自身情况选择使用海外领先大模型接口或国内开发的大模型接口。
选择自行研发大模型的企业,需要拥有强大的大模型开发技术能力,并仔细评估投入和回报是否符合预期。开发自研大模型往往需要投入海量数据与高昂资金,例如 OpenAI仅训练GPT-3就花费了约400万-1,200万美元,其在规模更大的GPT-4上的投入则可能高达数千万至上亿美元。
2、行业模型微调:针对不同大模型进行微调
企业在开发生成式人工智能应用时,往往需要嵌入所处行业的特定场景,现有通用大模型并不能完全满足其专业化需求。因此,通常做法是在通用大模型的基础上进行微调(fine-tune),以得到更适合垂域场景的行业基础模型。
一般来说,行业大模型主要有以下两个优势:一是技术门槛相对较低。尽管基础模型的训练需要海量数据,成本高且耗时,但在通用模型基础上进行微调则只需要较少的数据,成本相对更低,而且可以在较短时间内完成,从而大幅降低了进入门槛。通过加入额外的行业数据或按需调整模型参数,企业就能为特定应用场景生成所需内容。另一方面,这种技术具有很强实用性。企业可以利用相对可控的计算资源,结合行业现状和相关数据,训练出符合自身需求的模型。
行业模型微调包括多种部署和训练形式,允许企业根据实际需要选择。例如企业可采取“调用+微调”方式,尽管这种方式需要输入更多客户数据,但可以最大程度满足定制化和安全性方面的要求,使企业更好应对不断变化的市场环境。
3、场景解决方案设计:集成现有系统和功能,提供基于场景的客制化解决方案
在这一环节,企业首要任务是根据具体使用环境进行流程设计,这对后续解决方案的成功执行至关重要。以银行为例,为了满足各种合规要求,一种可能的解决方案是选择本地私有化部署,意味着银行需要把所有数据和计算资源都保存在本地,以确保客户数据隐私和安全。因此,在设计流程时,企业需考虑如何让各种业务流程与本地私有化部署结合,在合规和业务需求间找到平衡。
接下来,企业需要考虑的是与相关系统的集成。仍以银行为例,为实现由AI大模型驱动的业务流程自动化和智能化,企业需要通过API集成CRM、营销系统、商业智能系统等。只有这样,客户关系管理、营销策略以及商业数据分析等重要功能才能与核心业务流程无缝连接,为银行业务运营提供全面支持。
另外,由于AI大模型训练和系统集成需要大量资源,因此在设计解决方案过程中,成本效益和投资回报率(ROI)是企业需要特别关注的要点。企业在设计过程中,不仅要关注技术层面的实施,还需要充分考虑到成本效益和投资回报率,以确保解决方案具有实际应用价值。这就需要企业进行详细的成本分析,同时优化资源使用效率,以确保解决方案能顺利落地。
第四步:规模化推广生成式人工智能,需要企业进行全方位的运营模式转型,并将A I内嵌到业务的每个环节
(一)规模化实施生成式人工智能应用的六大要素
在规模化实施生成式人工智能应用时,一个成功的运营模式应涵盖六大方面(见图3):战略路线图、人才、运营模式、技术、数据以及技术应用与变革管理。
首先,领导层和员工的理解和接受度至关重要。企业想要把人工智能深度融入日常运营中,就需要通过培训和沟通来提高员工对新技术的理解和接受度。当员工能够充分利用人工智能的优势时,团队工作效率和质量将得到全面提升。
此外,企业还需要建立一支专门的人工智能专家团队,并通过持续培训提升员工能力,使所有员工都能将人工智能工具应用到日常工作中,这意味着企业需要在组织、人才等方面进行投入和改变。
在运营模式上,企业需要将人工智能融入现有业务流程,并根据新技术带来的影响,重塑业务流程,这可能会涉及资源分配和考核体系优化。同时,企业需要构建强大的技术能力,以满足部署人工智能大模型的各种要求(如端到端基础技术能力、模型运维能力等)。
数据也是企业实施人工智能应用时必须考虑的重要因素。企业需要建立高效存储和处理大量复杂数据的技术能力,同时还需要培养员工将内部数据与人工智能相结合的技能,以提升GenAI应用落地的实际效能。
在运营模式上,企业需要将人工智能融入现有业务流程,并根据新技术带来的影响,重塑业务流程,这可能会涉及资源分配和考核体系优化。同时,企业需要构建强大的技术能力,以满足部署人工智能大模型的各种要求(如端到端基础技术能力、模型运维能力等)。
数据也是企业实施人工智能应用时必须考虑的重要因素。企业需要建立高效存储和处理大量复杂数据的技术能力,同时还需要培养员工将内部数据与人工智能相结合的技能,以提升GenAI应用落地的实际效能。
最后,为了确保人工智能解决方案顺利落地,并有效管理转型进程和风险,企业需要全面启动变革管理,以更好支持大规模技术能力建设和文化变革,帮助内部员工逐渐适应新的运营环境。
接下来,我们将围绕人才、运营模式、技术、数据、技术应用与变革管理展开分析,战略路线图由于已在上文中体现,故不再重复叙述。
1、组织人才:设立专门的生成式人工智能专家团队或部门,以开展持续的能力建设和培训
转型重点:企业在引入生成式人工智能技术时,需要建立一支专门团队或部门,推动新技术研发、应用和推广。相关团队需要深入研究生成式人工智能技术的最新发展,确保所部属的应用与企业需求高度契合。同时,团队成员应具备丰富行业经验和强大技术实力,只有这样才能更深入理解企业需求,并针对行业实际情况提供定制化的GenAI解决方案。
其中,团队成员的技术实力(尤其是在应对技术挑战和需求变化方面的能力),对企业而言至关重要。他们需要具备一系列复杂技能,例如熟练运用提示词工程(Prompt engineering)技术,掌握如何优化和部署生成式人工智能模型,同时还需要熟悉多种深度学习和生成式人工智能框架(如TensorFlow、PyTorch等),以及Llama-index等应用开发框架。此外,诸如高性能计算、分布式计算和大数据处理等技能也是必需的。
针对GenAI带来的技术变革,企业应当投入资源提升关键岗位的技能,帮助员工掌握GenAI相关技能及工具运用,以提升生产效率和工作满意度。
全球生成式人工智能技术的快速发展,促使企业从上到下、从生成式人工智能专职团队成员到每名员工都必须持续学习,因此企业需要主动提供足够的培训和交流机会,帮助生成式人工智能团队跟上技术发展步伐,同时培训普通员工获得相关技能,为进一步扩展生成式人工智能用例的应用范围打下坚实基础。部分大型企业甚至可以考虑打造内部的AI人才学院,为不同岗位的员工提供定制化课程和培养计划,以充分挖掘内部人才的潜力。
潜在阻碍:精通基础模型、生成式人工智能技术并且熟悉业务的复合型人才数量有限,例如同时具备生成式AI中间件和应用开发经验的人才在市场上极少。
2、运营模式:将生成式人工智能融入现有业务流程,并根据生成式人工智能的应用效果进行流程重塑,并优化配套资源分配和考核体系
转型重点:大部分企业在生成式人工智能应用上采用平台运营模式,即在现有基础设施上构建及整合生成式人工智能能力,快速和规模化应用生成式人工智能。这就需要创建一个跨职能的生成式人工智能中央平台团队,负责微调和维护企业生成式人工智能模型及平台能力,根据业务需要向各团队提供经过审核的模型能力,并且通过标准化管理防范风险。
在转型过程中,企业首要任务是基于前期规划的生成式人工智能用例,设计和推行新业务模式,这涉及到重新审视和调整业务流程及组织架构,以确保充分发挥生成式人工智能技术优势。企业可根据生成式人工智能技术的潜在效益,在关键业务领域对现有流程和职能全面革新,明确岗位角色和职责,以适应生成式人工智能技术的快速发展。
在这一过程中,优化资源配置和调整考核体系同样重要。企业应根据生成式人工智能用例实施优先级合理分配资源,这可能涉及将资源分配到不同部门和项目,并根据实际情况进行调整。此外,为了鼓励员工积极参与新技术推广和应用,企业需要优化内部绩效指标和考核体系。
潜在阻碍:当企业尝试对传统运营模式进行革新,或者因实施自动化技术而缩减人员规模时,可能会严重打击士气,并在各层级和部门中产生巨大阻力。因此,企业应积极管理和应对内部阻力,确保转型顺利推行。
3、技术栈:组建强大且能满足生成式人工智能大模型部署的现代技术栈,包括搭建端到端的生成式人工智能技术能力及模型运维能力
转型重点:生成式人工智能大模型的核心技术栈包括多模态大模型、数据库、MLOps工具、计算硬件等关键组成部分(见图4),企业在转型过程中应重点关注以下三个子模块:
首先是多模态大模型,包括通用基础模型、适用于特定领域的行业模型以及解决特定问题的专有模型。
其次,是存储和访问基础模型的数据库,它们包括大模型专用的矢量数据库(如某向量相似性搜索引擎,和某云原生开源向量数据库)、非结构化数据库(如某基于分布式文件存储的开源数据库系统和专门用于存储和导航关系的图数据库)以及结构化数据库(如SQL、Oracle等传统关系型数据库,及Hive等分布式数据库)。
最后,企业还需要专门的MLOps工具和技术来微调基础模型,并将其部署到应用中。上述MLOps工具和技术主要包括:分布式训练加速框架(如某开源深度学习训练优化库等)、大模型微调技术(如LoRA、P-tuning等)、生成式人工智能通用模型框架(如PyTorch、TensorFlow等)以及模型部署工具(如Ray Studio、NVIDIA NeMo等)。此外,企业还需要各种应用开发工具(如LangChain、Llama-index等)以及端到端模型管理平台(如H20 LLM Studio、MLFlow等)。
潜在阻碍:企业可能因为各种原因,不能获得所需的基础架构(例如云)和工具/API(如某全球顶尖的AI研究实验室和某企业级GenAI平台独角兽等)。此外,由于大模型私有化部署成本极高,成本和产出比也是需要考虑的因素之一。总而言之,企业需要充分评估所有潜在问题,并根据自身情况寻找合适的解决方案。
4、数据能力:为全面支撑生成式人工智能应用,企业应建立高效存储、访问和处理海量多模态数据的能力,并打造自身数据护城河
转型重点:对于企业来说,数据中台的架构和设计非常重要。首先,企业需要一个能够处理大量数据的系统,不仅要存储海量数据,还要进行高速读写操作以及数据清洗和转换等。在引入新技术应用时,该系统应具备高效处理非常规数据、存储文本向量信息的能力,这是非常关键的一环。
此外,数据治理体系的设计与实施也是不可或缺的一部分。企业需要一个治理体系来全面管理、控制和保护数据,确保数据完整性、准确性、一致性和安全性。具体来说,数据分类、数据质量管理、数据安全和隐私保护,以及数据备份和恢复等都是该体系的重要组成部分。
同时,数据伦理、安全和隐私问题也不能忽视。企业需要遵循道德规范,公正和透明地使用数据,并确保数据保密性和完整性。这需要企业主动采取一些必要措施,如数据加密、访问控制、身份验证和数据备份等。
另一方面,企业需要统一管理和维护核心数据资产,以确保数据一致性、准确性和完整性,这对企业决策和分析至关重要。同时,全面管理和利用数据资产,也是确保数据资产价值和实用性的重要手段。
在当前大模型算法和应用快速发展的背景下,专有、特色和高质量数据变得越来越重要。因此,企业在构建完善的数据基础设施的基础上,还需要持续收集、存储和管理高质量的结构化/非结构化数据资产。
潜在阻碍:企业可能会遇到诸如难以获取高质量的非结构化数据(如图像、PDF报告等)、国内企业数据出境和上云的安全问题,以及与消费者数据(如客户交易数据)相关的知识产权和隐私安全等问题,对此企业需要积极寻求解决办法。
5、技术应用与变革管理:为确保生成式人工智能解决方案全面落地、持续监督转型进程和管控风险,企业需全面启动变革管理,以支持大规模技术能力建设和文化变革
转型重点:企业需要制定中长期计划,并持续培训,帮助员工理解并掌握新技术,提升工作效率和质量。这不仅涉及到员工技能提升,更是一场深刻的内部文化变革。
与此同时,理解和管控新技术的潜在风险同样重要。企业需要制定行之有效的应对策略,建立完备的风险管理机制,以确保在新技术应用过程中及时应对各种潜在风险和挑战。
对于新技术运用,企业还需进行严格审计,确保其符合道德和法律规定。在审计过程中,一旦发现问题,必须及时整改,以确保企业技术实践合规、可持续。其次,建立良好沟通渠道和反馈机制。及时了解员工对新技术的反馈和建议,帮助企业持续优化和改进新技术应用,从而更好推广新技术。最后,构建一个开放生态系统,让企业更好利用内外部人才、技术和合作伙伴,持续创新和发展。通过与合作伙伴共同研发和推广新技术,企业可实现产业链协同发展,从而提升自身竞争力。
潜在阻碍:整个组织对新技术的理解可能还不够透彻,领导团队可能对新技术信心不足和支持不够,这些都需要企业认真对待并着手解决。
(二)落地生成式人工智能应用的布局路线:开发POC应用、自研行业大模型
在该路线下,企业借助基础LLM模型和各种辅助工具(如直接调用头部科技厂商的应用程序开发托管平台和人工智能开发平台的API),开发基于特定场景的自然语言交互应用,以解决实际问题并提升效率体验。这类应用往往先从1-2个业务领域的POC试点开始,例如营销客服机器人、个人办公助理和虚拟秘书(Copilot)、IT代码开发和运维助理等,进而实现全面推广和流程重塑。
典型案例包括某全球领先的客户关系管理(CRM)软件厂商发布的GPT产品,可以自动执行销售任务(例如自动发送电子邮件、安排会议、下发销售线索等),并自动总结笔记和沟通过程中的关键要点;某领先生成式人工智能应用企业主要帮助企业和个人用户写营销文案和AI绘画,使用生成式人工智能生成文本和图像内容,通过自然语言应用在各种渠道(如社交媒体、广告、博客文章、电子邮件、网站等)进行数字化营销推广,并集成了SEO功能。