百度吴甜：今年是AI大模型落地关键年

发布时间：2022-05-27来源：未知编辑：生活头条

5月27 日消息，近日，百度飞桨文心全景图升级，在模型层，一次性发布10个大模型。此举让本就炙手可热的“AI大模型”话题再成为行业焦点。

此次文心发布的10个大模型包括2个行业大模型：文心联合国家电网研发的知识增强的能源行业NLP大模型“国网-百度·文心”、联合浦发银行研发的知识增强的金融行业NLP大模型“浦发-百度·文心”；以及文心基础大模型和任务大模型共8个，包括：融合任务相关知识的千亿大模型ERNIE 3.0 Zeus，多任务视觉表征学习VIMER-UFO 2.0、商品图文搜索表征学习VIMER-UMS、文档图像表征学习VIMER-StrucTexT 2.0，语音-语言跨模态大模型ERNIE-SAT、地理-语言跨模态大模型ERNIE-GeoL，以及面向生物计算领域的化合物表征学习HELIX-GEM和蛋白质结构分析HELIX-Fold。

百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示，AI大模型历经了前几年的探索期、突破期，现在已经一定程度上到达推广期，今年是大模型落地关键年。

AI大模型落地关键

吴甜认为，从应用落地角度来看，对于大模型落地而言，最关键要解决的问题是“前沿技术”与“真实应用场景”之间的鸿沟。怎么匹配上应用落地时候全方位的要求？这是AI大模型今年需要核心解决的问题。

“从百度多年来推进大模型技术角度来说，我们认为需要做好这三个方面的工作“，吴甜表示，”一是大模型本身需要是体系性的，而且这个大模型体系能够和应用的场景衔接上；二是平台、工具能够适配到落地应用所需要的工作和方法论。能够全流程、端到端的支持整个落地应用，把大模型的能力能够在场景当中发挥出来；三是需要有一个生态依托，包括应用生态、硬件生态的建设等等。综合来说，在‘搭建更适配场景需求的大模型体系，提供全流程支持应用落地的工具和方法，建设激发创新的开放生态’这三个方面需要拓展和开展工作。”

不是一个大模型通吃

百度的思路不是一个AI大模型通吃所有问题。飞桨文心大模型包含三类模型：基础大模型、任务大模型、行业大模型。

其中，以ERNIE为代表的基础大模型。基础大模型具有学习数据量大、参数规模大特点，通用性最高。但直接使用基础模型往往会与场景上苛刻的应用需求会有一定差距。

因此，在通用的基础大模型上，飞桨文心大模型增加了两类模型：任务大模型和行业大模型。

任务大模型主要面向特定任务，如NLP领域的信息抽取、对话、搜索等，以及视觉领域的商品图文搜索，多任务统一表征等；

再结合行业，推出行业大模型，由通用文心大模型作为基础，在海量广泛数据中挖掘行业领域数据，并与行业中的头部企业或机构合作引入行业特色数据与知识，让通用大模型充分学习，进一步提升大模型的行业应用能力，为行业头部企业建设对行业场景更适配的AI基础设施，共同推进大模型的深度应用。

吴甜称：“这三层模型的组合，使得文心大模型既有很强的基础大模型、又有面向任务问题的专有大模型、还有更适配行业场景的行业大模型，具有能够结合场景落地的全面模型能力。”

与此同时，为了能够把大模型的价值在应用场景中能够充分发挥，能够更低门槛支持广大使用者使用，文心大模型配套建设了工具和平台，包含对抗学习、小样本学习等多种精调方法、高性能部署方案，全面地提供大模型使用中需要的多种数据预处理工具，降低数据处理工作的门槛。

吴甜介绍，一方面文心在百度内部的各种产品中，已经得到广泛应用。比如搜索场景已经全面使用以文心ERNIE为基础的模型，为文心收获了大量反馈；另一方面，通过生态、百度智能云的业务，文心跟大量行业客户、合作伙伴持续合作，持续得到反馈，并进行优化。未来，文心大模型将持续降低应用门槛，推动产业智能化升级，让人工智能技术惠及每一个人。